Por Caroline
Delbert, 3 de Junho de 2021
Isso inclui uma grande parte dos 8% ausentes do primeiro “rascunho” do genoma.
Duas tecnologias
de inicialização concorrentes ajudaram a alimentar as partes
recém-sequenciadas.
Vinte e um anos
atrás, os pesquisadores anunciaram o primeiro “esboço” de sequenciamento do
genoma humano completo. Foi uma conquista monumental, mas a sequência ainda
faltava cerca de 8% do genoma. Agora, cientistas trabalhando juntos em todo o
mundo dizem que finalmente preencheram aqueles reclusos 8 por cento.
Se o seu
trabalho mantém-se a revisão por pares e não é que eles realmente fizeram
sequência e montar o genoma humano em sua totalidade, lacunas e tudo, ele
poderia mudar o futuro da medicina.
O que há em um genoma?
Sequenciar o
genoma humano tem sido um grande projeto com objetivos valiosos. Por quê?
Porque, à medida que os humanos entendem melhor seu código genético, eles podem
fazer medicamentos melhores e mais personalizados, por exemplo - incluindo o
tipo de medicamento centrado no gene que alimentou as primeiras vacinas
eficazes da COVID-19.
Os humanos têm
46 cromossomos, em 23 pares que representam dezenas de milhares de genes
individuais. Cada gene consiste em um certo número de pares de bases feitos de adenina
(A), timina (T), guanina (G) e citosina (C). Existem bilhões de pares de bases
no genoma humano.
Em junho de
2000, o Projeto Genoma Humano (HGP) e a empresa privada Celera Genomics
anunciaram aquele primeiro “esboço” do genoma humano. Esse foi o resultado de
anos de trabalho que aceleraram o ritmo à medida que os humanos continuavam a
fazer computadores e algoritmos melhores para processar o genoma. Na época, os
cientistas ficaram surpresos com o fato de que, das mais de 3 bilhões de
“letras” individuais de pares de bases, eles estimaram que os humanos têm
apenas 30.000 a 35.000 genes. Hoje, esse número é muito menor, pairando um
pouco acima de 20.000.
Três anos
depois, o HGP completou sua missão de mapear todo o genoma humano e definiu
seus termos desta forma :
“'Sequência
finalizada' é um termo técnico que significa que a sequência é altamente
precisa (com menos de um erro por 10.000 letras) e altamente contígua (com as
únicas lacunas restantes correspondendo a regiões cuja sequência não pode ser
resolvida de forma confiável com a tecnologia atual).”
A “tecnologia
atual” está fazendo muito trabalho pesado aqui. Na época, o HGP usava um
processo chamado cromossomo bacteriano artificial (BAC), onde os cientistas
usavam uma bactéria para clonar cada pedaço do genoma e depois estudá-los em
grupos menores. Uma “biblioteca BAC” completa é de 20.000 bactérias
cuidadosamente preparadas com genes clonados dentro.
Mas esse
processo BAC perde inerentemente algumas partes de todo o genoma. O motivo é
uma grande pista para o que a nova equipe de cientistas ajudou a realizar.
Um avanço
no sequenciamento
O que se esconde
nos secretos 8% do genoma que o “rascunho” de 2000 do genoma deixou intocado?
Os pares de bases nesta seção são feitos de muitos, muitos padrões repetidos
que dificultam o estudo usando o método de clonagem de bactérias.
BAC e outras
abordagens simplesmente não eram adequadas para os 8% restantes do genoma, com
muitas repetições. “Os atuais sequenciadores de DNA robustos, feitos pela
Illumina, pegam pequenos fragmentos de DNA, decodificam-os e remontam o
quebra-cabeça resultante”, relata Matthew Herper de Stat."Isso
funciona bem para a maior parte do genoma, mas não em áreas onde o código de
DNA é o resultado de longos padrões repetidos.”
Isso faz sentido
intuitivamente; imagine contar de 1 a 50 versus simplesmente contar 1, 2, 1,
2...uma e outra vez. Parte do que tornou o método BAC bem-sucedido é que os
cientistas tiveram o cuidado de minimizar e combinar as sobreposições, que se
tornaram quase impossíveis na porção inexplorada do genoma com muitas
repetições.
Então, o que há
de diferente nas novas abordagens? Vejamos primeiro o que são. A Pacific
Biosciences (PacBio), sediada na Califórnia, e a Oxford Nanopore, sediada no
Reino Unido, têm tecnologias diferentes, mas estão correndo em direção ao mesmo
objetivo.
Tecnologia proprietária de sequenciamento de genes da PacBio
O PacBio usa um
sistema chamado HiFi, onde os pares de bases circulam, literalmente como
círculos, até serem lidos por completo e em alta fidelidade - daí o nome. O
sistema data de apenas alguns anos atrás e representa um grande passo à frente
em comprimento e precisão para essas sequências mais longas.
Oxford Nanopore,
por sua vez, usa corrente elétrica em seus dispositivos proprietários. Fios de
pares de bases são pressionados através de um nanoporo microscópico - apenas
uma molécula de cada vez - onde uma corrente os empurra para observar que tipo
de molécula eles são. Ao zapear cada molécula, os cientistas podem identificar
a fita completa.
No novo estudo publicado no servidor de
pré-impressão de biologia bioRxiv, um consórcio internacional de cerca de 100
cientistas usou as tecnologias PacBio e Oxford Nanopore para perseguir algumas
das seções desconhecidas restantes do genoma humano.
A quantidade de terreno coberto pelo consórcio é
impressionante. “O consórcio disse
que aumentou o número de bases de DNA de 2,92 bilhões para 3,05 bilhões, um
aumento de 4,5 [por cento]. Mas a contagem de genes aumentou apenas 0,4
[por cento], para 19.969”, relata Stat. Isso mostra o
quão grande são as sequências de pares de bases de repetição intensa nesta
zona, em comparação com os genes que representam.
The Missing Links
O padrinho do sequenciamento George Church,
biólogo da Universidade de Harvard, disse a Stat que se este trabalho passar por
revisão por pares com sucesso, será a primeira vez que o genoma de um vertebrado
será totalmente mapeado. E a razão parece ser simplesmente que ambas as
novas tecnologias permitem que cadeias muito longas de pares de bases sejam
lidas de uma só vez.
Por que a informação do gene ausente é tão importante? Bem,
o estudo dos genes experimenta muito favoritismo, com um punhado dos genes mais
populares assumindo a maior parte do interesse de pesquisa e
financiamento. Os genes negligenciados contêm muitos mecanismos-chave que
causam doenças, por exemplo.
Há um pequeno obstáculo, embora também tenha sido um
obstáculo para o anúncio de 2000 do primeiro esboço do genoma. Ambos os
projetos estudaram células que tinham apenas 23 cromossomos em vez dos 46
completos. Isso porque eles usam células derivadas do sistema reprodutivo, onde
óvulos e espermatozoides carregam uma metade de uma carga cromossômica completa.
A célula é de uma mola hidatiforme, um tipo de
crescimento reprodutivo que representa uma união extremamente precoce e
inviável entre um espermatozoide e um óvulo sem núcleo. A escolha desse
tipo de célula, que foi mantida e cultivada como uma “linha celular” usada para fins de pesquisa, cortar pela metade o
enorme trabalho de sequenciamento.
A próxima etapa é que o estudo apareça em uma publicação revisada por pares. Depois disso, porém, PacBio e Oxford buscam sequenciar todo o genoma humano de 46 cromossomos. Mas podemos esperar um pouco.