sábado, 5 de junho de 2021

Cientistas dizem que finalmente sequenciaram todo o genoma humano. Sim, tudo isso.

Por Caroline Delbert, 3 de Junho de 2021


Isso inclui uma grande parte dos 8% ausentes do primeiro “rascunho” do genoma.

Duas tecnologias de inicialização concorrentes ajudaram a alimentar as partes recém-sequenciadas.

Vinte e um anos atrás, os pesquisadores anunciaram o primeiro “esboço” de sequenciamento do genoma humano completo. Foi uma conquista monumental, mas a sequência ainda faltava cerca de 8% do genoma. Agora, cientistas trabalhando juntos em todo o mundo dizem que finalmente preencheram aqueles reclusos 8 por cento.

Se o seu trabalho mantém-se a revisão por pares e não é que eles realmente fizeram sequência e montar o genoma humano em sua totalidade, lacunas e tudo, ele poderia mudar o futuro da medicina.

 

O que há em um genoma?

 


Sequenciar o genoma humano tem sido um grande projeto com objetivos valiosos. Por quê? Porque, à medida que os humanos entendem melhor seu código genético, eles podem fazer medicamentos melhores e mais personalizados, por exemplo - incluindo o tipo de medicamento centrado no gene que alimentou as primeiras vacinas eficazes da COVID-19.

Os humanos têm 46 cromossomos, em 23 pares que representam dezenas de milhares de genes individuais. Cada gene consiste em um certo número de pares de bases feitos de adenina (A), timina (T), guanina (G) e citosina (C). Existem bilhões de pares de bases no genoma humano.

Em junho de 2000, o Projeto Genoma Humano (HGP) e a empresa privada Celera Genomics anunciaram aquele primeiro “esboço” do genoma humano. Esse foi o resultado de anos de trabalho que aceleraram o ritmo à medida que os humanos continuavam a fazer computadores e algoritmos melhores para processar o genoma. Na época, os cientistas ficaram surpresos com o fato de que, das mais de 3 bilhões de “letras” individuais de pares de bases, eles estimaram que os humanos têm apenas 30.000 a 35.000 genes. Hoje, esse número é muito menor, pairando um pouco acima de 20.000.

Três anos depois, o HGP completou sua missão de mapear todo o genoma humano e definiu seus termos desta forma :

“'Sequência finalizada' é um termo técnico que significa que a sequência é altamente precisa (com menos de um erro por 10.000 letras) e altamente contígua (com as únicas lacunas restantes correspondendo a regiões cuja sequência não pode ser resolvida de forma confiável com a tecnologia atual).”

A “tecnologia atual” está fazendo muito trabalho pesado aqui. Na época, o HGP usava um processo chamado cromossomo bacteriano artificial (BAC), onde os cientistas usavam uma bactéria para clonar cada pedaço do genoma e depois estudá-los em grupos menores. Uma “biblioteca BAC” completa é de 20.000 bactérias cuidadosamente preparadas com genes clonados dentro.

Mas esse processo BAC perde inerentemente algumas partes de todo o genoma. O motivo é uma grande pista para o que a nova equipe de cientistas ajudou a realizar.

 

Um avanço no sequenciamento

 


O que se esconde nos secretos 8% do genoma que o “rascunho” de 2000 do genoma deixou intocado? Os pares de bases nesta seção são feitos de muitos, muitos padrões repetidos que dificultam o estudo usando o método de clonagem de bactérias.

BAC e outras abordagens simplesmente não eram adequadas para os 8% restantes do genoma, com muitas repetições. “Os atuais sequenciadores de DNA robustos, feitos pela Illumina, pegam pequenos fragmentos de DNA, decodificam-os e remontam o quebra-cabeça resultante”, relata Matthew Herper de Stat."Isso funciona bem para a maior parte do genoma, mas não em áreas onde o código de DNA é o resultado de longos padrões repetidos.”

Isso faz sentido intuitivamente; imagine contar de 1 a 50 versus simplesmente contar 1, 2, 1, 2...uma e outra vez. Parte do que tornou o método BAC bem-sucedido é que os cientistas tiveram o cuidado de minimizar e combinar as sobreposições, que se tornaram quase impossíveis na porção inexplorada do genoma com muitas repetições.

Então, o que há de diferente nas novas abordagens? Vejamos primeiro o que são. A Pacific Biosciences (PacBio), sediada na Califórnia, e a Oxford Nanopore, sediada no Reino Unido, têm tecnologias diferentes, mas estão correndo em direção ao mesmo objetivo.

 

Tecnologia proprietária de sequenciamento de genes da PacBio

O PacBio usa um sistema chamado HiFi, onde os pares de bases circulam, literalmente como círculos, até serem lidos por completo e em alta fidelidade - daí o nome. O sistema data de apenas alguns anos atrás e representa um grande passo à frente em comprimento e precisão para essas sequências mais longas.

Oxford Nanopore, por sua vez, usa corrente elétrica em seus dispositivos proprietários. Fios de pares de bases são pressionados através de um nanoporo microscópico - apenas uma molécula de cada vez - onde uma corrente os empurra para observar que tipo de molécula eles são. Ao zapear cada molécula, os cientistas podem identificar a fita completa.

No novo estudo publicado no servidor de pré-impressão de biologia bioRxiv, um consórcio internacional de cerca de 100 cientistas usou as tecnologias PacBio e Oxford Nanopore para perseguir algumas das seções desconhecidas restantes do genoma humano.

A quantidade de terreno coberto pelo consórcio é impressionante. “O consórcio disse que aumentou o número de bases de DNA de 2,92 bilhões para 3,05 bilhões, um aumento de 4,5 [por cento]. Mas a contagem de genes aumentou apenas 0,4 [por cento], para 19.969”, relata Stat. Isso mostra o quão grande são as sequências de pares de bases de repetição intensa nesta zona, em comparação com os genes que representam.

 

The Missing Links

O padrinho do sequenciamento George Church, biólogo da Universidade de Harvard, disse a Stat que se este trabalho passar por revisão por pares com sucesso, será a primeira vez que o genoma de um vertebrado será totalmente mapeado. E a razão parece ser simplesmente que ambas as novas tecnologias permitem que cadeias muito longas de pares de bases sejam lidas de uma só vez.

Por que a informação do gene ausente é tão importante? Bem, o estudo dos genes experimenta muito favoritismo, com um punhado dos genes mais populares assumindo a maior parte do interesse de pesquisa e financiamento. Os genes negligenciados contêm muitos mecanismos-chave que causam doenças, por exemplo.

Há um pequeno obstáculo, embora também tenha sido um obstáculo para o anúncio de 2000 do primeiro esboço do genoma. Ambos os projetos estudaram células que tinham apenas 23 cromossomos em vez dos 46 completos. Isso porque eles usam células derivadas do sistema reprodutivo, onde óvulos e espermatozoides carregam uma metade de uma carga cromossômica completa.

A célula é de uma mola hidatiforme, um tipo de crescimento reprodutivo que representa uma união extremamente precoce e inviável entre um espermatozoide e um óvulo sem núcleo. A escolha desse tipo de célula, que foi mantida e cultivada como uma “linha celular” usada para fins de pesquisa, cortar pela metade o enorme trabalho de sequenciamento.

A próxima etapa é que o estudo apareça em uma publicação revisada por pares. Depois disso, porém, PacBio e Oxford buscam sequenciar todo o genoma humano de 46 cromossomos. Mas podemos esperar um pouco.