A primeira abordagem para sequenciar o genoma humano data de 2000, mas desde então cerca de 8% do código genético permanecia desconhecido devido às limitações da tecnologia de sequenciação. Agora, uma equipa internacional organizada por Karen Miga e Adam Philippy anuncia ter conseguido fazer a sequência completa e sem qualquer falha, num trabalho publicado na revista Science.
O novo genoma de referência, o T2T-CHM13, adiciona quase 200 milhões de pares de base, incluindo 99 genes que provavelmente codificam proteínas e mais 2000 genes candidatos que requerem estudos posteriores. A nova versão corrige ainda milhares de erros estruturais detetados nas versões anteriores, explica o EurekAlert. O trabalho agora publicado revela duplicações segmentais de que não se tinha conhecimento, longas cadeias de ADN que são duplicadas no genoma e que se sabe agora terem papel importante na evolução e na doença. Miga afirma que “estas partes do genoma que não conseguimos estudar durante mais de 20 anos são importantes para o nosso entendimento sobre como o genoma funciona, doenças genéticas, diversidade e evolução”.
David Haussler, diretor do UC Santa Cruz Genomics Institute, sublinha que “já temos um enorme entendimento da biologia humana e das doenças ao conhecer apenas 90% do genoma humano, mas havia muitos aspetos importantes que permaneciam ocultos, fora da vista da Ciência, porque não tínhamos toda a tecnologia para ler essas porções do genoma. Agora, podemos estar no topo da montanha e ver toda a paisagem em baixo e ter uma imagem completa da nossa herança genética”.
O novo genoma de referência T2T vai complementar o padrão de referência atual, o Genome Reference Consortium buld 38, ou GRCh38, que tem vindo a ser continuamente atualizado desde 2000.
O Consórcio T2T juntou esforços ao Human Pangenome Reference Consortium para criar, numa fase posterior, uma nova referência pangenómica baseada na sequenciação completa do genoma de 350 indivíduos. O objetivo é captar a diversidade da população humana e garantir que se capta o genoma completo de forma correta.