Hace 21 años la ciencia logró cartografiar cerca del 92 % del genoma humano, lo que supuso una revolución en la biología y medicina, pero ¿qué pasó con el 8% restante? Ahora, un equipo científico ha logrado escudriñarlo, logrando así la primera secuencia completa de un genoma humano.
PUBLICIDAD
El nuevo mapa sin “fisuras” de nuestro ADN revela regiones ocultas importantes para entender las enfermedades genéticas, la reproducción, la diversidad humana e incluso la evolución de nuestra especie: “terminar de verdad la secuencia del genoma humano ha sido como ponerse unas gafas nuevas”, resume el investigador Adam Phillippy.
Detrás de este hito científico está el Consorcio T2T (Telómero a Telómero), con más de cien investigadores liderados por Phillippy, del Instituto Nacional de Investigación del Genoma Humano (NHGRI), y Karen Miga, de la Universidad de California-Santa Cruz, en EE.UU.
La descripción de estas piezas que faltaban se publicó primero en mayo de 2021 en el repositorio bioRxiv -sin la revisión de otros investigadores-. Ahora es cuando se recoge en seis artículos en la revista “Science”, además de en una docena de escritos complementarios en otras publicaciones científicas.
El genoma es el conjunto completo de instrucciones de un organismo, un libro que está escrito con combinaciones de solo cuatro unidades químicas designadas con las letras A, T, C y G (adenina, timina, citosina y guanina); estas se denominan bases nucleótidas.
Para los humanos, este manual de instrucciones contiene unos 3.000 millones de pares de bases (o letras), los cuales se encuentran en los 23 pares de cromosomas dentro del núcleo de todas las células. Secuenciar significa determinar su orden exacto en un segmento de ADN.
Han pasado dos décadas desde el primer borrador del genoma humano realizado, por separado, por Celera Genomics y el Proyecto Genoma Humano y ese 8 % no se había podido secuenciar en gran parte porque está formado por regiones de ADN muy repetitivas que son difíciles de alinear con el resto y entre ellas. La tecnología actual, capaz de leer cientos de miles letras a la vez del genoma, ha permitido hacerlo.
PUBLICIDAD
Las versión sin “huecos” del nuevo genoma de referencia -denominado T2T-CHM13- está compuesta por 3.055 millones de pares de bases de nucleótidos y 19.969 genes codificantes -productores- de proteínas, los pilares fundamentales de todos los componentes del organismo. Realizan la mayor parte del trabajo en las células y son necesarias para la estructura, función y regulación de tejidos y órganos.
De los genes codificantes de proteínas, el consorcio encontró unos 2.000 nuevos, la mayoría de ellos desactivados, aunque unos cien pueden seguir siendo activos, es decir, produciendo proteínas.
Además, se descubrieron más de 2 millones de variantes genéticas hasta ahora desconocidas en esas regiones oscuras, 622 de las cuales se producen en genes de importancia médica.
Los investigadores generaron la secuencia completa del genoma utilizando una línea celular especial que tiene dos copias idénticas de cada cromosoma, a diferencia de la mayoría de las células humanas que llevan dos copias ligeramente diferentes.