Más de la mitad del genoma humano contiene secuencias repetitivas de ADN cuyas funciones aún no se conocen del todo.
Cuando el Proyecto Genoma Humano anunció que había completado el primer genoma humano en 2003, fue un logro trascendental: por primera vez se descifró el código del ADN de la vida humana. Pero había un inconveniente, y es que no se consiguió reunir toda la información del genoma. Existían lagunas, regiones sin rellenar, a menudo repetitivas, que resultaban demasiado confusas para unirlas.
Gracias a los avances en la tecnología para manejar estas secuencias repetitivas, los científicos finalmente llenaron esos vacíos en mayo de 2021, y el primer genoma humano completo ha sido publicado oficialmente el 31 de marzo de 2022.
Una bióloga experta en genética que estudia las secuencias repetitivas de ADN y cómo dan forma a los genomas a lo largo de la historia evolutiva. Forma parte del equipo que ayudó a caracterizar las secuencias repetitivas que faltaban. Y ahora, con un genoma humano completo, esas regiones repetitivas se están explorando por primera vez en su totalidad.
Las piezas del puzzle que faltaban
El botánico alemán Hans Winkler acuñó la palabra “genoma” en 1920, combinando la palabra “gen” con el sufijo “ome” (en inglés es genome), que significa “conjunto completo”, para describir la secuencia completa de ADN que contiene cada célula. Los investigadores siguen utilizando esta palabra un siglo después para referirse al material genético que compone un organismo.
Una manera de describir el aspecto de un genoma es compararlo con un libro de consulta. En esta analogía, un genoma es una antología que contiene las instrucciones del ADN para la vida. Se compone de una amplia gama de nucleótidos (letras) que se empaquetan en cromosomas (capítulos). Cada cromosoma contiene genes (párrafos) que son regiones de ADN que codifican las proteínas específicas que permiten el funcionamiento de un organismo.
El material genético está formado por ADN empaquetado estrechamente en cromosomas. Solo algunas regiones del genoma contienen genes que codifican proteínas.
Aunque todo organismo vivo tiene un genoma, su tamaño varía de una especie a otra. Un elefante usa la misma forma de información genética que la hierba que come y las bacterias de su intestino. Pero no hay dos genomas exactamente iguales. Algunos son cortos, como el genoma de la bacteria que habita en los insectos Nasuia deltocephalinicola, con únicamente 137 genes en 112 000 nucleótidos. Otros, como los 149 000 millones de nucleótidos de la planta con flores Paris japonica, son tan largos que resulta difícil hacerse una idea de cuántos genes contienen.
El genoma humano contiene aproximadamente 3 000 millones de nucleótidos y algo menos de 20 000 genes que codifican proteínas, lo que representa un 1 % de la longitud total del genoma.
El 99 % restante son secuencias de ADN no codificantes que no producen proteínas. Algunas son componentes reguladores que funcionan como una centralita para controlar el funcionamiento de otros genes. Otras son pseudogenes o reliquias genómicas que han perdido su capacidad de funcionamiento.
Y más de la mitad del genoma humano es repetitivo, con múltiples copias de secuencias casi idénticas.
¿Qué es el ADN repetitivo?
La forma más sencilla de ADN repetitivo son los bloques de ADN que se repiten una y otra vez en tándem, llamados satélites. Aunque la cantidad de ADN satélite que tiene un determinado genoma varía de una persona a otra, suelen agruparse hacia los extremos de los cromosomas en regiones llamadas telómeros. Estas regiones protegen a los cromosomas de la degradación durante la replicación del ADN. También se encuentran en los centrómeros de los cromosomas, una región que ayuda a mantener intacta la información genética cuando las células se dividen.
Los investigadores aún no conocen bien todas las funciones del ADN satélite. Pero como forma patrones únicos en cada persona, los biólogos forenses y los genealogistas utilizan esta huella genómica para cotejar muestras de la escena del crimen y rastrear la ascendencia. Más de 50 trastornos genéticos están relacionados con variaciones en el ADN satélite, incluida la enfermedad de Huntington.