Evan Eichler siempre se ha sentido atraído por las regiones más complejas del genoma de la humanidad, aquellas con tramos extrañamente largos de ADN repetido o con copias adicionales de genes. Sospechaba que estas regiones podrían desempeñar un papel crucial en la evolución y la enfermedad. Por eso, máshace más de 20 años, se convirtió en parte del Proyecto Genoma Humano, el esfuerzo de $3 mil millones para leer cada letra del ADN de una persona.
Pero después de que el proyecto se adjudicara la victoria en 2003, Eichler solo estaba un poco más cerca de su objetivo científico. El esfuerzo de secuenciación no había podido leer muchos fragmentos grandes de ADN, más del ocho por ciento del genoma. Los científicos sabían que estos fragmentos faltantes conteníansecuencias altamente repetitivas, y en gran medida las descartó como basura. No es así, dice Eichler, investigador del Instituto Médico Howard Hughes HHMI de la Universidad de Washington. "Resultó que muchas de las regiones en las que estaba interesado estaban en las brechas.Se comprometió a terminar el trabajo: leer el genoma completo, partes complicadas y todo.
Ahora él y un equipo de unos 100 científicos, dirigido por Adam Phillippy del Instituto Nacional de Investigación del Genoma Humano NHGRI y Karen Miga de la Universidad de California, Santa Cruz, UCSC finalmente lo han hecho bien. En un nuevo trabajopublicado por primera vez como una preimpresión en bioRxiv.orgy ahora publicado el 31 de marzo de 2022 en la revista Ciencia, describen la primera secuenciación de un genoma humano completo, agregando el valor de un cromosoma completo de ADN previamente oculto: el ocho por ciento faltante. En el manuscrito genético para la vida, "estamos viendo capítulos que nunca antes se habían leído", diceEichler.
O como dice el genetista de la Universidad de Washington Robert Waterston: "Ya no hay partes ocultas o desconocidas".
"Creo que psicológicamente es algo importante", agrega Waterson, líder del Proyecto Genoma Humano original que no participó en el nuevo esfuerzo. "Simplemente admiro a estos científicos por seguir adelante".
Un intrincado rompecabezas
El genoma humano se compone de poco más de seis mil millones de letras individuales de ADN, aproximadamente el mismo número que otros primates como los chimpancés, repartidas entre 23 pares de cromosomas. Para leer un genoma, los científicos primero cortan todo ese ADN enpiezas de cientos a miles de letras de largo. Las máquinas de secuenciación luego leen las letras individuales de cada pieza, y los científicos intentan ensamblar las piezas en el orden correcto, como armar un intrincado rompecabezas.
Un desafío es que algunas regiones del genoma repiten las mismas letras una y otra vez. Las regiones repetitivas incluyen los centrómeros, las partes que mantienen unidas las dos cadenas de cromosomas y que desempeñan funciones cruciales en la división celular, y el ADN ribosómico, queproporciona instrucciones para las fábricas de proteínas de la célula. Otras partes repetitivas incluyen nuevos genes que pueden ayudar a las especies a adaptarse. En el pasado, toda esa repetición hacía imposible ensamblar algunas piezas cortadas en el orden correcto. Es como tener piezas idénticas de un rompecabezas:- los científicos no sabían cuál iba a dónde, dejando grandes lagunas en la imagen genómica.
Otro inconveniente: la mayoría de las células contienen dos genomas: uno del padre y otro de la madre. Cuando los investigadores intentan ensamblar todas las piezas, las secuencias de cada padre pueden mezclarse, oscureciendo la variación real dentro de cada genoma individual.
A mediados de la década de 2000, mientras los científicos intentaban descubrir cómo superar las barreras, "se nos ocurrió la idea de obtener un genoma completo secuenciando solo uno de los genomas en lugar de resolver dos al mismo tiempo", recuerdaEichler. Sabía exactamente dónde encontrarlo: de un conjunto de líneas celulares que estaba estudiando el genetista reproductivo de la Universidad de Pittsburgh, Urvashi Surti. Debido a un raro error en el desarrollo normal, las células terminan con dos copias del ADN del padre y ninguna.de la madre.
Dicha línea celular, con un solo genoma, "es lo que hizo posible este ensamblaje del genoma", dice el investigador del HHMI Erich Jarvis, neurogenetista de la Universidad Rockefeller que colaboró en el nuevo trabajo.
encendido
Otros avances clave incluyeron mejoras rápidas en las máquinas de secuenciación de genes fabricadas por Oxford Nanopore Technologies y Pacific Biosciences. En 2017, Phillippy de NHGRI y Miga de UCSC se dieron cuenta de que se había abierto la capacidad de una nueva máquina Nanopore para leer con precisión un millón de letras de ADN a la vez.la puerta para finalmente abordar las partes difíciles del genoma. Crearon el consorcio Telomere-to-Telomere T2T para secuenciar cada cromosoma de un extremo, o telómero, al otro. Casi al mismo tiempo, el equipo de Eichler había demostrado el valor de usar PacificTecnología de biociencias para resolver formas más complejas de variación genética.
No había garantía de éxito. Pero "tuvimos el beneficio del optimismo juvenil y nos entusiasmó la promesa de estas nuevas tecnologías", recuerda Phillippy. El equipo hizo funcionar sus máquinas Nanopore sin parar durante seis meses y trajo decenas decientíficos para ensamblar las piezas y analizar los resultados. Al mismo tiempo, otros miembros del equipo y Pacific Biosciences estaban generando datos de secuenciación utilizando su plataforma de secuenciación de lectura larga. En particular, el proyecto recibió un impulso cuando Pacific Biosciences introdujo una nueva máquina de secuenciación que generaba lecturas de secuenciación de lectura larga con una precisión superior al 99 por ciento. "Era la última pieza del rompecabezas, como ponerse un nuevo par deanteojos", dice Phillippy. La tecnología de Pacific Biosciences no podía cubrir todas las partes del genoma igualmente bien, pero los científicos se dieron cuenta de que al combinar la secuenciación de lectura larga con los datos de Oxford Nanopore, podían llenar todos los vacíos.
Para el verano de 2020, el consorcio había ensamblado dos cromosomas y había planeado lo que Phillippy llama un hackatón para obtener los otros 21, trabajando de forma remota con Zoom y Slack durante la pandemia. Un momento clave fue cuando el equipo trató de ensamblar las regiones más difíciles.del genoma, el ADN altamente repetitivo en los centrómeros. Los investigadores se dieron cuenta de que los algoritmos para ensamblar las piezas no podían manejar la repetición, pero el ojo humano sí. En la pantalla de la computadora, los científicos vieron dónde se habían convertido las diferentes secuencias repetitivas.enredados juntos. Luego, lo desenredaron manualmente, "como desenredar una cuerda en un yo-yo", dice Jarvis. Al final del verano, el equipo había secuenciado cada cromosoma.
Terremoto de cambios genéticos
A medida que emergía cada nuevo capítulo de nuestro libro genético de la vida, los investigadores se sumergían en buscar un significado biológico. Sus resultados aparecen en seis artículos en Ciencia y más de una docena de artículos en otros lugares. Por ejemplo, el equipo descubrió niveles inesperadamente altos de variación genética en los centrómeros y otras regiones: "un nuevo cofre del tesoro de variantes que podemos estudiar para ver si tienen un significado funcional".dice Philippy.
Los datos ofrecen "la base para una nueva era" en el estudio de los centrómeros, dice Miga, quien codirigió el grupo de trabajo satelital de centrómeros T2T. Los científicos ahora podrán explorar cómo esta variación recién descubierta contribuye a la enfermedad y cómo los centrómerosEl ADN cambia con el tiempo, dice ella.
Los resultados de T2T también apuntan a patrones de variación más complejos en los genes que pueden haber ayudado a crear la especie humana y podrían explicar nuestra rápida evolución. La secuencia completa del genoma revela que algunos genes asociados con cerebros más grandes son muy variables, explica EichlerUna persona puede tener 10 copias de un gen en particular, mientras que otras pueden tener solo una o dos. Esta variación puede significar problemas durante la fertilización, cuando los cromosomas de mamá y papá se alinean e intercambian piezas. Los genes que no coinciden pueden provocar "un terremoto"." de alteraciones genéticas, explica Eichler. Como resultado, "estas regiones se convierten en un crisol tanto para cambios evolutivos rápidos como para la susceptibilidad a enfermedades, tanto dentro como entre especies", dice.
La finalización exitosa de un solo genoma no es la última palabra. Los miembros del consorcio ya están trabajando para secuenciar un genoma con diferentes cromosomas heredados de cada padre. También están comenzando un esfuerzo de pan-genoma para leer las secuencias de ADN completas de cientosde personas de todo el mundo. "El objetivo es crear un genoma humano lo más completo posible, que represente mucha más diversidad humana", explica Jarvis, codirector del esfuerzo pangenoma.
Pero la nueva secuencia es el primer paso indispensable, dice Eichler. "Ahora tenemos una piedra de Rosetta para observar la variación completa en cientos de miles de otros genomas en el futuro".
Fuente de la historia:
Materiales proporcionado por Instituto Médico Howard Hughes. Nota: el contenido se puede editar por estilo y longitud.
Referencias de revistas:
Citar esta página:
Visita Nuevo científico for more global science stories >>>