los científicos de Johns Hopkins informan que han utilizado con éxito dos tecnologías de genes separadas para ensamblar la secuencia del genoma más completa hasta la fecha Triticum aestivum , la especie cultivada más común de trigo utilizada para hacer pan.
Se publicó un informe sobre el logro en la edición del 23 de octubre de GigaScience solo unas pocas semanas antes de su informe relacionado sobre la secuencia del "antepasado" del trigo harinero Aegilops tauschii publicado el 15 de noviembre en Naturaleza .
Juntos, dicen, las secuencias del genoma del trigo pueden ayudar a los biólogos no solo a comprender mejor la historia evolutiva del trigo, sino también a avanzar en la búsqueda de tipos de trigo más resistentes, más resistentes a plagas y sequías para ayudar a alimentar a la creciente población mundial.
"Después de muchos años de intentarlo, finalmente hemos podido producir un ensamblaje de alta calidad de este genoma tan desafiante", dice Steven Salzberg, Ph.D., Profesor Distinguido Bloomberg de Ingeniería Biomédica en la Universidad Johns Hopkins WhitingEscuela de Ingeniería y el Instituto McKusick-Nathans de Medicina Genética en la Facultad de Medicina de la Universidad Johns Hopkins.
Según los científicos de Johns Hopkins, el trigo harinero tiene uno de los genomas más complejos conocidos por la ciencia, que contiene aproximadamente 16 mil millones de pares de bases de ADN y seis copias de siete cromosomas. En comparación, el genoma humano es aproximadamente cinco veces más pequeño,con aproximadamente tres mil millones de pares de bases y dos copias de 23 cromosomas. Las versiones publicadas anteriormente del genoma del trigo harinero han contenido grandes lagunas en su secuencia de ADN altamente repetitiva.
"La naturaleza repetitiva de este genoma hace que sea difícil secuenciar completamente", dice Salzberg. "Es como tratar de armar un rompecabezas de una escena de paisaje con un enorme cielo azul. Hay muchas piezas pequeñas muy similares paraarmar."
El genoma del trigo pan recién ensamblado, que costó $ 300,000 solo por la secuenciación, tomó un año para que los investigadores de Johns Hopkins reunieran 1.5 billones de bases de datos sin procesar en un ensamblaje final de 15.34 mil millones de pares de bases.
Para hacerlo, Salzberg y su equipo utilizaron dos tipos de tecnología de secuenciación del genoma: secuenciación de lectura corta de alto rendimiento y secuenciación de molécula única de lectura larga. Como su nombre lo indica, la secuenciación de alto rendimiento genera cantidades masivas de pares de bases de ADN muy rápidamentey barato, aunque los fragmentos son muy cortos, solo 150 pares de bases de largo para este proyecto. Para ayudar a ensamblar las áreas repetitivas, el equipo de Johns Hopkins usó secuenciación de moléculas individuales en tiempo real, que lee el ADN a medida que se sintetiza en un pequeño, nanoescala en un chip. La tecnología permite a los científicos leer hasta 20,000 pares de bases a la vez midiendo señales fluorescentes que se emiten a medida que se copia cada base de ADN.
Salzberg dice que la secuenciación de un genoma de este tamaño requiere no solo experiencia genética, sino también recursos informáticos muy grandes disponibles en relativamente pocas instituciones de investigación en todo el mundo. El equipo se basó en gran medida en el Maryland Advanced Research Computing Center, un centro informático compartido porHopkins y la Universidad de Maryland, que tiene más de 20,000 núcleos de computadora CPU y más de 20 petabytes de almacenamiento de datos. El equipo usó aproximadamente 100 años de CPU para armar este genoma.
Salzberg y su equipo también participaron en el esfuerzo de colaboración informado en la revista Naturaleza para secuenciar un tipo ancestral de trigo Aegilops tauschii que comúnmente se conoce como pasto de cabra y todavía se encuentra en partes de Asia y Europa. Su genoma es aproximadamente un tercio del tamaño del genoma del pan de trigo, pero tiene niveles similares de repetición. El trabajo, realizado como parte de unEl esfuerzo de colaboración entre la Universidad de California, Davis, Johns Hopkins y la Universidad de Georgia, tardó aproximadamente cuatro años en completarse. Mediante la secuenciación ordenada del genoma de clones, la secuencia de escopeta y el mapeo óptico del genoma, el equipo reunió los 4.300 millones de nucleótidos que producenla secuencia genética de la planta. Con esta información, el resto del equipo pudo identificar secuencias que componen los genes responsables de las características específicas de la planta.
Otros investigadores involucrados en el estudio del trigo harinero incluyeron a Aleskey V. Zimin y Daniela Puiu, ambos miembros del laboratorio de Salzberg en el Centro de Biología Computacional en el Instituto de Medicina Genética McKusick-Nathans; Sarah Kingan y Richard Hall de Pacific Biosciences en MenloPark, California; y Bernardo J. Clavijo del Earlham Institute en Norwich, Reino Unido.
Este trabajo fue apoyado en parte por la National Science Foundation IOS-1238231 y IOS-1444893 y el Instituto Nacional de Investigación del Genoma Humano R01 HG006677.
Ninguno de los autores informa intereses competitivos o en conflicto relacionados con la investigación.
* Este lanzamiento fue editado el 29 de noviembre de 2017 para corregir la información sobre la tecnología de secuenciación y ensamblaje utilizada en esta investigación.
Fuente de la historia :
Materiales proporcionados por Medicina Johns Hopkins . Nota: El contenido puede ser editado por estilo y longitud.
Referencias de revistas :
Cite esta página :