Los científicos han reunido un conjunto de secuencias genéticas que permiten que el genoma de referencia refleje mejor la diversidad genética global. Las nuevas secuencias mejoran la utilidad del genoma de referencia humano, un recurso clave para la investigación moderna en genética y genómica, y se presentaron en el AmericanReunión anual de la Society of Human Genetics 2019 en Houston, Texas
Cuando el Proyecto del Genoma Humano se completó en 2003, su logro característico fue el genoma de referencia humano, un conjunto de secuencias de ADN que sirve como estructura y ejemplo representativo del conjunto completo de genes humanos. Para áreas del genoma donde hayCon poca variación entre las diferentes personas, el genoma de referencia es un recurso importante que ha ayudado a avanzar en la secuenciación de genes, los estudios de asociación de todo el genoma y la caracterización de proteínas.
Dado que casi todos los experimentos de secuenciación genética se basan en el genoma de referencia humano, existe una necesidad apremiante de mejorar la referencia para capturar mejor la diversidad encontrada en diferentes poblaciones humanas, explicó Karen Wong, BS, una estudiante graduada en la profesora Pui-Yan Kwoklaboratorio de la Universidad de California, San Francisco UCSF, que presentó la investigación. Una referencia más representativa beneficiaría a los científicos que usan millones de conjuntos de datos de secuenciación existentes, así como futuros estudios de secuenciación.
"Tan integral como lo ha sido para la comunidad científica, el genoma de referencia actual no representa la diversidad genética encontrada en diferentes poblaciones humanas. Es limitante porque el genoma de referencia está construido con ADN de algunas personas, y más del 70%de sus secuencias proviene de un solo donante ", dijo Wong. Al estudiar grupos que pueden tener más diferencias genéticas con respecto al genoma de referencia, el genoma de referencia es menos útil e incluso puede introducir errores o sesgos en los resultados.
En particular, los investigadores se ven desafiados cuando una muestra particular incluye secuencias de inserción: tramos de ADN que, en relación con la referencia, representan una adición. La longitud de estas secuencias de inserción puede variar desde unos pocos cientos de pares de bases hasta una duplicación completa de genes, pero debido a que no existen en el genoma de referencia, no pueden asignarse a la referencia y, por lo tanto, carecen del contexto necesario para ser estudiados adecuadamente. Por esta razón, estas secuencias a menudo se descartan.
"El significado de una secuencia deriva de saber de dónde viene", dijo Wong. "Saber dónde encaja una secuencia en el genoma permite a los investigadores interpretar inserciones basadas en secuencias a su alrededor".
Para lograr este objetivo, la Sra. Wong y sus colegas de la UCSF y el Instituto de Ciencias Biomédicas de la Academia Sinica en Taiwán secuenciaron por completo más de 300 genomas de todo el mundo, con cuidado de incluir secuencias masculinas y femeninas de varias subpoblaciones.Centrándose en las áreas de los genomas que no se mapearon al genoma de referencia, utilizaron un proceso llamado ensamblaje de novo para identificar secuencias de inserción nuevas y únicas y sus ubicaciones en relación con la referencia. Pudieron ubicar una gran mayoría de los únicos.secuencias que faltan en la referencia, lo que les permitió agregar detalles al genoma de referencia, mejorando su capacidad y la de otros investigadores para mapear secuencias futuras y estudiarlas en contexto.
Como próximos pasos, la Sra. Wong y sus colegas planean continuar secuenciando diversos genomas globales, así como explorar cómo aumentar y organizar mejor el genoma de referencia para que sea más útil para los investigadores.
"El genoma humano tiene muchas regiones complejas, que ninguna estructura de referencia única puede describir completamente", dijo la Sra. Wong. "Es importante considerar qué información debe representarse en el genoma de referencia humano y qué no necesitaincluirse, para asegurarse de que sea útil para una variedad de usos pero que evite la complejidad excesiva.
Referencia: K Wong et al. 16 de octubre de 2019. Resumen: Construcción de un genoma de referencia que captura la diversidad genética global para una mejor interpretación de los datos de secuenciación del genoma completo. Presentado en la Reunión Anual 2019 de la Sociedad Americana de Genética Humana. Houston, Texas.
Fuente de la historia :
Materiales proporcionado por Sociedad Americana de Genética Humana . Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :