Durante los últimos ocho años, el Consorcio de la Base de datos de agregación del genoma gnomAD y su predecesor, el Consorcio de agregación del genoma, o ExAC, ha estado trabajando con genetistas de todo el mundo para recopilar y estudiar más de 125,000 exomas y 15,000 genomas completosde poblaciones de todo el mundo.
Ahora, en siete artículos publicados en Naturaleza , Naturaleza Comunicaciones y Naturaleza Medicina, los científicos del Consorcio gnomAD describen su primer conjunto de descubrimientos de la base de datos, mostrando el poder de esta vasta colección de datos. Juntos, los estudios :
2. Presente el mapa de referencia completo más grande de una clase de variación genética poco estudiada pero importante llamada variantes estructurales;
3. muestre cómo las herramientas que explican formas únicas de variación y el contexto biológico de las variantes pueden ayudar a los genetistas clínicos cuando intentan diagnosticar pacientes con enfermedades genéticas raras; y
4. ilustrar cómo los conjuntos de datos a escala de población como gnomAD pueden ayudar a evaluar los objetivos farmacológicos propuestos.
Investigadores del Broad Institute of MIT y del Hospital General de Harvard y Massachusetts MGH se desempeñaron como coprimeros o coautores principales en todos los estudios, con científicos del Imperial College London en el Reino Unido, ella compañía de genética de consumo 23andMe y otras instituciones que contribuyen a trabajos individuales. Más de 100 científicos y grupos a nivel internacional han proporcionado datos y / o esfuerzo analítico al consorcio.
"Estos estudios representan la primera ola significativa de descubrimiento que salió del Consorcio gnomAD", dijo Daniel MacArthur, líder científico del proyecto gnomAD, autor principal de seis de los estudios, miembro del instituto en el Programa de Medicina yPopulation Genetics en Broad Institute, y ahora director del Center for Population Genomics en el Garvan Institute of Medical Research y el Murdoch Children's Research Institute en Australia. "El poder de esta base de datos proviene de su gran tamaño y diversidad de población, que pudimos alcanzargracias a la generosidad de los investigadores que contribuyeron con datos, y de los participantes de la investigación en esos estudios contribuyentes "
"En cierto sentido, gnomAD es el producto de un consorcio de consorcios, ya que los datos subyacentes representan el trabajo y las contribuciones de muchos grupos que han estado recolectando secuencias del exoma y el genoma como una forma de entender la biología humana", dijo Konrad Karczewski, primer autor en el papel insignia de la colección en Naturaleza y un biólogo computacional en la Unidad de Genética Analítica y Traslacional de Broad and MGH ". Cada uno de estos documentos representa a alguien que aporta un nuevo ángulo al conjunto de datos y dice:" Tengo una idea de cómo podemos poner todo esto en práctica "y crear un nuevo recurso para la comunidad genética. Fue increíble ver cómo se desarrollaba "
MIRADA DE GNOMAD
MacArthur y sus colegas de Broad y MGH construyeron ExAC y luego gnomAD para ampliar el trabajo del Proyecto 1000 Genomas, el primer esfuerzo internacional a gran escala para catalogar la variación genética humana y otros proyectos.
"En 2012, mi laboratorio estaba secuenciando los genomas de pacientes con enfermedades raras, y descubrí que los catálogos existentes de variación normal no eran lo suficientemente grandes o diversos como para ayudarnos a interpretar los cambios genéticos que estábamos viendo", recordó MacArthur ".Al mismo tiempo, nuestros colegas de todo el mundo habían secuenciado a decenas de miles de personas para estudios de trastornos comunes y complejos. Por lo tanto, nos propusimos reunir estos conjuntos de datos para crear un conjunto de datos de referencia para la investigación de enfermedades raras ".
El consorcio ExAC lanzó su primera colección de datos completos del exoma en octubre de 2014. Luego comenzó a recopilar datos completos del genoma, evolucionando hacia el Consorcio gnomAD y lanzando gnomAD v1.0 en febrero de 2017.
Las posteriores publicaciones de gnomAD se centraron en aumentar el número de exomas y genomas, el volumen de variantes resaltadas en los datos y la diversidad del conjunto de datos.
Los nuevos documentos se basan en el conjunto de datos gnomAD v2.1.1, que incluye genomas y exomas de más de 25,000 personas de ascendencia del este y sur de Asia, casi 18,000 de ascendencia latina y 12,000 de ascendencia africana o afroamericana.
CATÁLOGO INTEGRAL
Dos de los siete documentos muestran cómo los grandes conjuntos de datos genómicos pueden ayudar a los investigadores a aprender más sobre los tipos raros o poco estudiados de variantes genéticas.
El estudio insignia, dirigido por Karczewski y MacArthur y publicado en Naturaleza , describe gnomAD y asigna variantes de pérdida de función LoF: cambios genéticos que se cree que interrumpen por completo la función de los genes que codifican proteínas. Los autores identificaron más de 443,000 variantes LoF en el conjunto de datos gnomAD, excediendo drásticamente todas las anterioresAl comparar el número de estas variantes raras en cada gen con las predicciones de un nuevo modelo de la tasa de mutación del genoma humano, los autores también pudieron clasificar todos los genes que codifican proteínas de acuerdo con su tolerancia a las mutaciones disruptivas.es decir, la probabilidad de que los genes causen una enfermedad significativa cuando se ven afectados por cambios genéticos. Este nuevo esquema de clasificación identifica los genes que tienen más probabilidades de estar involucrados en enfermedades graves como la discapacidad intelectual.
"El catálogo de gnomAD nos ofrece nuestra mejor visión hasta ahora del espectro de la sensibilidad de los genes a la variación, y proporciona un recurso para apoyar el descubrimiento de genes en enfermedades comunes y raras", explicó Karczewski.
Mientras que el estudio de Karczewski y MacArthur se centró en pequeñas variantes mutaciones puntuales, pequeñas inserciones o deleciones, etc., el estudiante graduado Ryan Collins, el científico asociado Harrison Brand, el miembro del instituto Michael Talkowski, y sus colegas utilizaron gnomAD para explorar variantes estructurales.La clase de variación genómica incluye duplicaciones, deleciones, inversiones y otros cambios que involucran segmentos de ADN más grandes generalmente de más de 50-100 bases de largo. Su estudio, también publicado en Naturaleza , presenta gnomAD-SV, un catálogo de más de 433,000 variantes estructurales identificadas dentro de casi 15,000 de los genomas de gnomAD. Las variantes en gnomAD-SV representan la mayoría de las principales clases conocidas de variación estructural y forman colectivamente el mapa más grande de variación estructuralhasta la fecha.
"Las variantes estructurales son notoriamente difíciles de identificar dentro de los datos del genoma completo, y no han sido analizadas previamente a esta escala", señaló Talkowski, quien también es miembro de la facultad en el Centro de Medicina Genómica en MGH. "Pero alteran más individualmentebases en el genoma que cualquier otra forma de variación, y son impulsores bien establecidos de la evolución y la enfermedad humana ".
Varios resultados sorprendentes salieron de su encuesta. Por ejemplo, los autores encontraron que al menos el 25 por ciento de todas las variantes de LoF raras en el genoma individual promedio son en realidad variantes estructurales, y que muchas personas portan lo que deberían ser alteraciones estructurales perjudiciales o perjudiciales, pero sin los fenotipos o resultados clínicos que se esperarían.
También notaron que muchos genes eran tan sensibles a la duplicación como a la eliminación; es decir, desde una perspectiva evolutiva, obtener una o más copias de un gen puede ser tan indeseable como perder uno.
"Aprendimos mucho al construir este catálogo en gnomAD, pero claramente solo hemos arañado la superficie de entender la influencia de la estructura del genoma en la biología y la enfermedad", dijo Talkowski.
HERRAMIENTAS PARA UN MEJOR DIAGNÓSTICO
Tres de los documentos revelan cómo los catálogos profundos de gnomAD de diferentes tipos de variación genética y el contexto celular en el que surgen las variantes pueden ayudar a los genetistas clínicos a determinar con mayor precisión si una variante dada podría ser protectora, neutral o dañina en los pacientes.
en a Naturaleza artículo, Beryl Cummings, un ex estudiante graduado de Broad / MGH ahora en Maze Therapeutics, MacArthur, y sus colegas encontraron que las diferencias basadas en los tejidos en cómo se expresan los segmentos de un gen determinado pueden cambiar los efectos de las variantes dentro de esos segmentos en la biologíay riesgo de enfermedad. El equipo combinó datos de gnomAD y el proyecto Genotype Tissue Expression GTEx para desarrollar un método que utiliza estas diferencias para evaluar la importancia clínica de las variantes.
adentro Naturaleza Comunicaciones , MacArthur, el estudiante de posgrado Qingbo Wang y sus colaboradores encuestaron variantes de multinucleótidos, que consisten en dos o más cambios de pares de bases cercanos que se heredan juntos. Dichas variantes pueden tener efectos complejos, y este estudio representa el primer intento de catalogarlos sistemáticamentevariantes, examinar su distribución en todo el genoma y predecir sus efectos sobre la estructura y función de los genes.
Y en un separado Naturaleza Comunicaciones estudio, MacArthur, Nicola Whiffin y James Ware del Imperial College de Londres, y sus colegas exploraron el impacto de las variantes de ADN que surgen en las 5 regiones principales de genes no traducidos, que se encuentran justo antes de donde la maquinaria transcripcional de la célula comienza a leer un gencódigo de proteína. Las variantes en estas regiones pueden engañar a una célula para que comience a leer un gen en el lugar equivocado, pero no se ha documentado previamente.
"Los laboratorios clínicos usan gnomAD todos los días", dijo Heidi Rehm, genetista clínico; miembro del instituto en Broad's MPG y director médico de la Clinical Research Sequencing Platform en Broad; director de genómica en el Departamento de Medicina de MGH; y co-presidente con el miembro del instituto Broad Mark Daly del comité directivo de gnomAD. "Los métodos en estos estudios ya nos están ayudando a interpretar mejor los resultados de las pruebas genéticas de un paciente".
DESARROLLO DIRECTO DE DROGAS
Los dos estudios restantes de gnomAD describen cuán diversos datos genéticos a escala de población pueden ayudar a los investigadores a evaluar y elegir los mejores objetivos farmacológicos.
En 2018, el científico asociado de Eric, Eric Minikel, reflexionó en su blog de investigación sobre si los genes con variantes de LoF pronosticadas que se producen naturalmente podrían usarse para evaluar la seguridad de atacar esos genes con medicamentos. Escribió que si un gen que está naturalmente inactivado no funcionaparece tener efectos nocivos, tal vez ese gen podría inhibirse de forma segura con un medicamento. Esa publicación de blog se convirtió en la base de a Naturaleza documento en el que Minikel, MacArthur y sus colegas aplicaron el conjunto de datos gnomAD para investigar esta pregunta. Sugieren formas de incorporar ideas sobre las variantes de LoF en el proceso de desarrollo de fármacos.
Aprovechando la experiencia en Broad, la Fundación Michael J. Fox inició una colaboración entre Whiffin de Imperial College, MacArthur, la becaria posdoctoral de Broad Irina Armean, Aaron Kleinman y Paul Cannon de 23andMe y otros para usar variantes LoF catalogadas en gnomAD, UK Biobank,y 23andMe para estudiar las posibles responsabilidades de seguridad de reducir la expresión de un gen llamado LRRK2, que está asociado con el riesgo de enfermedad de Parkinson. Naturaleza medicina , utilizan estos datos para predecir que es poco probable que los medicamentos que reducen los niveles de proteína LRRK2 o bloqueen parcialmente la actividad del gen tengan efectos secundarios graves.
"Hemos catalogado grandes cantidades de variación disruptiva de genes en gnomAD", dijo MacArthur. "Y con estos dos estudios hemos demostrado cómo puede aprovechar esas variantes para iluminar y evaluar posibles objetivos de medicamentos".
IMPACTO CRECIENTE
El intercambio público de todos los datos ha sido un principio fundamental del proyecto gnomAD desde su inicio. Los datos detrás de estos siete documentos se publicaron públicamente a través del navegador gnomAD sin restricciones de uso o publicación en 2016.
"El amplio impacto que este recurso ya ha tenido en la investigación médica y la práctica clínica es un testimonio del increíble valor del intercambio y la agregación de datos genómicos", dijo MacArthur. "Más de 350 estudios independientes ya han utilizado gnomAD parainvestigación sobre predisposición al cáncer, enfermedades cardiovasculares, trastornos genéticos raros y más desde que pusimos a disposición los datos
"Pero estamos muy lejos de saturar los descubrimientos o resolver la interpretación variante", agregó. "Los próximos pasos para el consorcio se centrarán en aumentar el tamaño y la diversidad de la población de estos recursos y vincular los datos genéticos resultantes a escala masivaconjuntos con información clínica "
Fuente de la historia :
Materiales proporcionado por Instituto Amplio del MIT y Harvard . Original escrito por Tom Ulrich. Nota: El contenido puede ser editado por estilo y longitud.
Referencias de revistas :
Cite esta página :