Un equipo de investigación en el Hospital de Niños de Filadelfia CHOP ha desarrollado una herramienta computacional innovadora que ofrece a los investigadores un método eficiente para detectar las diferentes formas en que el ARN se une se empalma cuando se copia del ADN. Debido a que las variaciones en cómo se empalma el ARN juegan un papel crucialEn muchas enfermedades, esta nueva herramienta analítica proporcionará mayores capacidades para descubrir biomarcadores de enfermedades y objetivos terapéuticos, incluso a partir de conjuntos de datos de secuenciación de ARN con cobertura modesta.
El líder del estudio, Yi Xing, PhD, director del Centro de Medicina Computacional y Genómica de CHOP, y los primeros autores y estudiantes de doctorado Zijun Zhang y Zhicheng Pan informan sobre su marco DARTS esta semana Métodos de la naturaleza . DARTS análisis de secuencia de ARN aumentada de aprendizaje profundo de la transcripción de empalme utiliza predicciones basadas en el aprendizaje de profundidad para aprovechar la gran cantidad de información disponible en los conjuntos de datos públicos de secuenciación de ARN secuencia de ARN, lo que permite nuevas ideas sobre la división alternativa.
"La innovación conceptual de DARTS es que proporciona un puente desde los grandes datos en el dominio público a conjuntos de datos más pequeños en estudios enfocados con investigadores individuales", dijo Xing. "DARTS ofrece la capacidad de transformar grandes cantidades de datos públicos de RNA-seqen una base de conocimiento, representada como una red neuronal profunda, de cómo se regula el empalme. Usando este marco computacional, podemos llevarlo a cualquier laboratorio individual. Esto podría ser realmente útil y aumentar la eficiencia del experimento y permitir nuevos descubrimientos.con solo 20 o 30 millones de lecturas de RNA-seq, puede hacer conjeturas e inferencias educadas sobre cosas que nunca pudo ver en el pasado ".
Xing tiene un enfoque de investigación de larga data en el empalme alternativo: el proceso mediante el cual la información en el ADN de un solo gen se une de diferentes maneras para generar diferentes ARN mensajeros y productos proteicos después de la transcripción de genes. Cada uno de los genes genera un promedio de10 o más de estos productos, y a veces hasta 38,000. Esas variaciones en el empalme alternativo pueden causar enfermedades, modificar el riesgo de enfermedades o hacer que una enfermedad sea más leve o peor.
La secuenciación de ARN masivamente paralela es ahora la tecnología estándar que utilizan los investigadores para investigar el empalme alternativo. Sin embargo, para medir con precisión el empalme alternativo, los experimentos de secuenciación de ARN tienen que ser muy profundos. La opinión del consenso es que se necesitan más de 100 millones de secuencias para analizar alternativasempalme, pero debido al alto costo, la mayoría de los investigadores no pueden darse el lujo de profundizar tanto con sus experimentos de secuenciación de ARN. Además, muchos genes médicamente importantes no se expresan en niveles altos. Incluso un experimento de secuenciación de ARN profundo no puede generar suficiente cobertura en tales genes, haciendoes prácticamente imposible medir los patrones alternativos de empalme de los genes.
En el estudio actual, el equipo de Xing primero se basó en datos de secuenciación de ARN de dominio público a gran escala de fuentes como el Consorcio ENCODE, el programa internacional lanzado por el Instituto Nacional de Investigación del Genoma Humano, para identificar todos los elementos funcionales en el genoma, incluidos los que actúan a nivel de ARN. Utilizando estos conjuntos de datos masivos, DARTS entrena una red neuronal profunda para predecir cambios en el empalme alternativo. El modelo incorpora niveles de ARN mensajero ARNm de 1.500 proteínas de unión a ARN y 3.000 características de secuencia.
Para permitir que los investigadores utilicen el modelo de aprendizaje profundo en sus propios estudios, las predicciones de la red neuronal profunda se combinan con datos de secuenciación de ARN reales generados en muestras biológicas específicas utilizando un marco estadístico llamado prueba de hipótesis bayesiana. Los investigadores pueden usar esta información en su propio individuolaboratorios para caracterizar mejor el empalme alternativo en diferentes condiciones biológicas.
Los investigadores aplicaron DARTS a las líneas celulares de cáncer de pulmón y próstata para evaluar su capacidad de predecir patrones de empalme en las células. Estas líneas celulares son modelos para la transición de las células epiteliales a las mesenquimales, un proceso importante tanto en el desarrollo embrionario como en la metástasis del cáncer.Al aprovechar las predicciones de aprendizaje profundo, DARTS descubrió cambios en patrones de empalme alternativos en numerosos genes que escaparon a la detección mediante herramientas computacionales convencionales porque estos genes se expresaron en niveles bajos en las células. El equipo de estudio realizó experimentos para validar estas predicciones novedosas.Los nuevos descubrimientos pueden permitir a los científicos identificar mejor los biomarcadores y los objetivos terapéuticos de las enfermedades.
"DARTS ofrece un marco conceptual emocionante que podríamos adaptar a otros usos", agregó Xing. "Por ejemplo, podríamos crear una versión que prediga empalmes alternativos en tejidos específicos de pacientes". Esto podría mejorar el diagnóstico de enfermedades raras a partir de unbiopsia de tejido, una técnica útil para centros pediátricos como CHOP que a menudo evalúa niños con trastornos desconcertantes y no diagnosticados.
DARTS, concluyó Xing, podría permitir a los científicos descubrir más sobre las contribuciones de genes poco estudiados que pueden no expresarse en niveles altos, pero que tienen importantes impactos en la salud y la enfermedad ". DARTS ofrece una nueva ventana a la materia oscura del transcriptoma," él dijo.
Fuente de la historia :
Materiales proporcionado por Hospital de Niños de Filadelfia . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :