Dados los recientes avances notables en genética, es fácil suponer que los científicos del siglo XXI tienen a su disposición una forma clara y rápida de ejecutar un escaneo de secuencia genómica y descubrir qué genes entre miles se pueden expresar y cuáles no.El proceso por el cual la información codificada dentro de los genes conduce a productos clave, como las proteínas.
Sorprendentemente, eso no ha sido posible hasta ahora. Los biólogos de la Universidad de California en San Diego han desarrollado el primer sistema para determinar la expresión génica basada en el aprendizaje automático. Dada la falta de tal método, el nuevo proceso se considera un tipode Rosetta Stone genético para biólogos.
"Este documento representa el primer método para distinguir genes que pueden expresarse de aquellos que no pueden", dijo Steve Briggs, profesor de la División de Ciencias Biológicas y autor principal del documento. "Esta es la base de toda la biología. Ya seaes el descubrimiento de drogas o el fitomejoramiento o la evolución, esto toca los estudios básicos de biología "
El método, desarrollado por el estudiante graduado Ryan Sartor, Briggs y sus colegas, se describe el 12 de agosto de 2019 en el Actas de la Academia Nacional de Ciencias .
Los biólogos han clasificado previamente la expresión génica a través de observaciones experimentales y referencias de literatura científica. Pero el campo de la genómica carecía de un proceso formal para revelar esta información, llamada "conjunto de genes expresable", o EGS, que comprende todos los genes codificadores de proteínas con el potencialser expresado
"En biología, no existe un método para hacer esto", dijo Briggs. "En el pasado solo hemos tenido enfoques empíricos para hacer catálogos; no hemos tenido criterios científicos que clasifiquen los genes en función de sus características moleculares"
El nuevo método aprovecha el aprendizaje automático, el uso de algoritmos y otros procesos para analizar datos, y se basa en un conjunto de ejemplos de casi 30,000 genes de plantas de maíz que contienen características moleculares específicas y detalladas. Se entrenó un algoritmo avanzado sobre los datos y "aprendió "a clasificar la expresión génica con una precisión del 99.4 por ciento.
La clave del avance es reunir la biología de la cromatina, que contribuye a regular el empaquetado del ADN dentro de las células, con características moleculares que se sabe que determinan la expresión génica. Combinando esto con el aprendizaje automático matemático, el nuevo método para determinar la especieconjunto de genes transcritos, o "expresoma", crea un atlas de genes expresables. El método también puede ser útil para comprender los mecanismos evolutivos que silencian ciertos genes.
Briggs ahora está aplicando el método al sorgo, un grano importante para alimentos y forraje, pero dice que puede ser útil más allá de las especies de plantas. En última instancia, dice que el nuevo método es como un decodificador de palabras.
"La secuencia del genoma es como un libro", dijo Briggs. "Las palabras son los genes. Hasta ahora, no podíamos decir qué secuencias de ADN eran palabras reales y cuáles simplemente se parecían a palabras. Al eliminar las no palabras ahora tenemosuna lectura mucho más precisa del libro "
Los coautores del artículo incluyen a Jaclyn Noshay y Nathan Springer de la Universidad de Minnesota. El Programa de Investigación del Genoma Vegetal de la Fundación Nacional de Ciencias apoyó la investigación.
Fuente de la historia :
Materiales proporcionado por Universidad de California - San Diego . Original escrito por Mario Aguilera. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :