Un equipo de investigadores del Instituto de Tecnología de Nueva Jersey NJIT y el Hospital Infantil de Filadelfia CHOP ha desarrollado un algoritmo a través del aprendizaje automático que ayuda a predecir los sitios de metilación del ADN, un proceso que puede cambiar la actividad del ADN sin cambiarsu estructura general, y podría identificar los mecanismos que causan enfermedades que de otro modo se perderían con los métodos de detección convencionales.
El artículo fue publicado en línea esta semana por la revista Inteligencia natural de la máquina .
La metilación del ADN está involucrada en muchos procesos celulares clave y es un componente importante en la expresión génica. Asimismo, los errores en la metilación pueden estar relacionados con una variedad de enfermedades humanas. Si bien las herramientas de secuenciación genómica son efectivas para identificar polimorfismos que pueden causar una enfermedad,Los mismos métodos no pueden capturar los efectos de la metilación porque los genes individuales todavía tienen el mismo aspecto. Específicamente, se ha realizado un esfuerzo considerable para estudiar la metilación del ADN en N6-adenina 6mA en células eucariotas, que incluyen células humanas, pero aunque los datos genómicosestá disponible, el papel de la metilación en estas células sigue siendo difícil de alcanzar.
"Anteriormente, los métodos que se habían desarrollado para identificar estos sitios de metilación en el genoma eran muy conservadores y solo podían observar ciertas longitudes de nucleótidos en un momento dado, por lo que se pasaron por alto una gran cantidad de sitios de metilación", dijo Hakon Hakonarson, MD, PhD, Director del Centro de Genómica Aplicada CAG en CHOP y uno de los coautores principales del estudio. "Necesitábamos desarrollar una mejor manera de identificar y predecir los sitios de metilación con una herramienta que pudiera identificar estos motivos en todoel genoma que puede tener un fuerte impacto funcional y potencialmente causar enfermedades. "
Para abordar este problema que afecta a la comunidad de investigación, CAG y sus socios en NJIT recurrieron al aprendizaje profundo. Zhi Wei, PhD, profesor de informática en NJIT y coautor principal del estudio, trabajó con Hakonarson ysu equipo para desarrollar un algoritmo de aprendizaje profundo que pudiera predecir dónde ocurrieron estos sitios de metilación, lo que luego ayudaría a los investigadores a determinar el efecto que podrían tener en ciertos genes cercanos.
Wei llama a su software Deep6mA. Para predecir dónde se pueden encontrar estos sitios de metilación, Wei lideró el desarrollo de una red neuronal, que es un modelo de aprendizaje automático que intenta aprender de manera similar a un cerebro. Las redes neuronales se han utilizado eninvestigación celular antes, pero esta es su primera aplicación para estudiar los sitios de metilación del ADN en organismos multicelulares naturales.
Wei citó cuatro ventajas del nuevo método: automatización de la representación de características de secuencia de diferentes niveles de detalle; integración de un amplio espectro de secuencias de metilación que flanquean genes de interés; habilitación de la visualización potencial de motivos de secuencia inherentes para interpretación; y facilitaciónde desarrollo de modelos y predicción en datos genómicos a gran escala.
El equipo de estudio aplicó este algoritmo a tres tipos diferentes de organismos representativos: A. thaliana, D. melanogaster y E. coli, siendo los dos primeros eucariotas. Deep6mA pudo identificar sitios de metilación de 6mA hasta la resolución de un solonucleótido, o unidad básica de ADN. Incluso en este estudio de confirmación inicial, los investigadores pudieron visualizar patrones reguladores que no habían podido observar utilizando métodos previamente existentes.
"Una limitación es que nuestra predicción propuesta se basa puramente en información de secuencia", dijo Wei en su declaración de discusión del estudio. "Si un candidato es un sitio de 6mA o no, también dependerá de muchos otros factores. Metilación, incluyendo 6mA, es un proceso dinámico, que cambiará con el contexto celular. En el futuro, nos gustaría tener en cuenta otros factores [como] la expresión génica. Esperamos predecir 6mA en el contexto celular mediante la integración de otros datos ".
"Ya sabemos que varios genes tienen un mecanismo causante de enfermedades provocado por la metilación, y aunque este estudio no se realizó en células humanas, los modelos de células eucariotas eran muy comparables", dijo Hakonarson. "Científicos genómicos que buscantraducir sus hallazgos en aplicaciones clínicas encontraría esta herramienta muy útil, y el nivel de precisión podría eventualmente conducir al descubrimiento de células u objetivos específicos que son candidatos para la intervención terapéutica ".
Fuente de la historia :
Materiales proporcionado por Hospital de Niños de Filadelfia . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :