Los científicos han desarrollado un sistema de gestión del flujo de trabajo que aborda la irreproducibilidad al analizar grandes conjuntos de datos genómicos con computadoras. Nextflow contribuye a establecer buenas prácticas científicas y proporciona un marco importante para aquellos proyectos de investigación en los que el análisis de grandes conjuntos de datos se utiliza para tomar decisiones, por ejemplo, en medicina de precisión.
La reproducibilidad de la investigación es crucial para avanzar en la ciencia. Desafortunadamente, y de acuerdo con estudios y encuestas recientes, el número de experimentos irreproducibles está aumentando y la reproducibilidad de la investigación ahora se reconoce como uno de los principales desafíos que los científicos, las instituciones, los fundadores y las revistas deben enfrentar.abordar para que la ciencia siga siendo creíble y siga progresando.
Para dar sentido a los datos genómicos, los científicos confían cada vez más en una combinación de programas informáticos llamados tuberías. Estas tuberías procesan datos y entregan resultados analíticos tales como riesgos genéticos, por ejemplo. Desafortunadamente, los resultados de estas tuberías no siempre son reproduciblesEn la era de la medicina de precisión, esta reproducibilidad limitada puede tener implicaciones importantes para nuestra salud.
Ahora, un equipo de investigadores del Centro de Regulación Genómica CRG en Barcelona, España, dirigido por Cedric Notredame, ha desarrollado un sistema de gestión de flujo de trabajo que garantiza la reproducibilidad en experimentos computacionales. El sistema, denominado Nextflow, se ha descrito enla edición actual de Biotecnología de la naturaleza . "Al hacer análisis computacionales, pequeñas variaciones en las plataformas computacionales pueden inducir una inestabilidad numérica que resulta en irreproducibilidad. Nextflow permite a los científicos evitar estas variaciones y contribuye a estandarizar las buenas prácticas en experimentos computacionales", explica Cedric Notredame, autor principal del artículo.
"Una pequeña variación puede no parecer un problema cuando se utilizan datos genómicos en un proyecto de investigación en particular, pero incluso las variaciones más pequeñas pueden ser cruciales si estamos utilizando estas conclusiones para tomar una decisión, por ejemplo, en un tratamiento de medicina de precisión."agrega Paolo Di Tommaso, primer autor del artículo." La irreproductividad será un problema importante en la medicina de precisión ", concluye.
que contiene irreproducibilidad
La razón principal de la irreproducibilidad es la complejidad de las computadoras modernas. Con todas las bibliotecas y el software que contienen, las computadoras son como máquinas hechas de miles de millones de partes móviles. Incluso cuando se usa exactamente la misma tubería y los mismos datos, ligeras variaciones entre las computadoraspuede llevar a la irreproducibilidad. La solución a este problema es proporcionar no solo los datos y el software, sino también el entorno de ejecución completo preconfigurado dentro de una nueva generación de tecnología de virtualización llamada contenedores. El equipo de CRG implementó Nextflow como una herramienta para administrar unflujo de trabajo computacional junto con sus dependencias mediante el uso de estos contenedores ". Es como congelar el experimento, por lo que todos los que quieran reproducirlo pueden hacerlo de la misma manera sin tener que reintroducir manualmente configuraciones complejas. Esta forma de hacer las cosas garantiza que lo mismoel conjunto de datos producirá los mismos resultados en cualquier lugar ", explican los autores.
Nextflow ayuda a integrar los recursos más sofisticados para la reproducibilidad: Zenodo para datos, Github y Docker para software y la nube para computación. Proporciona un punto de inflexión para la buena práctica en el procesamiento computacional de grandes conjuntos de datos. El CRG ahora está comprometido conayuda a promover este importante aspecto de la biología moderna al hacer que este nuevo recurso esté disponible para la investigación académica pero también para la producción clínica y comercial. También está organizando una serie de cursos y talleres dedicados al uso de Nextflow y su aceptación por parte de la comunidad.
Fuente de la historia :
Materiales proporcionado por Centro de Regulación Genómica . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :