En un proyecto único, los investigadores de la Escuela de Medicina Icahn en Mount Sinai han colaborado en la anotación y análisis de una gran cantidad de perfiles de expresión génica del Omnibus de Expresión Génica GEO del Centro Nacional de Información Biotecnológica NCBI. Más de70 voluntarios de 25 países ayudaron a los investigadores de Mount Sinai a analizar los datos, lo que permitió la identificación de nuevas asociaciones entre genes, enfermedades y medicamentos, algo que un número menor de investigadores sin ayuda o un programa informático automatizado no podrían lograr.artículo publicado en la revista Comunicaciones de la naturaleza describe el proyecto de crowdsourcing.
Los repositorios de Omics, que son almacenes virtuales para datos de expresión génica sin procesar, contienen miles de estudios. Tal abundancia de datos abre oportunidades para análisis integradores que pueden descubrir nuevos conocimientos que se perdieron o no fueron posibles en la publicación inicial de los datos.Por ejemplo, si bien un conjunto de datos de un estudio dado puede haber sido utilizado para un artículo publicado en particular, ese mismo conjunto de datos puede contener evidencia cuyo valor solo puede realizarse cuando se combina con datos de otro estudio. Entonces, puede ser evidente que un medicamento puedeser reutilizado para tratar una enfermedad diferente. Varios motores de búsqueda computarizados han sido diseñados para analizar estos datos. Sin embargo, para que estas herramientas sean efectivas requieren una curación humana pesada y que requiere mucho tiempo para garantizar la precisión.
Ahí es donde el crowdsourcing puede ser útil. Para este proyecto, los 70 voluntarios fueron reclutados a través de un curso masivo abierto en línea MOOC, que Avi Ma'ayan, PhD, Profesor de Ciencias Farmacológicas impartía en la plataforma Coursera MOOC.y Director del Centro de Bioinformática Mount Sinai en la Escuela de Medicina Icahn en Mount Sinai. A los estudiantes voluntarios se les pidió primero que identificaran estudios relevantes en la base de datos GEO de NCBI, en este caso, estudios en los cuales perturbaciones de un solo gen o de un solo fármacose aplicaron a células de mamíferos, o en los que se compararon tejidos normales versus tejidos enfermos. Una vez que se seleccionaron los estudios, los voluntarios extrajeron metadatos de los estudios y luego calcularon la expresión diferencial usando una extensión de navegador Chrome diseñada a medida desarrollada por los investigadores de Mount Sinai.
Este proceso extrajo información sobre firmas de genes - observaciones de grupos de genes cuya expresión combinada está asociada con una condición particular o acción de drogas - que se almacenaron en una nueva base de datos. Luego, el Dr. Ma'ayan y su equipo usaron la base de datos paravisualice y analice las firmas en un portal web conocido como Expresión de firmas diferenciales extraídas por multitud, o CREEDS, desarrollado por el Laboratorio Ma'ayan en Mount Sinai. En el transcurso del proyecto, más de 3,100 perturbaciones de un solo gen de más deSe presentaron 2,300 estudios, así como 1,238 perturbaciones de un solo fármaco de casi 450 estudios.
"Hay una increíble cantidad de datos almacenados en estas bases de datos, pero gran parte de ellos no se ha explorado completamente", dijo el Dr. Ma'ayan. "La elaboración de perfiles y la extracción de firmas de expresión génica requiere mucho tiempo y trabajo, y no puede ser completamente automatizado. Al utilizar voluntarios, llamados 'ciudadanos-científicos', pudimos brindar una escala mucho mayor de curación humana y control de calidad de la que podríamos haber realizado solos. Al combinar ese toque humano con programas automatizados,podríamos procesar muchos más datos de los que hubieran sido posibles "
En última instancia, las firmas extraídas manualmente se usaron como un conjunto de capacitación para ayudar a un programa que utiliza el aprendizaje automático para procesar todos los datos actualmente disponibles en GEO para agregar más firmas de medicamentos, genes y enfermedades a la base de datos CREEDS. Mientras que los investigadores generalmente encuentranque la calidad de las firmas generadas automáticamente es inferior en comparación con las creadas por humanos, tales esfuerzos de crowdsourcing pueden integrarse con el aprendizaje automático para ayudar a refinar los datos. Las instancias que los programas de computadora encuentran más difíciles pueden presentarse a los curadores humanos de crowdsourcing con sugerencias;esto permite datos de mayor calidad, al tiempo que reduce el esfuerzo requerido por el voluntario.
"Agradecemos a los voluntarios que ayudaron a demostrar que los ciudadanos científicos, trabajando con investigadores hacia un objetivo común, pueden lograr resultados notables que tienen un impacto real", dijo el Dr. Ma'ayan. "Tales esfuerzos colectivos pueden ayudarnosdescubrir nuevas drogas, nuevas causas de enfermedades y nuevos conocimientos científicos "
Fuente de la historia :
Materiales proporcionado por Sistema de salud del Monte Sinaí . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :