Una nueva herramienta de software permite a los investigadores consultar rápidamente conjuntos de datos generados a partir de la secuenciación de una sola célula. Los usuarios pueden identificar en qué tipos de células está activa cualquier combinación de genes. Publicado en Métodos de la naturaleza el 1 de marzo, el software de acceso abierto 'scfind' permite el análisis rápido de múltiples conjuntos de datos que contienen millones de celdas por una amplia gama de usuarios, en una computadora estándar.
Los tiempos de procesamiento para tales conjuntos de datos son solo unos segundos, lo que ahorra tiempo y costos de computación. La herramienta, desarrollada por investigadores del Instituto Wellcome Sanger, se puede utilizar de manera muy similar a un motor de búsqueda, ya que los usuarios pueden ingresar texto libre y genesnombres.
Las técnicas para secuenciar el material genético de una célula individual han avanzado rápidamente en los últimos 10 años. La secuenciación de ARN unicelular scRNAseq, que se utiliza para evaluar qué genes están activos en células individuales, se puede utilizar en millones de células a la vezy genera una gran cantidad de datos 2,2 GB para el Atlas del riñón humano. Los proyectos que incluyen el Atlas de células humanas y el Atlas de células de la malaria utilizan estas técnicas para descubrir y caracterizar todos los tipos de células presentes en un organismo o población. Los datos deben serde fácil acceso y consulta, por parte de una amplia gama de investigadores, para obtener el máximo valor de ellos.
Para permitir un acceso rápido y eficiente, una nueva herramienta de software llamada scfind utiliza una estrategia de dos pasos para comprimir datos ~ 100 veces. La descompresión eficiente permite consultar rápidamente los datos. Desarrollado por investigadores del Wellcome Sanger Institute,scfind puede realizar análisis a gran escala de conjuntos de datos que involucran millones de celdas en una computadora estándar sin hardware especial. Las consultas que solían tomar días para devolver un resultado, ahora toman segundos.
La nueva herramienta también se puede utilizar para el análisis de datos multiómicos, por ejemplo, combinando datos de ATAC-seq de una sola célula, que mide la actividad epigenética, con datos de scRNAseq.
El Dr. Jimmy Lee, becario postdoctoral en el Wellcome Sanger Institute y autor principal de la investigación, dijo: "Los avances de los métodos de multiómica han abierto una oportunidad sin precedentes para apreciar el panorama y la dinámica de las redes reguladoras de genes. Scfind nos ayudaráidentificar las regiones genómicas que regulan la actividad genética, incluso si esas regiones están distantes de sus objetivos ".
Scfind también se puede utilizar para identificar nuevos marcadores genéticos que están asociados con, o definen, un tipo de célula. Los investigadores muestran que scfind es un método más exacto y preciso para hacer esto, en comparación con las bases de datos seleccionadas manualmente u otros métodos computacionales disponibles.
Para que scfind sea más fácil de usar, incorpora técnicas de procesamiento de lenguaje natural para permitir consultas arbitrarias.
El Dr. Martin Hemberg, ex líder de grupo en el Instituto Wellcome Sanger, ahora en la Escuela de Medicina de Harvard y en el Hospital Brigham and Women's, dijo: "El análisis de conjuntos de datos unicelulares generalmente requiere habilidades básicas de programación y experiencia en genética y genómica.Una amplia gama de usuarios puede acceder a grandes conjuntos de datos de una sola celda, desarrollamos una herramienta que puede funcionar como un motor de búsqueda, lo que permite a los usuarios ingresar cualquier consulta y encontrar tipos de celda relevantes ".
El Dr. Jonah Cool, Oficial de Programas Científicos de la Iniciativa Chan Zuckerberg, dijo: "Los métodos de análisis nuevos y más rápidos son cruciales para encontrar información prometedora en datos unicelulares, incluido el Atlas de células humanas. Las herramientas fáciles de usar como scfind se están acelerandoel ritmo de la ciencia y la capacidad de los investigadores para aprovechar el trabajo de los demás, y la Iniciativa Chan Zuckerberg se enorgullece de apoyar al equipo que desarrolló esta tecnología ".
Fuente de la historia :
Materiales proporcionado por Instituto Wellcome Trust Sanger . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :