Llámalos "expertos en datos" profesionales
Un equipo de científicos del Instituto de Investigación Scripps TSRI está ampliando los servicios web para hacer que la investigación biomédica sea más eficiente. Con sus proyectos públicos gratuitos, MyGene.info y MyVariant.info, los investigadores de todo el mundo tienen una forma más rápida de detectarNuevas conexiones entre genes y enfermedades.
"Se trata de cómo entregar información rápidamente a los biólogos", dijo Chunlei Wu, profesor asociado de medicina molecular en TSRI.
Wu y el profesor asociado de TSRI Andrew Su co-dirigieron un nuevo estudio publicado en la revista biología del genoma informar sobre el progreso en la configuración de estos servicios y la respuesta positiva de los usuarios hasta el momento
Buenas noticias, malas noticias
Estas son las buenas noticias: la secuenciación genética es más rápida y asequible en estos días, lo que brinda a los científicos una mejor comprensión de los mecanismos detrás de muchas enfermedades. ¿La mala noticia?información útil.
Wu dijo que ha pasado horas descargando y analizando datos, a menudo teniendo problemas cuando descubre que los creadores de datos originales no anotaron la información de una manera estándar.
Con el apoyo de la iniciativa "Big Data to Knowledge" BD2K de los Institutos Nacionales de Salud NIH, Wu, Su y sus colegas han comenzado a dominar este problema creando una plataforma de recolección de datos para importar y actualizar automáticamente los datos deuna variedad de bases de datos públicas. Los datos que agregan se estructuran y entregan a través de dos servicios de búsqueda web de alto rendimiento, MyGene.info y MyVariant.info, con la última tecnología de computación en la nube.
"Ahora los investigadores pueden concentrarse en su propio trabajo en lugar de pasar por el esfuerzo de disputa de datos", dijo Wu.
MyGene.info y MyVariant.info también son potentes debido a su capacidad de escalar a medida que crece la base de usuarios y los conjuntos de datos.
MyGene.info contiene información sobre más de 13 millones de genes de aproximadamente 15,000 especies. El servicio recibe de cuatro a cinco millones de "consultas" de usuarios cada mes, y los investigadores están preparados para adaptarse aún más al expandir su uso de los servidores de la nube de Amazon.MyVariant.info actualmente cubre más de 316 millones de variantes únicas recopiladas de 14 fuentes de datos de la comunidad.
Los servicios han recibido comentarios positivos de la comunidad investigadora hasta el momento, dijo Ginger Tsueng, gerente de proyectos de divulgación científica en el laboratorio Su y coautor del nuevo estudio. En este año, MyVariant.info ha recibido más de cuatro milloneséxitos, mientras que MyGene.info ha manejado más de 17 millones.
Una base para futuras aplicaciones
Los investigadores han hecho que estos servicios sean de código abierto para alentar a otros a usar los datos y desarrollar sus propias aplicaciones.
Por ejemplo, los investigadores de la Universidad de Washington han creado una interfaz que recupera datos de MyGene.info y aporta información adicional para ejecutar MyGene2.org, un sitio que tiene como objetivo conectar a pacientes que comparten enfermedades genéticas raras. MyGene.info también proporcionala columna vertebral de BioGPS, un recurso para aprender sobre la función de genes y proteínas, dirigida por Su, Wu y el programador de TSRI Max Nanis.
Otro proyecto en proceso es una aplicación construida en la plataforma MyVariant.info que muestra variantes cuando un usuario escanea un nombre de gen, por ejemplo, desde un póster en una conferencia científica.
"Las herramientas y análisis bioinformáticos dependen en gran medida de tener bases sólidas de otras herramientas sobre las cuales construir", dijo Su. "MyGene.info y MyVariant.info son piezas clave de infraestructura que muchos bioinformáticos utilizan todos los días".
Fuente de la historia :
Materiales proporcionado por Instituto de Investigación Scripps . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :