Los estudios de asociación de todo el genoma GWAS, por sus siglas en inglés analizan poblaciones grandes para encontrar genes que contribuyen a rasgos comunes de múltiples genes, como la altura o la obesidad. Estos estudios exhaustivos con frecuencia arrojan grandes cantidades de pequeñas variaciones genéticas que ocurren con mayor frecuencia en personas queson altos, obesos, etc. Pero esta asociación no significa que la variante realmente ayude a causar el rasgo; simplemente podría acompañarlo.
Entonces, ¿qué genes deberían investigar más los científicos? Si bien existen numerosos algoritmos computacionales para ayudar a destilar los resultados de GWAS, ha sido difícil saber cuál elegir. Informes del 2 de mayo American Journal of Human Genetics , los investigadores describen lo que creen que es un método eficaz e imparcial para elegir el mejor algoritmo para el trabajo, llamado Benchmarker.
La mayoría de los métodos que se han utilizado para evaluar los algoritmos pueden sesgar a los investigadores hacia genes que ya están bien caracterizados, alejando a los científicos de las oportunidades de descubrir algo realmente nuevo. Otros métodos requieren acceso a datos de referencia independientes que no siempre están disponibles.
"Tenemos diferentes algoritmos de priorización, pero en realidad no sabemos cómo decidir cuál es el mejor", dice Rebecca Fine, candidata a doctorado en Harvard Medical School que ha estado trabajando en este problema con Joel Hirschhorn, MD, PhD, jefe de endocrinología en el Boston Children's Hospital, quien también dirige el programa de metabolismo en el Broad Institute. "No queríamos tener que depender de un 'estándar de oro' anterior ni aportar nada más que los datos originales de GWAS".
Préstamo del aprendizaje automático
Tomando prestado el concepto de aprendizaje automático de "validación cruzada", Benchmarker permite a los investigadores utilizar los datos de GWAS como su propio control. La idea es tomar el conjunto de datos de GWAS y seleccionar un solo cromosoma. El algoritmo que se está comparando y luego utiliza eldatos de los 21 cromosomas restantes todos menos X e Y para hacer predicciones sobre qué genes en el cromosoma único tienen más probabilidades de contribuir al rasgo que se está investigando. A medida que este proceso se repite para cada cromosoma a su vez, los genes que el algoritmose ha marcado se agrupan. El algoritmo se valida comparando este grupo de genes priorizados con los resultados originales de GWAS.
"Usted entrena el algoritmo en el GWAS con un cromosoma retenido, luego vuelve a ese cromosoma y pregunta si esos genes estaban realmente asociados con un valor p fuerte en los resultados originales del GWAS", explica Fine. "los valores no representan las 'respuestas correctas' exactas, le dicen aproximadamente dónde están algunas asociaciones genéticas verdaderas. El producto final es una evaluación de cómo se desempeñó cada algoritmo "
Benchmarking Benchmarker
Al poner este enfoque a prueba para 20 rasgos separados, Fine, Hirschhorn y sus colegas concluyen que combinar múltiples estrategias a menudo da los mejores resultados. También encontraron evidencia de que ciertos algoritmos funcionan mejor cuando se buscan genes para ciertos rasgos.
"Esperamos que se desarrollen muchos más algoritmos para responder la siguiente pregunta clave después de GWAS: qué genes y variantes están causalmente relacionados con rasgos y enfermedades humanas", dice Hirschhorn. "El enfoque de Benchmarker puede ser de gran ayuda como un sesgo imparcial".forma de averiguar qué algoritmos usar para responder esta pregunta "
Fuente de la historia :
Materiales proporcionado por Boston Children's Hospital . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :