Las aplicaciones potenciales para el método basado en el aprendizaje automático incluyen trabajo antidopaje, control de drogas por parte de la Aduana e investigación de la escena del crimen.
Investigadores de la Universidad de Aalto y la Universidad de Jena en Alemania han desarrollado un motor de búsqueda llamado CSI: FingerID que identifica los metabolitos de las mediciones de espectrometría de masas en tándem con una precisión más del 150 por ciento más alta que sus rivales, lo que puede hacer que el trabajo de los investigadoresen la vida y las ciencias médicas más fácil. El estudio fue publicado recientemente en el PNAS diario
Los metabolitos son moléculas pequeñas, como azúcares, ácidos grasos y aminoácidos que, entre otras cosas, sirven como fuentes de energía en las células y como materiales de construcción para las paredes celulares. Para los investigadores son, por así decir, rastros defuncionamiento y estado de las células.
'Hay muchos metabolitos, de cientos de miles a millones, y todos se parecen un poco. En nuestro estudio, construimos un modelo que se basa en el aprendizaje automático. Las estructuras moleculares que predice pueden usarse de la misma maneracomo resultados de búsqueda del motor de búsqueda de Google ', explica el profesor Juho Rousu de la Universidad de Aalto.
huellas de la molécula
El espectrómetro de masas en tándem utilizado en el estudio es un instrumento que divide las moléculas en fragmentos para medir sus masas y abundancias relativas, o su espectro de masas. En el método desarrollado por investigadores de Aalto y Jena, primero se calcula un árbol de fragmentación de cadaespectro incluido en los datos de entrenamiento que describe para cada fragmento su padre, un fragmento más grande donde se originó. Luego, los investigadores entrenan el modelo de aprendizaje automático utilizando una gran cantidad de árboles de fragmentación y propiedades moleculares o huellas digitales que corresponden a cada árbol.Luego se proporciona el espectro de una nueva molécula para el modelo, predice sus huellas digitales probables en función de las cuales se recupera un conjunto de moléculas de mejor coincidencia de la base de datos de moléculas.
Dependiendo del tipo de moléculas, hasta el 95 por ciento de las búsquedas devuelven el resultado de búsqueda correcto entre las 10 coincidencias principales. La precisión de la identificación mejora a medida que aumenta el volumen de datos. Actualmente, aproximadamente 6,000Se han utilizado espectros de masas para construir el modelo. En una situación ideal, el motor de búsqueda basado en aprendizaje automático siempre sugeriría la molécula correcta como la primera coincidencia, pero esto requiere un aumento considerable en el volumen de datos y un mayor desarrollo demétodos.
El estudio podría beneficiar a los investigadores en ciencias de la vida y médicas en particular. Las posibles áreas de aplicación futura incluyen trabajo antidopaje, control de drogas por parte de la Aduana e investigación de la escena del crimen.
Realizado en colaboración con un grupo de investigación dirigido por el profesor Sebastian Böcker de la Universidad de Jena, el estudio sirve como un buen ejemplo de la investigación de la Universidad de Aalto que combina la tecnología de la información con la salud digital.
Fuente de la historia :
Materiales proporcionado por Universidad de Aalto . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :