Uno de los desafíos en el uso del aprendizaje automático para el desarrollo de medicamentos es crear un proceso para que la computadora extraiga la información necesaria de un grupo de puntos de datos. Los científicos de drogas deben extraer datos biológicos y entrenar el software para comprender cómo funcionará un cuerpo humano típicointeractuar con las combinaciones que se unen para formar un medicamento.
Los investigadores de descubrimiento de drogas de la Universidad de Purdue han creado un nuevo marco para extraer datos para entrenar modelos de aprendizaje automático. El marco, llamado Lemon, ayuda a los investigadores de drogas a extraer mejor la Base de Datos de Proteínas PDB, un recurso integral con más de 140,000 estructuras biomolecularesy con nuevos lanzamientos cada semana. El trabajo se publica en la edición del 15 de octubre de Bioinformática .
"PDB es una herramienta esencial para la comunidad de descubrimiento de drogas", dijo Gaurav Chopra, profesor asistente de química analítica y física en la Facultad de Ciencias de Purdue que trabaja con otros investigadores en el Instituto de Descubrimiento de Drogas de Purdue y dirigió el equipo que creóLemon ". El problema es que puede tomar una enorme cantidad de tiempo clasificar todos los datos acumulados. El aprendizaje automático puede ayudar, pero aún necesita un marco sólido desde el cual la computadora pueda analizar rápidamente los datos para ayudar en la creación de información segura.y medicamentos efectivos "
La plataforma de software de Lemon es una biblioteca rápida de C ++ 11 con enlaces de Python que extrae el PDB en minutos. La carga de todos los archivos mmCIF tradicionales en el PDB toma aproximadamente 290 minutos, pero Lemon hace esto en aproximadamente seis minutos cuando aplica un flujo de trabajo simpleen una máquina de 8 núcleos. Lemon permite al usuario escribir funciones personalizadas, incluirlas como parte de su paquete de software y desarrollar funciones personalizadas de manera estándar para generar conjuntos de datos de evaluación comparativa únicos para toda la comunidad científica.
"Las estructuras experimentales depositadas en PDB han resultado en varios avances para las comunidades científicas y educativas de biología estructural y computacional que ayudan a avanzar en el desarrollo de fármacos y otras áreas", dijo Jonathan Fine, un estudiante de doctorado en química que trabajó con Chopra para desarrollar la plataforma."Creamos Lemon como una ventanilla única para extraer rápidamente todo el banco de datos y extraer la información biológica útil que es clave para el desarrollo de medicamentos".
Lemon obtuvo su nombre, ya que fue diseñado originalmente para crear conjuntos de referencia para el software de diseño de fármacos e identificar los limones, las interacciones biomoleculares que no se pueden modelar bien, en el PDB.
El trabajo de desarrollo de software es el último proyecto que involucra innovaciones en salud de Chopra y su equipo. Lemon está disponible gratuitamente en GitHub en http://github.com/chopralab/lemon . La documentación detallada está disponible en http://chopralab.github.io/lemon/latest/index.html .
Chopra también trabajó con la Oficina de Comercialización de Tecnología de la Fundación de Investigación Purdue para patentar otras innovaciones de su laboratorio.
Fuente de la historia :
Materiales proporcionado por Universidad de Purdue . Original escrito por Chris Adam. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :