Si ha comido hamburguesas veganas que saben a carne o ha utilizado colágeno sintético en su rutina de belleza, ambos productos "cultivados" en el laboratorio, se ha beneficiado de la biología sintética. Es un campo lleno de potencial, ya que permite a los científicos diseñar sistemas biológicos según las especificaciones, como la ingeniería de un microbio para producir un agente que combate el cáncer. Sin embargo, los métodos convencionales de bioingeniería son lentos y laboriosos, siendo el método de prueba y error el enfoque principal.
Ahora los científicos del Laboratorio Nacional Lawrence Berkeley del Departamento de Energía Berkeley Lab han desarrollado una nueva herramienta que adapta los algoritmos de aprendizaje automático a las necesidades de la biología sintética para guiar el desarrollo de manera sistemática. La innovación significa que los científicos no tendrán que pasar años desarrollando uncomprensión meticulosa de cada parte de una célula y lo que hace para manipularla; en cambio, con un conjunto limitado de datos de entrenamiento, los algoritmos pueden predecir cómo los cambios en el ADN o la bioquímica de una célula afectarán su comportamiento y luego hacer recomendacionespara el siguiente ciclo de ingeniería junto con predicciones probabilísticas para lograr el objetivo deseado.
"Las posibilidades son revolucionarias", dijo Héctor García Martín, investigador de la División de Ingeniería y Sistemas Biológicos BSE de Berkeley Lab que dirigió la investigación. "En este momento, la bioingeniería es un proceso muy lento. Se necesitaron 150 años-persona paracrear el medicamento contra la malaria, la artemisinina. Si puede crear nuevas células según las especificaciones en un par de semanas o meses en lugar de años, realmente podría revolucionar lo que puede hacer con la bioingeniería ".
Trabajando con la científica de datos de la EEB Tijana Radivojevic y un grupo internacional de investigadores, el equipo desarrolló y demostró un algoritmo pendiente de patente llamado Herramienta de recomendación automatizada ART, que se describe en un par de artículos publicados recientemente en la revista Comunicaciones de la naturaleza . El aprendizaje automático permite a las computadoras hacer predicciones después de "aprender" a partir de cantidades sustanciales de datos de "capacitación" disponibles.
En "ART: una herramienta de recomendación automatizada de aprendizaje automático para biología sintética", dirigida por Radivojevic, los investigadores presentaron el algoritmo, que se adapta a las particularidades del campo de la biología sintética: pequeños conjuntos de datos de entrenamiento, la necesidad de cuantificar la incertidumbre,y ciclos recursivos. Las capacidades de la herramienta se demostraron con datos simulados e históricos de proyectos de ingeniería metabólica anteriores, como mejorar la producción de biocombustibles renovables.
En "Combinando modelos mecanicistas y de aprendizaje automático para la ingeniería predictiva y la optimización del metabolismo del triptófano", el equipo utilizó ART para guiar el proceso de ingeniería metabólica para aumentar la producción de triptófano, un aminoácido con varios usos, por una especie de levadura llamadaSaccharomyces cerevisiae, o levadura de panadería. El proyecto fue dirigido por Jie Zhang y Soren Petersen del Centro de Biosostenibilidad de la Fundación Novo Nordisk de la Universidad Técnica de Dinamarca, en colaboración con científicos de Berkeley Lab y Teselagen, una empresa de nueva creación con sede en San Francisco.
Para llevar a cabo el experimento, seleccionaron cinco genes, cada uno controlado por diferentes promotores de genes y otros mecanismos dentro de la célula y que representan, en total, cerca de 8.000 combinaciones potenciales de vías biológicas. Los investigadores en Dinamarca luego obtuvieron datos experimentales sobre 250 de esosvías, que representan solo el 3% de todas las combinaciones posibles, y esos datos se utilizaron para entrenar el algoritmo. En otras palabras, ART aprendió qué salida producción de aminoácidos está asociada con qué entrada expresión génica.
Luego, mediante inferencia estadística, la herramienta pudo extrapolar cómo cada una de las más de 7,000 combinaciones restantes afectaría la producción de triptófano. El diseño que finalmente recomendó aumentó la producción de triptófano en un 106% sobre la cepa de referencia de última generacióny en un 17% sobre los mejores diseños utilizados para entrenar el modelo.
"Esta es una demostración clara de que la bioingeniería dirigida por el aprendizaje automático es factible, y disruptiva si es escalable. Lo hicimos para cinco genes, pero creemos que podría hacerse para el genoma completo", dijo García Martín, quien es miembrode Agile BioFoundry y también el Director del equipo de Modelado Metabólico Cuantitativo del Joint BioEnergy Institute JBEI, un Centro de Investigación de Bioenergía del DOE; ambos apoyaron una parte de este trabajo. "Esto es solo el comienzo. Con esto, hemosdemostró que hay una forma alternativa de hacer ingeniería metabólica. Los algoritmos pueden realizar automáticamente las partes rutinarias de la investigación mientras usted dedica su tiempo a las partes más creativas del esfuerzo científico: decidir sobre las preguntas importantes, diseñar los experimentos y consolidar el conocimiento obtenido. "
se necesitan más datos
Los investigadores dicen que se sorprendieron por la poca información que se necesitaba para obtener resultados. Sin embargo, para realmente darse cuenta del potencial de la biología sintética, dicen que los algoritmos necesitarán ser entrenados con muchos más datos. García Martín describe la biología sintética como solo en sula infancia, el equivalente a donde estaba la Revolución Industrial en la década de 1790. "Solo invirtiendo en automatización y tecnologías de alto rendimiento podrá aprovechar los datos necesarios para revolucionar realmente la bioingeniería", dijo.
Radivojevic agregó: "Proporcionamos la metodología y una demostración en un pequeño conjunto de datos; las aplicaciones potenciales podrían ser revolucionarias dado el acceso a grandes cantidades de datos".
Las capacidades únicas de los laboratorios nacionales
Además de la escasez de datos experimentales, García Martín dice que la otra limitación es el capital humano, o los expertos en aprendizaje automático. Dada la explosión de datos en nuestro mundo actual, muchos campos y empresas compiten por un número limitado de expertos en aprendizaje automático.e inteligencia artificial.
García Martín señala que el conocimiento de biología no es un prerrequisito absoluto, si está rodeado por el ambiente de equipo proporcionado por los laboratorios nacionales. Radivojevic, por ejemplo, tiene un doctorado en matemáticas aplicadas y no tiene experiencia en biología. "En dos años aquí,ella pudo colaborar productivamente con nuestro equipo multidisciplinario de biólogos, ingenieros e informáticos y marcar la diferencia en el campo de la biología sintética ", dijo." En las formas tradicionales de hacer ingeniería metabólica, ella habría tenido que gastar cinco o másseis años simplemente aprendiendo el conocimiento biológico necesario antes incluso de comenzar sus propios experimentos independientes ".
"Los laboratorios nacionales proporcionan el entorno donde la especialización y la estandarización pueden prosperar y combinarse en los grandes equipos multidisciplinarios que son su sello distintivo", dijo García Martín.
La biología sintética tiene el potencial de generar impactos significativos en casi todos los sectores: alimentos, medicamentos, agricultura, clima, energía y materiales. El mercado mundial de biología sintética se estima actualmente en alrededor de $ 4 mil millones y se prevé que crezca a más de$ 20 mil millones para 2025, según varios informes de mercado.
"Si pudiéramos automatizar la ingeniería metabólica, podríamos luchar por objetivos más audaces. Podríamos diseñar microbiomas con fines terapéuticos o de biorremediación. Podríamos diseñar microbiomas en nuestro intestino para producir medicamentos para tratar el autismo, por ejemplo, o microbiomas en el medio ambienteque convierten los residuos en biocombustibles ", dijo García Martín." La combinación de aprendizaje automático y edición de genes basada en CRISPR permite una convergencia mucho más eficiente a las especificaciones deseadas ".
Fuente de la historia :
Materiales proporcionado por DOE / Laboratorio Nacional Lawrence Berkeley . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :