Una razón por la que es tan difícil producir vacunas eficaces contra algunos virus, incluidos la influenza y el VIH, es que estos virus mutan muy rápidamente. Esto les permite evadir los anticuerpos generados por una vacuna en particular, a través de un proceso conocido como "escape viral"."
Los investigadores del MIT han ideado ahora una nueva forma de modelar computacionalmente el escape viral, basándose en modelos que se desarrollaron originalmente para analizar el lenguaje. El modelo puede predecir qué secciones de proteínas de la superficie viral tienen más probabilidades de mutar de una manera que permita el escape viral,y también puede identificar secciones que tienen menos probabilidades de mutar, lo que las convierte en buenos objetivos para nuevas vacunas.
"El escape viral es un gran problema", dice Bonnie Berger, profesora de Matemáticas de Simons y jefa del grupo de Computación y Biología en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT. "Escape viral de la proteína de la superficie de la influenza y la superficie de la envolturala proteína del VIH son muy responsables del hecho de que no tenemos una vacuna universal contra la gripe, ni tenemos una vacuna para el VIH, los cuales causan cientos de miles de muertes al año ".
en un estudio que aparece hoy en ciencia , Berger y sus colegas identificaron posibles dianas para las vacunas contra la influenza, el VIH y el SARS-CoV-2. Desde que se aceptó ese artículo para su publicación, los investigadores también han aplicado su modelo a las nuevas variantes de SARS-CoV-2 quesurgió recientemente en el Reino Unido y Sudáfrica. Ese análisis, que aún no ha sido revisado por pares, marcó las secuencias genéticas virales que deberían investigarse más a fondo por su potencial para escapar de las vacunas existentes, dicen los investigadores.
Berger y Bryan Bryson, profesor asistente de ingeniería biológica en el MIT y miembro del Instituto Ragon de MGH, MIT y Harvard, son los autores principales del artículo, y el autor principal es el estudiante graduado del MIT Brian Hie.
El lenguaje de las proteínas
Los diferentes tipos de virus adquieren mutaciones genéticas a diferentes velocidades, y el VIH y la influenza se encuentran entre los que mutan más rápido. Para que estas mutaciones promuevan el escape viral, deben ayudar al virus a cambiar la forma de sus proteínas de superficie para que los anticuerpos no puedanya no se unen a ellos. Sin embargo, la proteína no puede cambiar de una manera que la haga no funcional.
El equipo del MIT decidió modelar estos criterios utilizando un tipo de modelo computacional conocido como modelo de lenguaje, del campo del procesamiento del lenguaje natural NLP. Estos modelos fueron originalmente diseñados para analizar patrones en el lenguaje, específicamente, la frecuencia que conciertas palabras aparecen juntas. Los modelos pueden entonces hacer predicciones de qué palabras podrían usarse para completar una oración como "Sally comió huevos por ..." La palabra elegida debe ser gramaticalmente correcta y tener el significado correcto. En este ejemplo,un modelo de PNL podría predecir "desayuno" o "almuerzo".
La idea clave de los investigadores fue que este tipo de modelo también podría aplicarse a información biológica, como secuencias genéticas. En ese caso, la gramática es análoga a las reglas que determinan si la proteína codificada por una secuencia en particular es funcional o no.y el significado semántico es análogo a si la proteína puede tomar una nueva forma que le ayude a evadir anticuerpos. Por lo tanto, una mutación que permite el escape viral debe mantener la gramaticalidad de la secuencia pero cambiar la estructura de la proteína de una manera útil.
"Si un virus quiere escapar del sistema inmunológico humano, no quiere mutar para que muera o no pueda replicarse", dice Hie. "Quiere preservar la aptitud pero disfrazarse lo suficiente para que sea indetectablepor el sistema inmunológico humano. "
Para modelar este proceso, los investigadores entrenaron un modelo de PNL para analizar patrones encontrados en secuencias genéticas, lo que le permite predecir nuevas secuencias que tienen nuevas funciones pero aún siguen las reglas biológicas de la estructura de la proteína. Una ventaja significativa de este tipo de modeladoes que solo requiere información de secuencia, que es mucho más fácil de obtener que las estructuras de proteínas. El modelo puede entrenarse con una cantidad relativamente pequeña de información; en este estudio, los investigadores utilizaron 60,000 secuencias de VIH, 45,000 secuencias de influenza y 4,000 de coronavirussecuencias.
"Los modelos de lenguaje son muy poderosos porque pueden aprender esta compleja estructura de distribución y obtener una idea de la función solo a partir de la variación de secuencia", dice Hie. "Tenemos este gran corpus de datos de secuencia viral para cada posición de aminoácido, y el modeloaprende estas propiedades de la co-ocurrencia y co-variación de aminoácidos a través de los datos de entrenamiento ".
Bloqueo de escape
Una vez que se entrenó el modelo, los investigadores lo usaron para predecir las secuencias de la proteína de pico de coronavirus, la proteína de la envoltura del VIH y la proteína de hemaglutinina HA de la influenza que serían más o menos propensas a generar mutaciones de escape.
Para la influenza, el modelo reveló que las secuencias con menos probabilidades de mutar y producir un escape viral estaban en el tallo de la proteína HA. Esto es consistente con estudios recientes que muestran que los anticuerpos que se dirigen al tallo de HA que la mayoría de las personas infectadas con la gripeo vacunados contra ella no se desarrollan pueden ofrecer una protección casi universal contra cualquier cepa de la gripe.
El análisis del modelo de coronavirus sugirió que una parte de la proteína de pico llamada subunidad S2 tiene menos probabilidades de generar mutaciones de escape. La pregunta sigue siendo la rapidez con la que muta el virus SARS-CoV-2, por lo que se desconoce cuánto tiempoLas vacunas que se están implementando ahora para combatir la pandemia Covid-19 seguirán siendo efectivas. La evidencia inicial sugiere que el virus no muta tan rápidamente como la influenza o el VIH. Sin embargo, los investigadores identificaron recientemente nuevas mutaciones que han aparecido en Singapur, Sudáfrica yMalasia, que creen que debería investigarse por un posible escape viral estos nuevos datos aún no han sido revisados por pares.
En sus estudios del VIH, los investigadores encontraron que la región hipervariable V1-V2 de la proteína tiene muchas mutaciones de escape posibles, lo cual es consistente con hallazgos previos, y también encontraron secuencias que tendrían una menor probabilidad de escape.
Los investigadores ahora están trabajando con otros para usar su modelo a fin de identificar posibles dianas para las vacunas contra el cáncer que estimulan el propio sistema inmunológico del cuerpo para destruir tumores. Dicen que también podría usarse para diseñar medicamentos de molécula pequeña que podrían tener menos probabilidades deprovocan resistencia, para enfermedades como la tuberculosis.
"Hay tantas oportunidades, y lo hermoso es que todo lo que necesitamos son datos de secuencia, que son fáciles de producir", dice Bryson.
La investigación fue financiada por una beca de posgrado en ciencias e ingeniería de la defensa nacional del Departamento de Defensa y una beca de investigación de posgrado de la Fundación Nacional de Ciencias.
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Anne Trafton. Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :