Las condiciones ambientales, las opciones de estilo de vida, la exposición a sustancias químicas y los patógenos transmitidos por los alimentos y el aire se encuentran entre los factores externos que pueden causar enfermedades. Por el contrario, los factores genéticos internos pueden ser responsables del inicio y la progresión de enfermedades que van desde trastornos neurológicos degenerativos hasta algunos tipos de cáncer.
Un equipo dirigido por Ivaylo Ivanov de la Universidad Estatal de Georgia usó el sistema IBM AC922 Summit de 200 petaflop, la supercomputadora más inteligente y poderosa del mundo, para desarrollar un modelo integrador del complejo de preiniciación de transcripción PIC, un complejo de proteínas vitales paraexpresión génica. Los resultados de este trabajo se publican en Naturaleza, biología estructural y molecular .
La expresión génica implica la conversión de información genética que se origina en el ADN para producir moléculas funcionales como las proteínas, los componentes básicos de todos los organismos vivos, a través de pasos conocidos como transcripción y traducción. Debido a que las mutaciones genéticas pueden interferir con la expresión génica y causarenfermedad, los científicos biomédicos están particularmente interesados en dar sentido a la conexión entre la composición genética o el genotipo único de un paciente y la manifestación externa de una enfermedad o fenotipo.
Una mejor comprensión de la compleja relación entre un genotipo y un fenotipo podría revelar cómo las mutaciones causan enfermedades genéticas y, por lo tanto, informar el desarrollo de tratamientos más efectivos. Los investigadores aún no comprenden completamente cómo las mutaciones hereditarias afectan la función de las proteínas.
"Al igual que un engranaje roto en una máquina, los cambios mutacionales descomponen la función de la proteína defectuosa, un proceso que implica alteraciones tanto en la estructura como en la dinámica", dijo Ivanov. "Esta confluencia de factores presenta un desafío para los métodos convencionales de biología estructural"
A lo largo del complejo y altamente regulado proceso de transcripción génica, las enzimas llamadas Pol I, Pol II y Pol III, denominadas colectivamente ARN polimerasas, juegan un papel importante. Pol II ayuda a mediar la síntesis de proteínas, el proceso de transformacióninformación genética en proteínas.
Durante el inicio - el primer paso de la transcripción - Pol II y una serie de factores de transcripción generales GTF se ensamblan en una región de ADN llamada promotor para formar el PIC. La apertura del promotor depende del factor de transcripción II humano TFIIH, un GTF que consta de múltiples cadenas de proteínas, que tiene la capacidad de desenrollar las cadenas de ADN de doble hélice para iniciar la transcripción. TFIIH también contribuye a la reparación del ADN.
Debido a que las vías bioquímicas responsables de la expresión y reparación de genes están entrelazadas, comprender el mecanismo molecular detrás de este proceso es crucial para el avance de las aplicaciones biomédicas. Por ejemplo, la presencia de mutaciones en tres subunidades de TFIIH conduce directamente a enfermedades genéticas graves, incluidas las autoinmunesy trastornos neurológicos.
Los intentos anteriores para caracterizar el PIC se han visto limitados por modelos incompletos. El modelo más completo del PIC hasta la fecha, la nueva versión del equipo proporciona información superior sobre las organizaciones estructurales de estas proteínas, que transcriben genes y reparan el ADN.
Para desarrollar su modelo PIC, los investigadores combinaron datos de microscopía crioelectrónica CryoEM, un método de biología estructural que utiliza un haz de electrones para estudiar muestras de proteínas congeladas criogénicamente, y simulaciones de dinámica molecular a gran escala en Summit utilizandoCódigo de Dinámica Molecular a Nanoescala NAMD. La Cumbre se encuentra en la Instalación de Computación de Liderazgo de Oak Ridge OLCF, una Instalación de Usuario de la Oficina de Ciencia del Departamento de Energía de los Estados Unidos DOE en el Laboratorio Nacional Oak Ridge ORNL del DOE.
"El nuevo modelo nos brinda la visión más completa de la estructura de TFIIH, lo que nos ayuda a comprender la dinámica de estas proteínas y nos permite mapear los orígenes de las mutaciones derivadas del paciente, lo que posiblemente permita futuros experimentos bioquímicos centrados en comprender los mecanismos estructuralesde TFIIH ", dijo Ivanov.
Las simulaciones revelaron la organización jerárquica del PIC y explicaron cómo sus numerosos componentes estructurales funcionan para modificar el ADN. Al mapear 36 mutaciones diferentes derivadas del paciente al modelo PIC, el equipo determinó que las mutaciones tienden a agruparse en áreas cruciales de TFIIH, incluida una subunidad conocida como XPD, que impide que el GTF funcione correctamente y provoca enfermedades.
"La computación es absolutamente instrumental para proporcionar un vínculo entre la estructura, que proviene de los datos de CryoEM, y el fenotipo de la enfermedad, que es un concepto de alto nivel difícil de explicar con respuestas basadas exclusivamente en la bioquímica tradicional y la biología estructural", dijo Ivanov.
A partir de estos hallazgos, el equipo obtuvo información detallada sobre tres trastornos genéticos distintos asociados con el cáncer, el envejecimiento y los defectos de desarrollo al revelar sus mecanismos moleculares distintivos.
"Si tiene un control sobre qué regiones de una proteína se ven afectadas, entonces puede desarrollar terapias para enfermedades genéticas, pero sin una comprensión fundamental del mecanismo subyacente, todas las apuestas están canceladas", dijo Ivanov.
Este logro proporciona una base para futuros esfuerzos experimentales y computacionales que podrían identificar con precisión las mutaciones que causan trastornos genéticos, exponer las contribuciones distintas de TFIIH a la transcripción y la reparación del ADN, y profundizar en los mecanismos de expresión génica.
Aunque esta investigación hubiera sido factible en otras plataformas informáticas de alto rendimiento, el acceso a Summit aceleró significativamente las simulaciones del equipo.
"Running on Summit acelera nuestra investigación", dijo Ivanov. "En lugar de pasar varios meses corriendo en otro sistema, pudimos completar nuestros cálculos en cuestión de días, lo que nos ahorró mucho tiempo y esfuerzo".
Este año, el equipo realizará cálculos relacionados en la Cumbre a través de una asignación del programa INCITE de impacto computacional innovador y novedoso de 2019. Los investigadores han estudiado principalmente Pol II, pero planean expandir su proyecto para investigar el funcionamientodinámica de Pol I y Pol III también, lo que podría conducir a ideas más innovadoras.
"Esperamos ir más allá de la mera descripción de los mecanismos de transcripción para dilucidar su conexión con las enfermedades genéticas", dijo Ivanov.
Fuente de la historia :
Materiales proporcionado por DOE / Laboratorio Nacional de Oak Ridge . Original escrito por Elizabeth Rosenthal. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :