El genoma humano contiene alrededor de 20.000 genes que codifican proteínas, pero las partes codificantes de nuestros genes representan solo alrededor del 2 por ciento de todo el genoma. Durante las últimas dos décadas, los científicos han estado tratando de averiguar cuál es el 98 por ciento restantehaciendo.
Un consorcio de investigación conocido como ENCODE Encyclopedia of DNA Elements ha logrado un progreso significativo hacia ese objetivo, identificando muchas ubicaciones del genoma que se unen a proteínas reguladoras, lo que ayuda a controlar qué genes se activan o desactivan. En un nuevo estudio que también separte de ENCODE, los investigadores ahora han identificado muchos sitios adicionales que codifican moléculas de ARN que probablemente influyan en la expresión génica.
Estas secuencias de ARN no se traducen en proteínas, sino que actúan de diversas formas para controlar la cantidad de proteína que se produce a partir de los genes que codifican proteínas. El equipo de investigación, que incluye a científicos del MIT y varias otras instituciones, utilizó ARN-unir proteínas para ayudarlas a localizar y asignar posibles funciones a decenas de miles de secuencias del genoma.
"Este es el primer análisis genómico funcional a gran escala de proteínas de unión a ARN con múltiples técnicas diferentes", dice Christopher Burge, profesor de biología del MIT. "Con las tecnologías para estudiar proteínas de unión a ARN acercándose ahora al nivel de aquellasque han estado disponibles para estudiar las proteínas de unión al ADN, esperamos llevar la función del ARN más plenamente al mundo genómico ".
Burge es uno de los autores principales del estudio, junto con Xiang-Dong Fu y Gene Yeo de la Universidad de California en San Diego, Eric Lecuyer de la Universidad de Montreal y Brenton Graveley de UConn Health.
Los autores principales del estudio, que aparece hoy en Naturaleza , son Peter Freese, un reciente doctor en Biología Computacional y de Sistemas del MIT; Eric Van Nostrand, Gabriel Pratt y Rui Xiao de UCSD; Xiaofeng Wang de la Universidad de Montreal; y Xintao Wei de UConn Health.
regulación de ARN
Hasta ahora, gran parte del proyecto ENCODE se ha basado en la detección de secuencias reguladoras de ADN mediante una técnica llamada ChIP-seq. Esta técnica permite a los investigadores identificar sitios de ADN que están unidos a proteínas de unión al ADN, como los factores de transcripción, lo que ayuda a determinar lafunciones de esas secuencias de ADN.
Sin embargo, señala Burge, esta técnica no detectará elementos genómicos que deban copiarse en el ARN antes de involucrarse en la regulación genética. En cambio, el equipo de ARN se basó en una técnica conocida como eCLIP, que usa luz ultravioleta para entrecruzarMoléculas de ARN con proteínas de unión a ARN RBP dentro de las células. Luego, los investigadores aíslan las RBP específicas utilizando anticuerpos y secuencian los ARN a los que estaban unidos.
Las RBP tienen muchas funciones diferentes: algunas son factores de empalme, que ayudan a cortar secciones de ARN mensajero que codifica proteínas, mientras que otras terminan la transcripción, mejoran la traducción de proteínas, descomponen el ARN después de la traducción o guían el ARN a una ubicación específica enla célula. La determinación de las secuencias de ARN que están unidas a las RBP puede ayudar a revelar información sobre la función de esas moléculas de ARN.
"Los sitios de unión de RBP son elementos funcionales candidatos en el transcriptoma", dice Burge. "Sin embargo, no todos los sitios de unión tienen una función, por lo que es necesario complementar eso con otros tipos de ensayos para evaluar la función".
Los investigadores realizaron eCLIP en aproximadamente 150 RBP e integraron esos resultados con datos de otro conjunto de experimentos en los que derribaron la expresión de aproximadamente 260 RBP, una a la vez, en células humanas. Luego midieron los efectos de esta eliminaciónsobre las moléculas de ARN que interactúan con la proteína.
Utilizando una técnica desarrollada por el laboratorio de Burge, los investigadores también pudieron determinar con mayor precisión dónde se unen las RBP al ARN. Esta técnica, conocida como ARN Bind-N-Seq, revela secuencias muy cortas, que a veces contienen motivos estructurales comoprotuberancias u horquillas, a las que se unen las RBP.
En general, los investigadores pudieron estudiar alrededor de 350 de las 1500 RBP humanas conocidas, utilizando una o más de estas técnicas por proteína. Los factores de empalme de ARN a menudo tienen una actividad diferente dependiendo de dónde se unen en una transcripción, por ejemplo, activando el empalme cuandose unen en un extremo de un intrón y lo reprimen cuando se unen en el otro extremo. La combinación de los datos de estas técnicas permitió a los investigadores producir un "atlas" de mapas que describen cómo la actividad de cada RBP depende de su ubicación de unión.
"Por qué se activan en un lugar y reprimen cuando se unen a otro lugar es un rompecabezas de larga data", dice Burge. "Pero tener este conjunto de mapas puede ayudar a los investigadores a descubrir qué características de las proteínas están asociadas con cada patrón de actividad."
Además, el grupo de Lecuyer en la Universidad de Montreal usó proteína verde fluorescente para etiquetar más de 300 RBP y señalar sus ubicaciones dentro de las células, como el núcleo, el citoplasma o las mitocondrias. Esta información de ubicación también puede ayudar a los científicos a aprender mássobre las funciones de cada RBP y el ARN al que se une.
Vinculación de ARN y enfermedad
Muchos laboratorios de investigación de todo el mundo están utilizando estos datos en un esfuerzo por descubrir vínculos entre algunas de las secuencias de ARN identificadas y enfermedades humanas. Para muchas enfermedades, los investigadores han identificado variantes genéticas llamadas polimorfismos de un solo nucleótido SNP que son más comunesen personas con una enfermedad en particular.
"Si ocurren en una región codificadora de proteínas, puede predecir los efectos sobre la estructura y función de las proteínas, lo cual se hace todo el tiempo. Pero si ocurren en una región no codificante, es más difícil averiguar qué pueden estar haciendo", Dice Burge." Si golpean una región no codificante que identificamos como que se une a un RBP e interrumpen el motivo del RBP, entonces podríamos predecir que el SNP puede alterar el empalme o la estabilidad del gen ".
Burge y sus colegas ahora planean usar sus técnicas basadas en ARN para generar datos sobre proteínas de unión de ARN adicionales.
"Este trabajo proporciona un recurso que la comunidad genética humana puede utilizar para ayudar a identificar variantes genéticas que funcionan a nivel de ARN", dice.
La investigación fue financiada por el Proyecto ENCODE del Instituto Nacional de Investigación del Genoma Humano, así como una subvención del Fonds de Recherche de Québec-Santé.
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Anne Trafton. Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :