Las tecnologías de secuenciación de ADN de próxima generación han inundado las bases de datos y los discos duros en todo el mundo con grandes conjuntos de datos, pero ¿están los investigadores aprovechando al máximo este diluvio de datos? En un nuevo estudio publicado en la edición de octubre de Aplicaciones en Ciencias de las plantas , el Dr. Brent Berger y sus colegas proponen una forma de separar el oro restante de los conjuntos de datos de secuencia grande. Los autores muestran que se puede utilizar una nueva técnica de minería de datos para obtener información valiosa de los conjuntos de datos existentes, y demostrar el concepto medianterecuperando la secuencia de genes que influyen en las estructuras florales peculiares observadas en la familia de plantas Goodeniaceae.
la secuenciación del ADN se ha vuelto tan barata que incluso si un investigador solo está realmente interesado en la secuencia de unos pocos genes, a menudo es más práctico simplemente secuenciar todo el genoma. Las técnicas bioinformáticas pueden seleccionar la secuencia de genes deseada más tarde, con menosmolestia que atacar genes específicos para secuenciar. Esta práctica, conocida como "desnatado genómico", se ha convertido en una forma cada vez más popular de responder preguntas sobre las relaciones entre especies de plantas
La premisa del desnatado del genoma es usar la secuencia de escopeta de baja cobertura para recuperar la secuencia de ADN de las fracciones de alta copia del genoma. En la secuencia de escopeta, el genoma se divide en pequeños trozos para secuenciar, y luego se vuelve a unir computacionalmente usandolas superposiciones entre los fragmentos, un proceso llamado ensamblaje. La cantidad de "cobertura" corresponde a cuántos de esos fragmentos pequeños se secuencian; cuanto mayor es la cobertura, más fácil es volver a unir el genoma, lo que resulta en un genoma más completosecuencia.
Pero una mayor cobertura es más costosa, y algunas preguntas pueden responderse con una secuencia de secuenciación más barata y de baja cobertura. Las "fracciones de alta copia" del ADN genómico total, como los genomas de cloroplastos o el ADN ribosómico nuclear, tienen mayor abundancia enel conjunto de secuencias, por lo que puede secuenciarse por completo incluso en corridas baratas y de baja cobertura. La secuencia de estas fracciones genómicas de alta copia se usa típicamente para resolver las relaciones evolutivas entre diferentes especies y grupos. Pero en el proceso de descremado genómico, los investigadores produceny luego descartar grandes cantidades de datos de secuencia potencialmente valiosos. "Muchos conjuntos de datos de desnatado del genoma se utilizan para ensamblar el genoma del cloroplasto, que en nuestro caso, solo utilizó el 3% de los datos secuenciados", comentó la Dra. Dianella Howarth, una coautor en el estudio.
En este estudio, los autores analizaron por segunda vez un conjunto de datos de desnatado del genoma utilizado anteriormente para resolver las relaciones evolutivas en las Goodeniaceae, una familia de plantas comúnmente llamadas "flores de abanico" o "medias flores" debido a su intrigante forma de flor, que parece que alguien cortó la flor por la mitad. Los autores querían ver si este conjunto de datos de desnatado del genoma podría ser conectado para obtener más información sobre la genética detrás de esta estructura floral única. Usaron varios paquetes de software para ensamblar fragmentos de secuencia no utilizados previamentela fracción de copia baja del conjunto original de datos de eliminación del genoma. Luego buscaron en el conjunto resultante la secuencia de un conjunto de genes llamados CICLOIDEA genes, que están involucrados en la estructura floral y la simetría.
Los autores pudieron recuperar suficientes porciones de los genes, de múltiples especies, para crear alineaciones completas de los cuatro CICLOIDEA genes en el núcleo de Goodeniaceae. Estos datos podrían resultar útiles para futuros estudios sobre la evolución de la extraña estructura floral observada en este grupo ". Comparación de secuencias de CICLOIDEA los genes similares en este clado podrían proporcionar pistas sobre los cambios precisos de secuencia que resultan en cambios en la morfología floral ", explicó el Dr. Howarth.
En términos más generales, el Dr. Howarth continuó: "Las piezas de cualquier gen de interés podrían extraerse de conjuntos de datos de desnatado del genoma que ya se han completado". Una pieza de un gen puede no parecer mucho, pero hay una sorpresanúmero de usos para estos fragmentos ". Estos datos podrían proporcionar suficiente información para determinar regiones nucleares útiles para análisis filogenéticos o identificar posibles eventos de duplicación de genes. Además, las sondas para la secuenciación de enriquecimiento objetivo podrían generarse rápidamente a través de un clado para examinar los genes candidatos y su regulaciónregiones en estudios evo-devo "
Los enfoques de minería de datos como estos permiten un uso mucho más completo de los conjuntos de datos de eliminación del genoma. Esto permite responder preguntas importantes con los datos existentes y abre la puerta a los científicos sin acceso a los recursos para producir conjuntos de datos a gran escala.- por ejemplo, científicos en colegios o países más pequeños sin grandes organismos que otorgan subvenciones. A medida que los datos de la secuencia de ADN continúan llegando, estudios como este señalan formas de asegurarse de que no permitamos que la información valiosa pase flotando.
Fuente de la historia :
Materiales proporcionados por Sociedad Botánica de América . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :