Desde 2011, una misteriosa enfermedad conocida como Síndrome del Canopy Amarillo, o YCS, ha afectado a la caña de azúcar australiana. La condición hace que las hojas del dosel medio de plantas sanas se vuelvan amarillas rápidamente hasta un grado en que el rendimiento de azúcar de la planta puede disminuiral 30 por ciento
En los últimos años, el síndrome se ha extendido por todo el continente. Las pérdidas se estiman en alrededor de $ 40 millones y los productores temen que pueda arruinar la industria en Australia.
"Al comienzo del proyecto, había muchas posibilidades pero poca evidencia para sugerir la causa", dice Kate Hertweck, profesora asistente de biología en la Universidad de Texas en Tyler UT Tyler y miembro del equipo deinvestigadores que exploran las causas de la enfermedad. "Podría ser una reacción fisiológica causada por agua o nutrientes en el suelo. O podría ser una causa biológica, como un insecto, virus u hongo".
Mientras que algunos investigadores usan experimentos de campo y microscopía para investigar la enfermedad, Hertweck y sus colaboradores de Sugar Research Australia y la Universidad de Queensland están siguiendo un enfoque genómico, utilizando la secuenciación de ARN de próxima generación para comparar y analizar datos genéticos de afectados y no afectadosplantas de diversos lugares de campo durante un período de tres años.
"La caña de azúcar es un cultivo agrícola importante", dice Kate Wathen-Dunn, técnico senior de Sugar Research Australia. "También tiene una de las genéticas más complejas conocidas, con números múltiples y variables de cada cromosoma".
En parte debido a su complejidad, la caña de azúcar no tenía previamente un genoma de referencia disponible como punto de partida de comparación para los investigadores, por lo que Hertweck y Wathen-Dunn se propusieron crear uno, específicamente para el transcriptoma de la planta: las moléculas de ARN mensajero expresadaspor los genes de un organismo, que determinan qué proteínas producirá la planta.
"Con esta referencia de transcriptoma, podríamos comparar el Síndrome del Canopy Amarillo y las muestras de control tomadas en diferentes momentos de diferentes variedades y de diferentes regiones de cultivo", dice Wathen-Dunn. "Como la cantidad de datos involucrados era enorme, la única manerahacer este ensamblaje fue en un clúster informático de alto rendimiento "
Hertweck y su equipo recurrieron a las supercomputadoras en el Centro de Computación Avanzada de Texas TACC, con sede en la Universidad de Texas en Austin, para realizar sus investigaciones a gran escala. TACC ejecuta varias de las supercomputadoras más grandes del mundo, que apoyanmiles de investigadores estadounidenses cada año.
Los ensamblajes de transcriptoma toman moléculas de ARN que han sido fragmentadas y secuenciadas, y las vuelven a poner en orden. El proceso siempre es computacionalmente intenso, pero cuando hay muchas muestras, como fue el caso con la investigación de la caña de azúcar, puede serparticularmente difícil de manejar. El equipo reunió datos de secuencias de ARN de 70 muestras de hojas y utilizó múltiples algoritmos y subsecuencias múltiples para crear un ensamblaje de novo.
"Incluso en una forma comprimida, los tamaños de archivo para los conjuntos de transcriptoma son enormes", dice Hertweck. "Comencé a darme cuenta de que necesitaba recursos informáticos mucho más grandes de los que tenía disponibles".
El transcriptoma de referencia que crearon permitió al equipo explorar cómo diferentes muestras expresan diferentes proteínas, lo que proporciona pistas sobre la causa raíz de YCS.
Hasta ahora, Hertweck y su equipo han realizado análisis genéticos diferenciales preliminares en un subconjunto de datos y están utilizando las asambleas para evaluar una variedad de hipótesis sobre lo que podría estar causando la enfermedad.
"Si se trata de bacterias, entonces hay genes que podrían expresarse. Si es un virus, podrían expresarse genes separados", dice ella. "Hemos detectado algunas diferencias que podrían ser un signo de una bacteria, pero estas sona veces también relacionado con contaminantes de laboratorio "
Investigaciones adicionales determinarán si la expresión del gen se relaciona con la verdadera causa de la enfermedad o si es una señal falsa.
También han encontrado varias señales de estrés físico o abiótico en los datos, que requieren más investigación.
"El estrés abiótico es muy importante en la expresión de los síntomas, y las plantas de caña de azúcar afectadas por YCS parecen ser más sensibles a este estrés", dice Wathen-Dunn. "Los fantásticos recursos informáticos disponibles en TACC nos permitieron continuar nuestra investigación sobre la causade YCS, y para hacer nuevos descubrimientos sobre el metabolismo de la caña de azúcar ".
Hertweck y Wathen-Dunn presentaron su investigación en la Reunión de Evolución 2016 - la conferencia anual conjunta de la Sociedad para el Estudio de la Evolución, la Sociedad de Biólogos Sistemáticos y la Sociedad Americana de Naturalistas. El trabajo también se presentó en el2016 Conferencia de la Sociedad Australiana de Bioinformática y Biología Computacional AB3ACBS.
Presentarán sus últimos resultados en la Conferencia Internacional de Agricultura Tropical 2017 en noviembre.
La capacidad de profundizar en el transcriptoma de la caña de azúcar utilizando recursos TACC ha impresionado a los colaboradores australianos de Wathen-Dunn.
"Pensaron que era increíble que tuviéramos computadoras que pueden manejar todo esto", dice ella. "Les ha animado a que algunos de sus empleados se capaciten para interactuar con recursos informáticos de alto rendimiento".
Investigación y enseñanza con sistemas TACC
Hertweck se enteró de TACC por primera vez cuando solicitó su puesto de profesora en UT Tyler. Las publicaciones de trabajo mencionaron que los investigadores podrían usar los sistemas TACC a través de la iniciativa de Ciberinfraestructura de Investigación UTRC de la Universidad de Texas, que, desde 2007, ha proporcionadoinvestigadores de cualquiera de las 14 instituciones del Sistema de la Universidad de Texas acceden a los recursos, la experiencia y la capacitación de TACC.
Hertweck asistió al TACC Summer Institute en 2015 y ha utilizado los recursos informáticos avanzados de TACC, incluidos Stampede y Lonestar 5, desde entonces para estudios genómicos de gramíneas, lirios, lirios, orquídeas y genomas de moscas de la fruta.
"Parte de la lucha por una pequeña universidad regional como la mía para poder atraer candidatos fuertes es el hecho de que no tenemos grupos locales aquí en el campus", dice Hertweck. El fácil acceso a los recursos de TACC aborda ese problema.
"Hay un gran deseo de ese tipo de recurso. La gente está muy interesada en poder aprovecharlo", dice. "Mi trabajo fue publicado con el deseo de atraer a alguien que pueda aprovechar esos recursos".y abre la puerta para que otros investigadores también los usen "
Hertweck ha hecho exactamente eso. Además de su propia investigación, Hertweck actúa como una defensora de la informática de alto rendimiento entre sus colegas y enseña cursos de bioinformática a estudiantes universitarios y estudiantes de posgrado utilizando el sistema de computación en la nube Jetstream de TACC. En sus clases, los estudiantes exploransecuencia de datos de bacterias que se están investigando para futuras aplicaciones de biocombustibles y otras especies genéticamente interesantes.
"Clases enteras de graduados y estudiantes universitarios realizan análisis básicos en sistemas TACC. Realizan asambleas y análisis básicos y ven lo que muestran las secuencias", dice Hertweck. "Se entusiasman más con la capacidad de analizar nuevos datos y encontrar cosas interesantes.Les digo: 'Vas a tener una información que nadie ha visto antes' "
Ayudar a los investigadores y estudiantes a descubrir nuevas facetas de la naturaleza: para eso están diseñados los sistemas TACC.
Fuente de la historia :
Materiales proporcionado por Universidad de Texas en Austin, Centro de Computación Avanzada de Texas . Original escrito por Aaron Dubrow. Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :