Si bien los investigadores de la Universidad de Clemson han anunciado recientemente una serie de avances en las ciencias agrícolas y de la vida, el tamaño de los conjuntos de datos que ahora están utilizando para facilitar estos logros es como una montaña en comparación con un molehill con respecto a lo que estaba disponible solo unhace pocos años.
Pero a medida que la cantidad de "Big Data" que se genera y comparte en toda la comunidad científica continúa creciendo exponencialmente, han surgido nuevos problemas. ¿Dónde deberían almacenarse y compartirse todos estos datos de manera rentable? ¿Cómo puede ser más¿Cómo se transfieren eficientemente a través de redes de datos avanzadas? ¿Cómo interactuarán los investigadores con los datos y la infraestructura informática global?
Un equipo de científicos pioneros y tecnólogos de la información en Clemson está trabajando arduamente para responder estas preguntas estudiando formas de simplificar la colaboración y mejorar la eficiencia.
"Utilizo conjuntos de datos genómicos para encontrar interacciones genéticas en varias especies de cultivos", dijo Alex Feltus, profesor asociado de genética y bioquímica en Clemson. "Mi objetivo es avanzar los ciclos de desarrollo de cultivos para hacer que los cultivos crezcan lo suficientemente rápido como para satisfacer la demandafrente a las nuevas realidades económicas impuestas por el cambio climático. En el proceso de hacerlo, también me he convertido en un científico de Big Data que tiene que transferir datos a través de redes y procesarlos muy rápidamente utilizando supercomputadoras como el Cluster Palmetto en Clemson.Recientemente me encontré, especialmente en los últimos años, tropezando con algunos cuellos de botella bastante serios que han disminuido mi capacidad para hacer mi mejor trabajo posible ".
Big Data, definido como conjuntos de datos demasiado grandes y complejos para que las computadoras tradicionales los manejen, se está extrayendo de formas nuevas e innovadoras para analizar computacionalmente patrones, tendencias y asociaciones dentro del campo de la genómica y una amplia gama de otras disciplinas. Pero significativoLos retrasos en la transferencia de Big Data pueden hacer que los científicos renuncien a un proyecto incluso antes de que comiencen.
"Hay muchas tecnologías disponibles en la actualidad que pueden resolver el problema de transferencia de Big Data", dijo Kuang-Ching "KC" Wang, profesor asociado en ingeniería eléctrica e informática y también director de tecnología de redes en Clemson ". Es una experiencia emocionanteEs hora de que los investigadores de genómica transformen enormemente sus flujos de trabajo aprovechando las tecnologías avanzadas de redes y computación. Pero para que todas estas tecnologías funcionen juntas de la manera correcta se requiere una ingeniería compleja. Y es por eso que alentamos a los investigadores de genómica a colaborar con sus recursos de TI locales, queincluyen ingenieros de TI y científicos informáticos. Este tipo de colaboración interdisciplinaria refleja las tendencias nacionales de investigación ".
En su artículo recientemente publicado titulado "El Golfo en expansión entre la generación y el consumo de datos genómicos: una guía práctica para la tecnología de transferencia de datos grandes", Feltus, Wang y otros seis coautores en Clemson, la Universidad de Utah y el Centro Nacional paraLa información sobre biotecnología discutió la planificación y la ingeniería cuidadosas necesarias para mover y administrar Big Data a las velocidades necesarias para la ciencia de alto rendimiento.Si se ejecutan adecuadamente, las redes sofisticadas de transferencia de datos, como el Servicio avanzado de capa 2 de Internet2, así como la inclusión de aplicaciones avanzadas ysoftware, puede mejorar la eficiencia de transferencia por órdenes de magnitud.
"Las universidades y otras organizaciones de investigación pueden gastar mucho dinero construyendo supercomputadoras y redes realmente rápidas", dijo Feltus. "Pero con los sistemas informáticos de investigación, existe un abismo entre la 'gente de tecnología' y la 'gente de investigación' '.estamos tratando de reunir a estos dos grupos de expertos y aprender a hablar un dialecto común. El objetivo de nuestro trabajo es exponer parte de esta tecnología de la información a los científicos investigadores para que puedan ver mejor el panorama general ".
No pasará mucho tiempo antes de que la información generada por la secuenciación de ADN de alto rendimiento pronto se mida en exabytes, que es igual a un quintillón de bytes o mil millones de gigabytes. Un byte es la unidad que las computadoras usan para representar una letra,número o símbolo.
En términos más simples, esa es una montaña de información tan inmensa que hace que el Everest se vea como un grano de arena.
"El panorama de la tecnología realmente está cambiando ahora", dijo Wang. "Las nuevas tecnologías están surgiendo tan rápido que incluso los expertos en TI están luchando por mantenerse al día. Entonces, para que estos recursos nuevos y en constante evolución estén disponibles rápidamente para una gama más amplia deEn diferentes comunidades, el personal de TI trabaja cada vez más directamente con los investigadores de ciencias del dominio, en lugar de permanecer en segundo plano esperando ser llamados cuando sea necesario. Mientras tanto, los científicos están descubriendo que el personal de TI es el más abierto y dispuesto a generar ideas.se están convirtiendo en una parte invaluable del proceso de investigación "
La National Science Foundation y otras organizaciones de alto perfil han hecho de Big Data una alta prioridad y están alentando a los científicos a explorar los problemas que lo rodean en profundidad. En agosto de 2014, Feltus, Wang y cinco cohortes recibieron una subvención NSF de $ 1.485 millones parainvestigación avanzada sobre el análisis y el intercambio de datos de próxima generación. También en agosto de 2014, Feltus y Walt Ligon en Clemson recibieron una subvención de $ 300,000 NSF con las universidades de Louisiana State e Indiana para estudiar investigación colaborativa para la ciencia computacional. Y en septiembre de 2012, Wang y James Bottumde Clemson recibió una subvención de $ 991,000 NSF para desplegar una red de campus de alta velocidad y próxima generación para avanzar en la infraestructura cibernética.
"NSF muestra cada vez más apoyo para este tipo de colaboraciones de investigación para muchos de los diferentes dominios problemáticos", dijo Wang. "Las organizaciones patrocinadoras dicen que realmente deberíamos combinar personas tecnológicas y personas de investigación de dominios y eso es lo que estamos haciendoaquí en Clemson "
Feltus, por ejemplo, se vende por el concepto. Él dice que trabajar con los participantes en la subvención CC-NIE de Wang ya ha descubierto una gran cantidad de nuevas oportunidades de investigación.
"Durante mi carrera, he estado estudiando un puñado de organismos", dijo Feltus. "Pero debido a que ahora tengo un acceso mucho mejor a los datos, estoy encontrando formas de estudiar muchos más. Veo fantásticooportunidades que se abren ante mis ojos. Cuando eres capaz de dar a los científicos herramientas que nunca antes habían tenido, inevitablemente conducirán a descubrimientos que cambiarán el mundo de formas que alguna vez fueron inimaginables ".
Fuente de la historia :
Materiales proporcionado por Universidad de Clemson . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :