Cada conjunto de datos en el universo observable tiene una geometría o forma fundamental, pero esa estructura puede ser muy complicada. Para facilitar la visualización de conjuntos de datos complicados, un equipo de investigación de Dartmouth ha creado HyperTools, un paquete de software de código abierto queaprovecha un conjunto de técnicas matemáticas para obtener intuiciones sobre conjuntos de datos de alta dimensión a través de las estructuras geométricas subyacentes que reflejan. Revista de investigación de aprendizaje automático .
HyperTools se puede usar para transformar datos en formas o animaciones visualizables, que se pueden usar para: comparar diferentes conjuntos de datos, obtener información sobre patrones subyacentes de una manera intuitiva, hacer generalizaciones entre conjuntos de datos y desarrollar y probar teorías relacionadas con Big Data.
"Los conjuntos de datos a los que nos enfrentamos como científicos modernos pueden ser enormemente complejos, y a menudo reflejan muchos componentes que interactúan", explica el autor principal, Jeremy R. Manning, profesor asistente de ciencias psicológicas y cerebrales y director del Laboratorio de Dinámica Contextual enDartmouth: "Nuestra herramienta convierte los datos complejos en formas intuitivas en 3-D que se pueden examinar y comparar visualmente. Esencialmente, estamos aprovechando la increíble capacidad del sistema visual para encontrar patrones en el mundo que nos rodea para encontrar también patrones en datos científicos complejos".
Los investigadores demuestran cómo se pueden aplicar HyperTools a varios tipos de datos. En el documento, muestran visualizaciones de: actividad cerebral, fotogramas de películas y respuestas cerebrales para observar esos fotogramas; cambios en las mediciones de temperatura en la superficie de la Tierra desde 1875 hasta 2013; y el contenido temático de los tweets políticos emitidos por Hillary Clinton y Donald Trump durante la campaña presidencial de Estados Unidos en 2016.
Además de usar HyperTools para comprender directamente la estructura geométrica de los datos, las ideas reveladas por la herramienta también se pueden usar para guiar el desarrollo de algoritmos de aprendizaje automático. Por ejemplo, las visualizaciones de datos pueden revelar cómo se estructuran los diferentes tipos de observaciones estructuradasgrupos distintos p. ej., tweets de Trump versus tweets de Clinton que podrían usarse para comprender las similitudes y diferencias entre los grupos.
Como parte de la caja de herramientas HyperTools, el laboratorio de Manning continúa desarrollando y lanzando otros tipos de análisis de visualización geométrica, incluidos los análisis de texto recientemente lanzados.
Fuente de la historia :
Materiales proporcionados por Dartmouth College . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :