Cada idioma tiene casos en los que dos o más conceptos se expresan con la misma palabra, como la palabra inglesa fly, que se refiere tanto al acto de volar como al insecto. Al comparar patrones en estos casos, que los lingüistas llaman colexificaciones, en todos los idiomas, los investigadores pueden obtener información sobre una amplia gama de problemas, incluida la percepción humana, la evolución del lenguaje y el contacto con el idioma. La tercera entrega de la base de datos CLICS aumenta significativamente el número de idiomas, conceptos y fuentes de datos disponibles en versiones anteriores,permitiendo a los investigadores estudiar colexificaciones a escala global con detalles y profundidad sin precedentes.
Con flujos de trabajo detallados asistidos por computadora, CLICS facilita la estandarización de conjuntos de datos lingüísticos y proporciona soluciones a muchos de los desafíos persistentes en la investigación lingüística ". Si bien la agregación de datos generalmente se basó en procedimientos ad-hoc en el pasado, nuestros nuevos flujos de trabajo y pautasLas mejores prácticas son un paso importante para garantizar la reproducibilidad de la investigación lingüística ", dice Tiago Tresoldi.
Efectividad de CLICS demostrada en aplicaciones de investigación
La capacidad de CLICS para proporcionar nueva evidencia para abordar preguntas de vanguardia en psicología y cognición ya se ha ilustrado en un estudio reciente publicado en ciencia que se concentró en la codificación mundial de los conceptos de emoción. El estudio comparó las redes de colexificación de palabras para conceptos de emoción de una muestra global de idiomas, y reveló que los significados de las emociones varían mucho entre las familias de idiomas.
"En este estudio, CLICS se usó para estudiar las diferencias en la codificación léxica de la emoción en los idiomas de todo el mundo, pero el potencial de la base de datos no se limita a los conceptos de emoción. Muchas preguntas más interesantes pueden abordarse en el futuro".dice Johann-Mattis List.
Los nuevos estándares y flujos de trabajo permiten la recolección reproducible de datos léxicos globales
Partiendo de las nuevas directrices para formatos de datos estandarizados en la investigación multilingüe, que se presentaron por primera vez en 2018, el equipo de CLICS pudo aumentar la cantidad de datos de 300 variedades de idiomas y 1200 conceptos en la base de datos original a 3156 variedades de idiomasy 2906 conceptos en la instalación actual. La nueva versión también garantiza la reproducibilidad del proceso de agregación de datos, conforme a las mejores prácticas en la gestión de datos de investigación. "Gracias a los nuevos estándares y flujos de trabajo que desarrollamos, nuestros datos no son solo FAIR encontrables,accesible, interoperable y reproducible, pero el proceso de levantar datos lingüísticos de sus formas originales a nuestros estándares interlingüísticos también es mucho más eficiente que en el pasado ", dice Robert Forkel.
La efectividad del flujo de trabajo desarrollado para CLICS ha sido probada y confirmada en varios experimentos de validación que involucran a una amplia gama de académicos y estudiantes. Se llevaron a cabo dos tareas diferentes de los estudiantes, lo que resultó en la creación de nuevos conjuntos de datos y la mejora progresiva de los datos existentesLos estudiantes tuvieron la tarea de trabajar a través de los diferentes pasos de creación de conjuntos de datos descritos en el estudio, por ejemplo, extracción de datos, mapeo de datos para referenciar catálogos e identificación de fuentes ". Hacer que personas externas al equipo central usen y prueben sus herramientases esencial y ayuda enormemente a ajustar todos los procesos ", dice Christoph Rzymski.
Con CLICS y su flujo de trabajo accesible para un público más amplio, los académicos no solo pueden contribuir directamente a la base de datos en el futuro; también pueden beneficiarse de la maquinaria establecida y comenzar sus propias colecciones específicas ". El número de lingüistas que utilizan activamente nuestrolos estándares y los flujos de trabajo aumentan constantemente. Esperamos que el lanzamiento de esta nueva versión de CLICS los propague aún más ", dice Simon Greenhill.
Fuente de la historia :
Materiales proporcionado por Instituto Max Planck para la Ciencia de la Historia Humana . Nota: El contenido puede ser editado por estilo y longitud.
Referencias de revistas :
Cita esta página :