Un sistema de lenguaje de máquina basado en la web resuelve crucigramas mucho mejor que los productos disponibles comercialmente y puede ayudar a las máquinas a comprender mejor el lenguaje.
Los investigadores han diseñado una plataforma basada en la web que utiliza redes neuronales artificiales para responder mejor a las pistas de crucigramas estándar que los productos comerciales existentes diseñados específicamente para la tarea. El sistema, que está disponible gratuitamente en línea, podría ayudar a las máquinas a comprender el lenguaje de manera más eficaz.
En las pruebas contra el software comercial de resolución de crucigramas, el sistema, diseñado por investigadores del Reino Unido, EE. UU. Y Canadá, fue más preciso para responder pistas que eran palabras sueltas por ejemplo, 'culpabilidad' - culpa, una combinación corta de palabraspor ejemplo, 'devoto del diablo' - satanista, o una oración o frase más larga por ejemplo, 'poeta francés y figura clave en el desarrollo del simbolismo' - Baudelaire. El sistema también se puede utilizar un 'diccionario inverso' en el que elel usuario describe un concepto y el sistema devuelve posibles palabras para describir ese concepto.
Los investigadores utilizaron las definiciones contenidas en seis diccionarios, además de Wikipedia, para 'entrenar' el sistema de modo que pudiera entender palabras, frases y oraciones, utilizando las definiciones como un puente entre palabras y oraciones. Sus resultados, publicados en elLa revista Transactions of the Association for Computational Linguistics, sugiere que un enfoque similar puede conducir a una mejor producción de sistemas de diálogo y comprensión del lenguaje más generales y motores de recuperación de información en general. Todo el código y los datos detrás de la aplicación se han puesto a disposición gratuitamente para el futuroinvestigación.
"En los últimos años, ha habido una mini revolución en el aprendizaje automático", dijo Felix Hill del Laboratorio de Computación de la Universidad de Cambridge, uno de los autores del artículo. "Estamos viendo un uso mucho mayor del aprendizaje profundo,que es especialmente útil para la percepción del lenguaje y el reconocimiento del habla ".
El aprendizaje profundo se refiere a un enfoque en el que se entrenan redes neuronales artificiales con poco o ningún "conocimiento" previo para recrear habilidades humanas utilizando cantidades masivas de datos. Para esta aplicación en particular, los investigadores utilizaron diccionarios, entrenando el modelo en cientos demiles de definiciones de palabras en inglés, además de Wikipedia.
"Los diccionarios contienen casi suficientes ejemplos para hacer viable el aprendizaje profundo, pero notamos que los modelos mejoran cada vez más a medida que se les da", dijo Hill. "Nuestros experimentos muestran que las definiciones contienen una señal valiosa para ayudar a los modelos ainterpretar y representar el significado de frases y oraciones. "
Trabajando con Anna Korhonen del Departamento de Lingüística Teórica y Aplicada de Cambridge, e investigadores de la Universidad de Montreal y la Universidad de Nueva York, Hill utilizó el modelo como una forma de cerrar la brecha entre las máquinas que entienden los significados de palabras individuales y máquinasque pueda comprender el significado de frases y oraciones.
"A pesar del progreso reciente en IA, los problemas relacionados con la comprensión del lenguaje son particularmente difíciles, y nuestro trabajo sugiere muchas aplicaciones posibles de las redes neuronales profundas a la tecnología del lenguaje", dijo Hill. "Uno de los mayores desafíos en la formación de computadoras para comprender el lenguaje es la recreaciónlas muchas fuentes de información ricas y diversas disponibles para los humanos cuando aprenden a hablar y leer ".
Sin embargo, todavía queda un largo camino por recorrer. Por ejemplo, cuando el sistema de Hill recibe una consulta, la máquina no tiene idea de la intención del usuario o del contexto más amplio de por qué se hace la pregunta. Los seres humanos, por otro lado,, pueden usar su conocimiento previo y señales como el lenguaje corporal para descubrir la intención detrás de la consulta.
Hill describe el progreso reciente en los sistemas de inteligencia artificial basados en el aprendizaje en términos de conductismo y cognitivismo: dos movimientos en psicología que afectan la forma en que uno ve el aprendizaje y la educación. El conductismo, como su nombre lo indica, mira el comportamiento sin mirar lo que el cerebro y las neuronasestán haciendo, mientras que el cognitivismo analiza los procesos mentales que subyacen a la conducta. Los sistemas de aprendizaje profundo como el construido por Hill y sus colegas reflejan un enfoque cognitivista, pero para que un sistema tenga algo que se acerque a la inteligencia humana, debería tener un poco deambos.
"Nuestro sistema no puede ir más allá de los datos del diccionario en los que se entrenó, pero las formas en que puede hacerlo son interesantes y lo convierten en un sistema de preguntas y respuestas sorprendentemente sólido, y bastante bueno para resolver crucigramas", dijo Hill. Si bien no se construyó con el propósito de resolver crucigramas, los investigadores encontraron que en realidad funcionaba mejor que los productos disponibles comercialmente que están diseñados específicamente para la tarea.
Las aplicaciones comerciales de respuesta a crucigramas existentes funcionan de manera similar a una búsqueda de Google, con un sistema capaz de hacer referencia a más de 1100 diccionarios. Si bien este enfoque tiene ventajas si desea buscar una definición palabra por palabra, funciona menos bien cuando ingresauna pregunta o consulta que el modelo nunca ha visto en el entrenamiento. También lo hace increíblemente 'pesado' en términos de la cantidad de memoria que requiere. "Los enfoques tradicionales son como llevar consigo muchos diccionarios pesados, mientras que nuestro sistema neuronal es increíblementeluz ", dijo Hill.
Según los investigadores, los resultados muestran la efectividad del entrenamiento basado en definiciones para desarrollar modelos que comprendan frases y oraciones. Actualmente están buscando formas de mejorar su sistema, específicamente combinándolo con modelos de aprendizaje de idiomas de estilo más conductista.e interacción lingüística.
Más información: http://45.55.181.170/defgen/
Fuente de la historia :
Materiales proporcionado por Universidad de Cambridge . La historia original tiene la licencia a Licencia Creative Commons . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :