Estudiar historias de noticias falsas de April Fools podría ofrecer pistas para detectar artículos de 'noticias falsas', revela una nueva investigación.
Los expertos académicos en procesamiento del lenguaje natural de la Universidad de Lancaster que están interesados en el engaño han comparado el lenguaje utilizado en los engaños escritos de los inocentes y las noticias falsas.
Han descubierto que hay similitudes en la estructura escrita de los engaños humorísticos de los inocentes, los artículos falsos publicados por los medios de comunicación cada 1 de abril, y las noticias maliciosas y falsas.
Los investigadores han compilado un conjunto de datos novedoso, o corpus, de más de 500 artículos de April Fools procedentes de más de 370 sitios web y escritos a lo largo de 14 años.
"Los engaños de April Fools son muy útiles porque nos brindan un cuerpo verificable de textos engañosos que nos dan la oportunidad de conocer las técnicas lingüísticas utilizadas cuando un autor escribe algo ficticio disfrazado como un relato de hechos", dijo Edward Dearden deUniversidad de Lancaster y autor principal de la investigación: "Al observar el lenguaje utilizado en April Fools y compararlo con noticias falsas, podemos obtener una mejor idea de los tipos de lenguaje utilizados por los autores de desinformación".
Una comparación de los mensajes falsos de April Fools con artículos de noticias genuinos escritos en el mismo período, pero no publicados el 1 de abril, reveló diferencias estilísticas.
Los investigadores se centraron en características específicas dentro de los textos, como la cantidad de detalles utilizados, la vaguedad, la formalidad del estilo de escritura y la complejidad del lenguaje.
Luego compararon las historias de April Fools con un conjunto de datos de 'noticias falsas', previamente compilado por un equipo diferente de investigadores.
Aunque no todas las características encontradas en los engaños de April Fools fueron útiles para detectar noticias falsas, hubo una serie de características similares en ambos.
Descubrieron que los engaños de April Fools y los artículos de noticias falsas tienden a contener un lenguaje menos complejo, una dificultad de lectura más fácil y oraciones más largas que las noticias genuinas.
Se descubrió que los detalles importantes para las noticias, como nombres, lugares, fechas y horas, se usaban con menos frecuencia en los engaños de los Inocentes y las noticias falsas. Sin embargo, los nombres propios, como los nombres de los políticos prominentes 'Trump' o 'Hillary ', son más abundantes en noticias falsas que en artículos de noticias genuinos o April Fools, que tienen significativamente menos.
Los pronombres en primera persona, como 'nosotros', también son una característica destacada tanto para los tontos de abril como para las noticias falsas. Esto va en contra del pensamiento tradicional en la detección del engaño, lo que sugiere que los mentirosos usan menos pronombres en primera persona.
Los investigadores descubrieron que los tontos de abril engañan historias, en comparación con noticias genuinas :
Noticias falsas, en comparación con noticias genuinas :
Los investigadores también crearon un 'clasificador' de aprendizaje automático para identificar si los artículos son engaños de April Fools, noticias falsas o noticias genuinas. El clasificador logró una precisión del 75% al identificar artículos de April Fools y del 72% para identificar noticias falsasCuando el clasificador fue entrenado en engaños de April Fools y estableció la tarea de identificar noticias falsas, registró una precisión de más del 65 por ciento.
El Dr. Alistair Baron, coautor del artículo, dijo: "Mirar los detalles y las complejidades dentro de un texto es crucial cuando se trata de determinar si un artículo es un engaño. Aunque existen muchas diferencias, nuestros resultados sugieren que April Fools ylos artículos de noticias falsas comparten algunas características similares, principalmente relacionadas con la complejidad estructural.
"Nuestros hallazgos sugieren que hay ciertas características en común entre las diferentes formas de desinformación y explorar estas similitudes puede proporcionar información importante para futuras investigaciones sobre noticias engañosas".
La investigación se ha esbozado en el documento 'El encargo de los tontos: mirar los engaños de los inocentes como desinformación a través de la lente del engaño y el humor', que se presentará en la XX Conferencia Internacional sobre Lingüística Computacional y Procesamiento Inteligente de Texto, que se realizaráen La Rochelle en abril.
Los autores del artículo son Edward Dearden y Alistair Baron de la Universidad de Lancaster. Los estudios de doctorado de Edward Dearden han sido apoyados por el Consejo de Investigación de Ingeniería y Ciencias Físicas.
Fuente de la historia :
Materiales proporcionados por Universidad de Lancaster . Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :