Los sistemas de inteligencia artificial y los algoritmos de aprendizaje automático han sido criticados recientemente porque pueden detectar y reforzar los prejuicios existentes en nuestra sociedad, dependiendo de los datos con los que estén programados.
Pero un grupo interdisciplinario de académicos de Stanford convirtió este problema en un nuevo Actas de la Academia Nacional de Ciencias artículo publicado el 3 de abril
Los investigadores utilizaron incrustaciones de palabras, una técnica algorítmica que puede mapear las relaciones y asociaciones entre palabras, para medir los cambios en los estereotipos de género y étnicos durante el siglo pasado en los Estados Unidos. Analizaron grandes bases de datos de libros, periódicos y otros artículos estadounidensestextos y observaron cómo esos cambios lingüísticos se correlacionaron con los datos demográficos reales del censo de EE. UU. y los principales cambios sociales, como el movimiento de mujeres en la década de 1960 y el aumento de la inmigración asiática, según la investigación.
"Las incrustaciones de palabras se pueden usar como un microscopio para estudiar los cambios históricos en los estereotipos en nuestra sociedad", dijo James Zou, profesor asistente de ciencia de datos biomédicos. "Nuestra investigación previa ha demostrado que las incrustaciones capturan efectivamente los estereotipos existentes y que esos sesgospuede eliminarse sistemáticamente. Pero creemos que, en lugar de eliminar esos estereotipos, también podemos usar las incrustaciones como lentes históricas para análisis cuantitativos, lingüísticos y sociológicos de sesgos ".
Zou fue coautor del artículo con la profesora de historia Londa Schiebinger, el profesor de lingüística e informática Dan Jurafsky y el estudiante graduado de ingeniería eléctrica Nikhil Garg, quien fue el autor principal.
"Este tipo de investigación nos abre todo tipo de puertas", dijo Schiebinger. "Proporciona un nuevo nivel de evidencia que permite a los estudiosos de humanidades buscar preguntas sobre la evolución de los estereotipos y prejuicios a una escala que nunca se ha hechoantes de."
La geometría de las palabras
Una palabra incrustada es un algoritmo que se usa, o se entrena, en una colección de texto. El algoritmo luego asigna un vector geométrico a cada palabra, representando cada palabra como un punto en el espacio. La técnica utiliza la ubicación en este espacio para capturarasociaciones entre palabras en el texto fuente.
"Las incrustaciones son una poderosa herramienta lingüística para medir aspectos sutiles del significado de las palabras, como el sesgo", dijo Jurafsky.
Tome la palabra "honorable". Utilizando la herramienta de incrustación, una investigación previa descubrió que el adjetivo tiene una relación más cercana con la palabra "hombre" que con la palabra "mujer".
En su nueva investigación, el equipo de Stanford usó incrustaciones para identificar ocupaciones y adjetivos específicos que estaban sesgados hacia las mujeres y grupos étnicos particulares desde la década de 1900 hasta el presente. Los investigadores entrenaron esas incrustaciones en bases de datos de periódicos y también usaron incrustaciones previamente capacitadas porWill Hamilton, estudiante de posgrado en ciencias de la computación de Stanford, en otros grandes conjuntos de datos de texto, como el corpus de libros estadounidenses de Google Books, que contiene más de 130 mil millones de palabras publicadas durante los siglos XX y XXI.
Los investigadores compararon los sesgos encontrados por esas incrustaciones con los cambios demográficos en los datos del Censo de EE. UU. Entre 1900 y el presente.
Cambios en los estereotipos
Los resultados de la investigación mostraron cambios cuantificables en las representaciones de género y los prejuicios hacia los asiáticos y otros grupos étnicos durante el siglo XX.
Uno de los hallazgos clave que surgió fue cómo los sesgos hacia las mujeres cambiaron para mejor, de alguna manera, con el tiempo.
Por ejemplo, los adjetivos como "inteligente", "lógico" y "reflexivo" se asociaron más con los hombres en la primera mitad del siglo 20. Pero desde la década de 1960, las mismas palabras se han asociado cada vez más a las mujeres con cada seguimientodécada, correlacionando con el movimiento de mujeres en la década de 1960, aunque todavía queda una brecha.
La investigación también mostró un cambio dramático en los estereotipos hacia los asiáticos y los asiáticoamericanos.
Por ejemplo, en la década de 1910, palabras como "bárbaro", "monstruoso" y "cruel" eran los adjetivos más asociados con los apellidos asiáticos. En la década de 1990, esos adjetivos fueron reemplazados por palabras como "inhibido", "pasivo"y "sensible". Este cambio lingüístico se correlaciona con un fuerte aumento de la inmigración asiática a los Estados Unidos en los años 1960 y 1980 y un cambio en los estereotipos culturales, dijeron los investigadores.
"La severidad del cambio en los estereotipos me llamó la atención", dijo Garg. "Cuando estudias historia, aprendes sobre campañas de propaganda y estos puntos de vista anticuados de grupos extranjeros. Pero cuánto la literatura producida en ese momento refleja esos estereotiposfue difícil de apreciar "
En general, los investigadores demostraron que los cambios en las incrustaciones de palabras seguían de cerca los cambios demográficos medidos por el Censo de los EE. UU.
Colaboración fructífera
La nueva investigación ilumina el valor del trabajo en equipo interdisciplinario entre las humanidades y las ciencias, dijeron los investigadores.
Schiebinger dijo que contactó a Zou, quien se unió a Stanford en 2016, después de que ella leyó su trabajo anterior sobre la eliminación de sesgos de algoritmos de aprendizaje automático.
"Esto condujo a una colaboración muy interesante y fructífera", dijo Schiebinger, y agregó que los miembros del grupo están trabajando juntos en más investigaciones.
"Subraya la importancia de que los humanistas y los informáticos trabajen juntos. Hay un poder para estos nuevos métodos de aprendizaje automático en la investigación de humanidades que se está entendiendo", dijo.
Zou también es miembro de Stanford Bio-X y un investigador de Chan Zuckerberg Biohub.
Fuente de la historia :
Materiales proporcionado por Universidad de Stanford . Original escrito por Alex Shashkevich. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :