Un nuevo estudio de Dartmouth sobre cómo usamos la información de recompensas para tomar decisiones muestra cómo los humanos y los monos adoptan sus estrategias de toma de decisiones dependiendo de la incertidumbre de la información presente. Los resultados de este estudio ilustraron que para una apuesta simple obtener una recompensa,cuando se conoce la magnitud o la cantidad de la recompensa pero se desconoce la probabilidad de la recompensa y debe aprenderse, ambas especies cambiarán su estrategia de combinar la información de la recompensa de forma multiplicativa en la cual las funciones de probabilidad y magnitud de la recompensa se multiplican para obtenerel llamado valor subjetivo para comparar los atributos de forma aditiva para tomar una decisión. Los resultados publicados en Comportamiento humano de la naturaleza , desafíe uno de los supuestos más fundamentales en economía, neuroeconomía y teoría de la elección de que los tomadores de decisiones generalmente evalúan las opciones de riesgo de forma multiplicativa cuando, de hecho, esto solo se aplica en un caso limitado cuando la información sobre la magnitud y la probabilidad de la recompensason claramente conocidos.
"Este es el primer estudio entre especies que utiliza un diseño experimental similar para mostrar que tanto los humanos como los monos cambian su estrategia cuando pasan de la opción bajo riesgo cuando se conocen las probabilidades de recompensa a la elección bajo incertidumbre cuando se desconocen las probabilidades de recompensa ydebe ser aprendido, desde combinar información de manera multiplicativa hasta comparar información de manera aditiva ", dijo la autora principal Alireza Soltani, profesora asistente de ciencias psicológicas y cerebrales en Dartmouth." Comparar atributos de recompensa puede parecer comparar manzanas con naranjas;sin embargo, cuando compara diferentes piezas de información de recompensas en lugar de combinarlas, se convierte en un tomador de decisiones más flexible ", agregó.
El equipo de investigadores de tres universidades descubrió que cuando se debe aprender la probabilidad de la recompensa pero se proporciona la magnitud de la recompensa, a medida que el entorno se vuelve más incierto, tanto los humanos como los monos optarían por opciones más grandes pero más riesgosasal poner menos peso en la probabilidad y más en la magnitud de la recompensa. El equipo también examinó la actividad neuronal en el cerebro de los monos durante la tarea y encontró una correlación entre este ajuste en el comportamiento y cómo las neuronas prefrontales representan la información de la recompensa.coherente con el comportamiento, las neuronas en la corteza prefrontal dorsolateral representaban la magnitud con mayor fuerza en un entorno más incierto cuando se ponía más peso en la magnitud.
Para comprender los resultados, considere el siguiente escenario hipotético que no forma parte de los métodos reales utilizados en la investigación. Imagine que es su día de suerte donde podría ganar dinero en un sorteo gratuito. Todo lo que necesita hacer es elegir un boleto deuno de los dos tazones: El tazón 1 contiene 99 boletos ganadores, cada uno valorado en $ 100 y 1 boleto con un valor de $ 0. El tazón 2 contiene 50 boletos ganadores valorados en $ 250 y 50 boletos con un valor de $ 0. ¿Qué tazón eliges?1 porque los humanos son reacios al riesgo. El tazón 1 ofrece una mejor combinación de propiedades, aunque el tazón 2 podría ser más lucrativo. Para decidir qué opción elegir, es probable que se te ocurra un valor subjetivo para cada uno de los dos tazones.multiplicando la probabilidad de ganar y la utilidad subjetiva o la conveniencia de los boletos ganadores.
Considere otro escenario en el que solo conoce la cantidad en dólares de los boletos ganadores en cada tazón, pero no sabe la probabilidad de elegir un boleto ganador. Sin embargo, ha estado observando a personas que han estado eligiendo boletos de los dos tazones antes que ustedy he aprendido que el Bowl 1 casi siempre da boletos ganadores de $ 100, pero el Bowl 2 solo da boletos ganadores de $ 250 la mitad del tiempo. En este escenario incierto, probablemente elijas el tazón que crees que es mejor al comparar la frecuencia con la que los dos tazones han estado ganandotickets en relación con la cantidad de tickets ganadores que otorgan. En este escenario, como tomador de decisiones, usó una estrategia aditiva porque comparó la información de recompensa entre las dos opciones en lugar de tratar de combinarla.
Para el estudio real, se administraron una serie de tareas de juego en una computadora para que los monos y los participantes humanos tuvieran que elegir entre dos opciones. A los humanos estudiantes universitarios de Dartmouth se les otorgó una combinación de puntos que se convirtieron en dinero y crédito adicional.para un curso, y los monos estudiados en la Facultad de Medicina de Yale y la Universidad de Minnesota fueron premiados con gotas de jugo de acuerdo con sus elecciones y los resultados de las apuestas.
"Hablando de manera más amplia, nuestros resultados muestran que en un entorno de recompensa incierto, que es el caso la mayoría de las veces, no podemos construir el llamado valor subjetivo según lo prescrito por los modelos normativos de elección, y que la flexibilidad es más importanteque ser racional u óptimo ", agregó Soltani.
Fuente de la historia :
Materiales proporcionados por Dartmouth College . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :