Noticias científicas

de organizaciones de investigación

1

2

Instantáneas del futuro: la herramienta aprende a predecir la mirada del usuario en las imágenes de la cámara frontal

Fecha :: 11 de septiembre de 2018
Fuente :: Instituto de Ciencias Industriales, Universidad de Tokio
Resumen :: Los investigadores han desarrollado una herramienta computacional que puede aprender de las imágenes de la cámara frontal de tareas complejas para predecir dónde se enfocará la mirada futura del usuario. Esta herramienta combina el mapeo de 'prominencia visual' de los fotogramas de imágenes basados en características visuales distintivas con la 'predicción de la mirada'mapeo basado en el movimiento de la cabeza y la dirección de la mirada previa. Esta herramienta podría facilitar la orientación en tiempo real derivada de las imágenes de la cámara frontal en situaciones que involucren tareas complejas como cirugía y fabricación.
Compartir :

HISTORIA COMPLETA

La miniaturización de las cámaras de video ha provocado una explosión en su uso, incluida su incorporación a una gama de dispositivos portátiles como cámaras para la cabeza, que se utilizan en escenarios que van desde eventos deportivos hasta combates armados. Analizar las tareas realizadas frente a dichos dispositivos yproporcionar orientación en tiempo real a las personas que los utilizan, sería útil caracterizar dónde se está enfocando realmente el usuario dentro del metraje en cada momento, pero las herramientas disponibles para predecir esto aún son limitadas.

En un nuevo estudio presentado en la 15a Conferencia Europea de Visión por Computador ECCV 2018, los investigadores de la Universidad de Tokio han desarrollado una herramienta computacional que puede aprender de las imágenes tomadas con una cámara frontal, en este caso de varias tareas realizadas en elcocina, y luego predecir con precisión dónde se dirigirá el enfoque del usuario a continuación. Esta nueva herramienta podría ser útil para permitir que las tecnologías vinculadas a video predigan qué acciones está realizando el usuario actualmente y brinden una guía adecuada con respecto al siguiente paso.

Los programas existentes para predecir dónde es probable que caiga la mirada humana dentro de un cuadro de metraje de video se han basado generalmente en el concepto de "prominencia visual", que utiliza distinciones de características como el color, la intensidad y el contraste dentro de la imagen parapredecir dónde es probable que esté mirando una persona. Sin embargo, en las imágenes de sujetos humanos que realizan tareas complejas, este enfoque de prominencia visual es inadecuado, ya que es probable que el individuo cambie su atención de un objeto a otro en una secuencia secuencial, y a menudo predecible, conducta.

Para aprovechar esta previsibilidad, en este estudio el equipo utilizó un enfoque novedoso que combina la prominencia visual con la "predicción de la mirada", que implica que una inteligencia artificial aprenda tales secuencias de acciones a partir de imágenes existentes y luego aplique el conocimiento obtenido para predecir la dirección.de la mirada del usuario en nuevas imágenes.

"Nuestro nuevo enfoque implica la construcción de primero un 'mapa de prominencia' para cada fotograma de metraje, luego un 'mapa de atención' basado en el lugar donde el usuario miraba anteriormente y en el movimiento de la cabeza del usuario, y finalmente la combinación de ambosde estos en un 'mapa de mirada' ", dice Yoichi Sato." Nuestros resultados mostraron que esta nueva herramienta superó las alternativas anteriores en términos de predecir dónde se dirigía realmente la mirada del usuario de la cámara frontal ".

Aunque los resultados del equipo se obtuvieron para imágenes de tareas en una cocina, como hervir agua en una estufa, podrían extenderse a situaciones como tareas realizadas en oficinas o fábricas. De hecho, según el autor principal Yifei Huang, "Las herramientas para evaluar los llamados videos egocéntricos de este tipo podrían incluso aplicarse en un contexto médico, como evaluar dónde se está enfocando un cirujano y ofrecer orientación sobre los pasos más apropiados a seguir en una operación ".

marque la diferencia: oportunidad patrocinada

Fuente de la historia :

Materiales proporcionado por Instituto de Ciencias Industriales, Universidad de Tokio . Nota: el contenido se puede editar por estilo y longitud.

Referencia de la revista :

Yifei Huang, Minjie Cai, Zhenqiang Li, Yoichi Sato. Predicción de la mirada en video egocéntrico mediante el aprendizaje de la transición de atención dependiente de la tarea . arXiv.org , 2018; [ resumen ]

cite esta página :

Instituto de Ciencias Industriales, Universidad de Tokio. "Instantáneas del futuro: la herramienta aprende a predecir la mirada del usuario en las imágenes de la cámara frontal". ScienceDaily. ScienceDaily, 11 de septiembre de 2018. .

Instituto de Ciencia Industrial, Universidad de Tokio. 2018, 11 de septiembre. Instantáneas del futuro: la herramienta aprende a predecir la mirada del usuario en imágenes de cámara frontal. ScienceDaily . Obtenido el 6 de diciembre de 2020 de www.science-things.com/releases/2018/09/180911142659.htm

Instituto de Ciencia Industrial, Universidad de Tokio. "Instantáneas del futuro: la herramienta aprende a predecir la mirada del usuario en las imágenes de la cámara frontal". ScienceDaily. Www.science-things.com/releases/2018/09/180911142659.htm consultado6 de diciembre de 2020.

1

2

3

4

5

HISTORIAS RELACIONADAS

DESDE LA WEB

ScienceDaily comparte enlaces con sitios en red TrendMD y obtiene ingresos de anunciantes externos, cuando se indique.

1

2

Instantáneas del futuro: la herramienta aprende a predecir la mirada del usuario en las imágenes de la cámara frontal

1

2

3

4

5

1

2

3

4

5

Los nuevos datos del Hubble explican la falta de materia oscura

La nave espacial Voyager detecta un nuevo tipo de explosión de electrones solares

Un indicio de nueva física en radiación polarizada del universo temprano

Dos estados líquidos del agua claramente diferentes

Un número aleatorio bioquímico

Un camino hacia adelante de nanomateriales para el desarrollo de la vacuna COVID-19

Tres razones por las que COVID-19 puede causar hipoxia silenciosa

Los videojuegos pueden cambiar tu cerebro

Nuevo estudio estima las probabilidades de vida e inteligencia que surgen más allá de nuestro planeta

Los físicos capturan el sonido de un fluido perfecto

Los astrónomos publicarán los datos más precisos de casi dos mil millones de estrellas

Las caóticas colisiones tempranas del sistema solar se parecían al juego de arcade 'Asteroides'

Las emociones oscuras son el centro de atención

Un indicio de nueva física en radiación polarizada del universo temprano

Los metamateriales extrañamente satisfactorios almacenan energía en su piel

Siguiente paso en la simulación del universo

Piel electrónica más parecida a la piel que se puede sentir

El sistema de IA descubre material nuevo útil