Los altavoces inteligentes - piense, un Amazon Alexa o un Google Home - ofrecen una amplia variedad de capacidades para ayudar a liberar tanto nuestro tiempo como nuestras manos. Podemos escuchar las noticias de la mañana mientras nos cepillamos los dientes, solicite un informe meteorológicomientras selecciona un abrigo y establece un temporizador para el horno mientras maneja dos sartenes a la vez. Según Voicebot.ai, Alexa admite más de 100,000 habilidades en todo el mundo, pero una tarea que no ha dominado es determinar la ubicación del usuario en elhogar.
Esta tarea de localización fue el foco de un artículo recientemente publicado por el equipo de investigación de la Universidad de Illinois en Urbana-Champaign, "Localización de voz usando reflexiones de paredes cercanas". El trabajo fue aceptado en la 26ª Conferencia Internacional Anual sobre Computación y Redes Móviles.En el documento, el equipo, dirigido por el estudiante graduado de Coordinated Science Lab, Sheng Shen, explora el desarrollo de VoLoc, un sistema que utiliza la matriz de micrófonos en Alexa, así como los ecos de la sala de la voz humana, para inferir la ubicación del usuario dentro delhogar.
Conocer la ubicación de un usuario dentro de una casa podría ayudar a un dispositivo inteligente a admitir mejor las habilidades disponibles actualmente. Por ejemplo, después de recibir comandos como "encender la luz" o "aumentar la temperatura", Alexa tiene que adivinar qué luz y qué habitación hayEn el corazón del comando. Usando una técnica conocida como triangulación inversa, Shen y el asesor Romit Roy Choudhury se están acercando a la localización de voz.
"La aplicación de esta técnica a los altavoces inteligentes conlleva bastantes desafíos", compartió Shen, un estudiante de ingeniería eléctrica e informática ECE. "Primero, debemos separar la voz humana directa y cada eco de la sala de la grabación del micrófono.Luego, debemos calcular con precisión la dirección de cada uno de estos ecos. Ambos desafíos son difíciles porque los micrófonos simplemente graban una mezcla de todos los sonidos ".
VoLoc aborda estos obstáculos a través de un "algoritmo de alineación y cancelación" que aísla iterativamente las direcciones de cada una de las señales de voz que llegan y, a partir de ellas, triangula inversamente la ubicación del usuario. Algunos aspectos de la geometría de la sala se aprenden espontáneamente, lo cualluego ayuda con la triangulación. Si bien este es un avance importante, Shen y Roy Choudhury planean expandir la investigación a más aplicaciones pronto.
"Nuestro siguiente paso inmediato es construir según el marco de referencia del altavoz inteligente", explicó Shen. "Esto podría significar superponer las ubicaciones, como lo proporciona VoLoc, en un plano para determinar que el usuario está en la lavandería. Alternativamente, si el altavoz inteligente capta los sonidos emitidos por la lavadora y la secadora en la misma ubicación que el comando de voz, puede llegar a la misma conclusión ".
Las posibilidades de esta función son infinitas y podrían mejorar las habilidades actuales de Alexa.
"Las implicaciones son importantes", dijo Roy Choudhury, profesor de CSL y el "Jerry" Sanders III de WJ - Académico avanzado de Micro Devices, Inc. en Ingeniería Eléctrica e Informática. "La ubicación puede ayudar a Alexa a mejorar el reconocimiento de voz, ya quese pueden cargar diferentes vocabularios y modelos de voz. Por ejemplo, un comando como 'agregar urgente a la lista de compras' puede no tener sentido, pero si Alexa sabe que el usuario está en la lavandería, Alexa puede inferir que el usuarioen realidad dijo 'agregar detergente a la lista de compras'. "
Shen y Roy Choudhury reconocen que la tecnología podría erosionar aún más la privacidad, al permitir que compañías como Amazon y Google se asocien más de cerca a nuestros hogares y a la vida cotidiana. Sin embargo, también creen que los beneficios son vitales, ya que los dispositivos inteligentes conscientes del contexto podríanse convierten en tecnologías de apoyo cruciales para la vida independiente de la tercera edad y más.
Por ejemplo, la tecnología podría usarse para recordarle a un abuelo que vive de forma independiente que tome su medicamento cuando pasa por el botiquín, o para recordarle a un niño que cierre el grifo cuando salgan del baño con él todavíacorriendo.
"Es más que interpretar comandos de voz", dijo Shen. "También proporciona un par de ojos adicionales cuando se trata de cuidar a los seres queridos".
Fuente de la historia :
Materiales proporcionado por Universidad de Illinois Grainger College of Engineering . Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :