Al igual que los niños pequeños, los robots pueden necesitar un poco de ayuda mientras aprenden a funcionar en el mundo físico. Ese es el propósito de un programa de la Universidad de Rice que guía suavemente a los robots hacia las formas más útiles y similares a las humanas para colaborar en las tareas.
La ingeniera de Rice Marcia O'Malley y el estudiante de posgrado Dylan Losey han refinado su método para entrenar robots aplicando retroalimentación física suave a las máquinas mientras realizan tareas. El objetivo es simplificar el entrenamiento de los robots que se espera que trabajen de manera eficiente junto con los humanos..
Aparece un artículo sobre su estudio en IEEE Explore.
"Históricamente, el papel de los robots era hacerse cargo de las tareas mundanas que no queremos hacer: fabricación, líneas de montaje, soldadura, pintura", dijo O'Malley, profesor de ingeniería mecánica, ingeniería eléctrica e informática yinformática. "A medida que nos volvemos más dispuestos a compartir información personal con la tecnología, como la forma en que mi reloj registra cuántos pasos doy, esa tecnología también se traslada al hardware incorporado.
"Los robots ya están en nuestras casas aspirando o controlando nuestros termostatos o cortando el césped", dijo. "Hay todo tipo de formas en que la tecnología impregna nuestras vidas. Ya hablo con Alexa en la cocina, así que ¿por qué no tener también máquinas?con los que podemos colaborar físicamente? Gran parte de nuestro trabajo consiste en hacer que las interacciones entre humanos y robots sean seguras ".
Según los investigadores, los robots adaptados para responder a la interacción física humano-robot pHRI tradicionalmente tratan tales interacciones como perturbaciones y reanudan sus comportamientos originales cuando las interacciones terminan. Los investigadores de Rice han mejorado el pHRI con un método que permite a los humanosajustar la trayectoria de un robot en tiempo real.
En el corazón del programa se encuentra el concepto de control de impedancia, literalmente una forma de administrar lo que sucede cuando se produce un empujón. Un robot que permite el control de impedancia a través de una entrada física ajusta su trayectoria programada para responder pero vuelve a su trayectoria inicialcuando finaliza la entrada.
El algoritmo de Rice se basa en ese concepto, ya que permite al robot ajustar su ruta más allá de la entrada y calcular una nueva ruta hacia su objetivo, algo así como un sistema GPS que recalcula la ruta a su destino cuando un conductor pierde un giro.
Losey pasó gran parte del verano pasado en el laboratorio de Anca Dragan, profesora asistente de ingeniería eléctrica y ciencias de la computación en la Universidad de California, Berkeley, probando la teoría. Él y otros estudiantes entrenaron un brazo y una mano de robot para entregar un cafétaza en un escritorio, y luego usó pHRI mejorado para mantenerlo alejado de un teclado de computadora y lo suficientemente bajo para que la taza no se rompa si se cae un documento separado sobre los experimentos aparece en el Actas de la investigación sobre aprendizaje automático .
El objetivo era deformar la trayectoria programada del robot a través de la interacción física. "Aquí el robot tiene un plan, o trayectoria deseada, que describe cómo el robot cree que debe realizar la tarea", escribió Losey en un ensayo sobre los experimentos de Berkeley."Introdujimos un algoritmo en tiempo real que modificó o deformó la futura trayectoria deseada del robot".
En el modo de impedancia, el robot regresó constantemente a su trayectoria original después de una interacción. En el modo de aprendizaje, la retroalimentación alteró no solo el estado del robot en el momento de la interacción, sino también la forma en que procedió a la meta, dijo Losey. Si el usuariodirigido para evitar que la taza pase sobre el teclado, por ejemplo, continuaría haciéndolo en el futuro ". Al volver a planificar la trayectoria deseada del robot después de cada nueva observación, el robot pudo generar un comportamiento que coincide con la preferencia del ser humano," él dijo.
Otras pruebas emplearon a 10 estudiantes de Rice que utilizaron el robot de retroalimentación de fuerza de rehabilitación del laboratorio O'Malley, OpenWrist, para manipular un cursor alrededor de los obstáculos en una pantalla de computadora y aterrizar en un punto azul. Las pruebas primero usaron el control de impedancia estándar y luegocontrol de impedancia con deformación de trayectoria físicamente interactiva, un análogo de pHRI que permitió a los estudiantes entrenar el dispositivo para aprender nuevas trayectorias.
Los resultados mostraron que las pruebas con deformación de la trayectoria fueron físicamente más fáciles y requirieron una interacción significativamente menor para lograr el objetivo. Los experimentos demostraron que las interacciones pueden programar robots que de otro modo serían autónomos que tienen varios grados de libertad, en este caso flexionando un brazo y rotando una muñeca.
Una limitación actual es que pHRI aún no puede modificar la cantidad de tiempo que le toma a un robot realizar una tarea, pero eso está en la agenda del equipo de Rice.
"El cambio de paradigma en este trabajo es que en lugar de tratar a un humano como una perturbación aleatoria, el robot debe tratar al humano como un ser racional que tiene una razón para interactuar y está tratando de transmitir algo importante", dijo Losey.El robot no debería simplemente intentar apartarse del camino. Debería aprender lo que está pasando y hacer mejor su trabajo ".
Fuente de la historia :
Materiales proporcionado por Universidad de Rice . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :