En el sótano del Edificio 3 del MIT, un robot contempla cuidadosamente su próximo movimiento. Golpea suavemente una torre de bloques, buscando el mejor bloque para extraer sin derribar la torre, en un solitario, de movimiento lento, pero sorprendentementeágil juego de Jenga.
El robot, desarrollado por los ingenieros del MIT, está equipado con una pinza de punta suave, una muñequera con sensor de fuerza y una cámara externa, todo lo cual utiliza para ver y sentir la torre y sus bloques individuales.
A medida que el robot empuja con cuidado contra un bloque, una computadora toma retroalimentación visual y táctil de su cámara y brazalete, y compara estas medidas con los movimientos que el robot realizó previamente. También considera los resultados de esos movimientos, específicamente siun bloque, en una determinada configuración y empujado con una cierta cantidad de fuerza, se extrajo con éxito o no. En tiempo real, el robot "aprende" si debe seguir empujando o moverse a un nuevo bloque, para mantener la torrede caerse
Los detalles del robot que juega Jenga se publican en la revista Ciencia Robótica . Alberto Rodríguez, profesor asistente de desarrollo profesional de Walter Henry Gale en el Departamento de Ingeniería Mecánica del MIT, dice que el robot demuestra algo que ha sido difícil de lograr en sistemas anteriores: la capacidad de aprender rápidamente la mejor manera de llevar a cabo una tarea, no solo por señales visuales, como se estudia comúnmente hoy en día, sino también por interacciones táctiles y físicas.
"A diferencia de las tareas o juegos más puramente cognitivos como el ajedrez o el Go, jugar el juego de Jenga también requiere el dominio de habilidades físicas como sondear, empujar, tirar, colocar y alinear piezas. Requiere percepción y manipulación interactivas, dondetienes que ir y tocar la torre para aprender cómo y cuándo mover bloques ", dice Rodríguez." Esto es muy difícil de simular, por lo que el robot tiene que aprender en el mundo real, interactuando con la verdadera torre Jenga. La claveel desafío es aprender de un número relativamente pequeño de experimentos explotando el sentido común sobre los objetos y la física ".
Él dice que el sistema de aprendizaje táctil que los investigadores han desarrollado puede usarse en aplicaciones más allá de Jenga, especialmente en tareas que requieren una interacción física cuidadosa, incluida la separación de objetos reciclables de la basura del vertedero y el ensamblaje de productos de consumo.
"En una línea de ensamblaje de teléfonos celulares, en casi cada paso, la sensación de un ajuste a presión o un tornillo roscado proviene de la fuerza y el tacto en lugar de la visión", dice Rodríguez. "Aprender modelos para esas acciones es primordialbienes inmuebles para este tipo de tecnología "
La autora principal del artículo es la estudiante graduada del MIT, Nima Fazeli. El equipo también incluye a Miquel Oller, Jiajun Wu, Zheng Wu y Joshua Tenenbaum, profesor de ciencias cerebrales y cognitivas del MIT.
empujar y tirar
En el juego de Jenga - Swahili para "construir" - 54 bloques rectangulares se apilan en 18 capas de tres bloques cada una, con los bloques en cada capa orientados perpendicularmente a los bloques de abajo. El objetivo del juego es cuidadosamenteextraiga un bloque y colóquelo en la parte superior de la torre, construyendo así un nuevo nivel, sin derribar toda la estructura.
Para programar un robot para jugar Jenga, los esquemas tradicionales de aprendizaje automático pueden requerir capturar todo lo que podría suceder entre un bloque, el robot y la torre, una tarea computacional costosa que requiere datos de miles, si no decenas de miles de bloques-intentos de extracción.
En cambio, Rodríguez y sus colegas buscaron una forma más eficiente de datos para que un robot aprenda a jugar Jenga, inspirado en la cognición humana y la forma en que nosotros mismos podríamos abordar el juego.
El equipo personalizó un brazo robótico ABB IRB 120 estándar de la industria, luego instaló una torre Jenga al alcance del robot y comenzó un período de entrenamiento en el que el robot primero eligió un bloque aleatorio y una ubicación en el bloque contra el cual empujarLuego ejerció una pequeña cantidad de fuerza en un intento de empujar el bloque fuera de la torre.
Para cada intento de bloqueo, una computadora registró las mediciones visuales y de fuerza asociadas, y etiquetó si cada intento fue un éxito.
En lugar de llevar a cabo decenas de miles de tales intentos lo que implicaría reconstruir la torre casi tantas veces, el robot entrenó en aproximadamente 300, con intentos de mediciones y resultados similares agrupados en grupos que representan ciertos comportamientos de bloque. Por ejemplo, un grupo podría representar intentos de un bloque que era difícil de mover, frente a uno que era más fácil de mover o que derribó la torre cuando se movió. Para cada grupo de datos, el robot desarrolló un modelo simple para predecir el comportamiento de un bloque dado sumediciones visuales y táctiles actuales.
Fazeli dice que esta técnica de agrupamiento aumenta drásticamente la eficiencia con la que el robot puede aprender a jugar, y se inspira en la forma natural en que los humanos agrupan comportamientos similares: "El robot construye grupos y luego aprende modelos para cada uno de estos grupos", en lugar de aprender un modelo que capture absolutamente todo lo que podría suceder "
apilando
Los investigadores probaron su enfoque contra otros algoritmos de aprendizaje automático de última generación, en una simulación por computadora del juego usando el simulador MuJoCo. Las lecciones aprendidas en el simulador informaron a los investigadores de la forma en que el robot aprendería en elmundo real.
"Proporcionamos a estos algoritmos la misma información que obtiene nuestro sistema, para ver cómo aprenden a jugar Jenga a un nivel similar", dice Oller. "En comparación con nuestro enfoque, estos algoritmos necesitan explorar órdenes de magnitud más torres para aprenderel juego."
Curioso por cómo su enfoque de aprendizaje automático se compara con los jugadores humanos reales, el equipo llevó a cabo algunas pruebas informales con varios voluntarios.
"Vimos cuántos bloques pudo extraer un humano antes de que cayera la torre, y la diferencia no fue tanta", dice Oller.
Pero todavía hay un camino por recorrer si los investigadores quieren enfrentar competitivamente a su robot contra un jugador humano. Además de las interacciones físicas, Jenga requiere estrategia, como extraer solo el bloqueo correcto que dificultará que un oponentesaque el siguiente bloque sin derribar la torre.
Por ahora, el equipo está menos interesado en desarrollar un campeón robótico de Jenga y más centrado en aplicar las nuevas habilidades del robot a otros dominios de aplicación.
"Hay muchas tareas que hacemos con nuestras manos donde la sensación de hacerlo" de la manera correcta "viene en el lenguaje de las fuerzas y las señales táctiles", dice Rodríguez. "Para tareas como estas, un enfoque similar al nuestro podríadescifrarlo "
Esta investigación fue apoyada, en parte, por la National Science Foundation a través de la Iniciativa Nacional de Robótica.
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Jennifer Chu. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :