Un nuevo sistema de aprendizaje desarrollado por investigadores del MIT mejora las habilidades de los robots para moldear materiales en formas objetivo y hacer predicciones sobre la interacción con objetos sólidos y líquidos. El sistema, conocido como un simulador de partículas basado en el aprendizaje, podría dar a los robots industriales un aspecto más refinadotoque, y puede tener aplicaciones divertidas en robótica personal, como modelar formas de arcilla o enrollar arroz pegajoso para sushi.
En la planificación robótica, los simuladores físicos son modelos que capturan cómo los diferentes materiales responden a la fuerza. Los robots son "entrenados" usando los modelos para predecir los resultados de sus interacciones con objetos, como empujar una caja sólida o pinchar arcilla deformable. PeroLos simuladores tradicionales basados en el aprendizaje se centran principalmente en objetos rígidos y no pueden manejar fluidos u objetos más blandos. Algunos simuladores más precisos basados en la física pueden manejar diversos materiales, pero dependen en gran medida de técnicas de aproximación que introducen errores cuando los robots interactúan con objetos en el mundo real..
En un documento presentado en la Conferencia Internacional sobre Representaciones de Aprendizaje en mayo, los investigadores describen un nuevo modelo que aprende a capturar cómo pequeñas porciones de diferentes materiales - "partículas" - interactúan cuando se tocan y se pinchan.El modelo aprende directamente de los datos en casos donde la física subyacente de los movimientos es incierta o desconocida.Los robots pueden usar el modelo como guía para predecir cómo reaccionarán los líquidos, así como los materiales rígidos y deformables, a la fuerza de su toque.A medida que el robot maneja los objetos, el modelo también ayuda a refinar aún más el control del robot.
En experimentos, una mano robótica con dos dedos, llamada "RiceGrip", moldeó con precisión una espuma deformable a la configuración deseada, como una forma de "T", que sirve como un sustituto del arroz de sushi. En resumen, elEl modelo de los investigadores sirve como un tipo de cerebro de "física intuitiva" que los robots pueden aprovechar para reconstruir objetos tridimensionales de forma similar a como lo hacen los humanos.
"Los humanos tienen un modelo de física intuitivo en nuestras cabezas, donde podemos imaginar cómo se comportará un objeto si lo empujamos o lo apretamos. Basado en este modelo intuitivo, los humanos pueden realizar tareas de manipulación increíbles que están más allá del alcance de los robots actuales", dice el primer autor Yunzhu Li, un estudiante graduado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial CSAIL." Queremos construir este tipo de modelo intuitivo para robots que les permita hacer lo que los humanos pueden hacer ".
"Cuando los niños tienen 5 meses de edad, ya tienen expectativas diferentes de sólidos y líquidos", agrega el coautor Jiajun Wu, un estudiante graduado de CSAIL. "Eso es algo que sabemos a una edad temprana, así que tal vez sea algo que deberíamos intentarmodelar para robots "
Junto con Li y Wu en el documento están: Russ Tedrake, investigador de CSAIL y profesor en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación EECS; Joshua Tenenbaum, profesor en el Departamento de Ciencias Cerebrales y Cognitivas; y Antonio Torralba, profesor en EECS y director del MIT-IBM Watson AI Lab.
Gráficos dinámicos
Una innovación clave detrás del modelo, llamada "red de interacción de partículas" DPI-Nets, fue la creación de gráficos de interacción dinámica, que consisten en miles de nodos y bordes que pueden capturar comportamientos complejos de las llamadas partículas., cada nodo representa una partícula. Los nodos vecinos se conectan entre sí mediante bordes dirigidos, que representan la interacción que pasa de una partícula a otra. En el simulador, las partículas son cientos de pequeñas esferas combinadas para formar un líquido o un objeto deformable.
Los gráficos se construyen como la base de un sistema de aprendizaje automático llamado red neuronal de gráficos. En el entrenamiento, el modelo con el tiempo aprende cómo las partículas en diferentes materiales reaccionan y se reforman. Lo hace calculando implícitamente varias propiedades para cada partícula., como su masa y elasticidad, para predecir si la partícula se moverá en el gráfico y dónde se moverá cuando se perturbe.
El modelo aprovecha una técnica de "propagación", que difunde instantáneamente una señal en todo el gráfico. Los investigadores personalizaron la técnica para cada tipo de material - rígido, deformable y líquido - para disparar una señal que predice las posiciones de las partículas enciertos pasos de tiempo incremental. En cada paso, se mueve y vuelve a conectar las partículas, si es necesario.
Por ejemplo, si se empuja una caja sólida, las partículas perturbadas se moverán hacia adelante. Debido a que todas las partículas dentro de la caja están conectadas rígidamente entre sí, todas las demás partículas en el objeto se mueven a la misma distancia calculada, rotación y cualquier otra dimensiónLas conexiones de partículas permanecen intactas y la caja se mueve como una sola unidad. Pero si un área de espuma deformable está sangrada, el efecto será diferente. Las partículas perturbadas se mueven mucho hacia adelante, las partículas circundantes se mueven hacia adelante solo un poco y las partículas más alejadas ganan ".no se mueva en absoluto. Con los líquidos que se derraman en una taza, las partículas pueden saltar completamente de un extremo del gráfico al otro. El gráfico debe aprender a predecir dónde y cuánto se mueven todas las partículas afectadas, lo que es computacionalmente complejo.
conformando y adaptando
En su artículo, los investigadores demuestran el modelo asignando al robot RiceGrip de dos dedos con formas de objetivo de sujeción de espuma deformable. El robot primero usa una cámara de detección de profundidad y técnicas de reconocimiento de objetos para identificar la espuma. Los investigadores al azarseleccione partículas dentro de la forma percibida para inicializar la posición de las partículas. Luego, el modelo agrega bordes entre las partículas y reconstruye la espuma en un gráfico dinámico personalizado para materiales deformables.
Debido a las simulaciones aprendidas, el robot ya tiene una buena idea de cómo cada toque, dada una cierta cantidad de fuerza, afectará cada una de las partículas en el gráfico. A medida que el robot comienza a sangrar la espuma, coincide iterativamente con el realposición mundial de las partículas a la posición objetivo de las partículas. Cuando las partículas no se alinean, envía una señal de error al modelo. Esa señal ajusta el modelo para que coincida mejor con la física del material en el mundo real.
A continuación, los investigadores apuntan a mejorar el modelo para ayudar a los robots a predecir mejor las interacciones con escenarios parcialmente observables, como saber cómo se moverá una pila de cajas cuando se empujan, incluso si solo las cajas en la superficie son visibles y la mayoría de las otraslas cajas están ocultas
Los investigadores también están explorando formas de combinar el modelo con un módulo de percepción de extremo a extremo al operar directamente en imágenes. Este será un proyecto conjunto con el grupo de Dan Yamins; Yamin recientemente completó su postdoctorado en el MIT y ahora es asistenteprofesor de la Universidad de Stanford: "Usted está lidiando con estos casos todo el tiempo donde solo hay información parcial", dice Wu. "Estamos ampliando nuestro modelo para aprender la dinámica de todas las partículas, mientras solo vemos una pequeña porción".
VIDEO: http: // youtu.
DOCUMENTO: "Aprendizaje de la dinámica de partículas para manipular cuerpos rígidos, objetos deformables y fluidos"
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Rob Matheson. Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :