Noticias científicas

de organizaciones de investigación

1

2

Los métodos de adiestramiento de perros ayudan a los investigadores a enseñar a los robots a aprender nuevos trucos

Fecha :: 26 de octubre de 2020
Fuente :: Universidad Johns Hopkins
Resumen :: Con una técnica de entrenamiento que se usa comúnmente para enseñar a los perros a sentarse y quedarse quietos, los científicos informáticos le mostraron a un robot cómo aprender a sí mismo varios trucos nuevos, incluido apilar bloques. Con el método, el robot, llamado Spot, pudo aprender en días lo quenormalmente tarda un mes.
Compartir :

HISTORIA COMPLETA

Con una técnica de entrenamiento que se usa comúnmente para enseñar a los perros a sentarse y quedarse quietos, los científicos informáticos de la Universidad Johns Hopkins le mostraron a un robot cómo aprender varios trucos nuevos, incluido apilar bloques. Con el método, el robot, llamado Spot, pudo aprenderen días, lo que suele tardar un mes.

Al utilizar el refuerzo positivo, un enfoque familiar para cualquiera que haya usado golosinas para cambiar el comportamiento de un perro, el equipo mejoró drásticamente las habilidades del robot y lo hizo lo suficientemente rápido para hacer que entrenar robots para el trabajo en el mundo real sea una empresa más factible. Los hallazgos sonrecientemente publicado en un artículo llamado "¡Buen robot!"

"La pregunta aquí era cómo conseguimos que el robot aprenda una habilidad", dijo el autor principal, Andrew Hundt, estudiante de doctorado que trabaja en el Laboratorio de Robótica e Interacción Computacional de Johns Hopkins. "He tenido perros, así que sé que las recompensas funcionany esa fue la inspiración de cómo diseñé el algoritmo de aprendizaje ".

A diferencia de los humanos y los animales que nacen con cerebros altamente intuitivos, las computadoras son pizarras en blanco y deben aprender todo desde cero. Pero el verdadero aprendizaje a menudo se logra mediante prueba y error, y los especialistas en robótica todavía están descubriendo cómo los robots pueden aprender de manera eficiente de sus errores..

El equipo logró eso aquí al diseñar un sistema de recompensas que funciona para un robot de la misma manera que las golosinas funcionan para un perro. Donde un perro puede obtener una galleta por un trabajo bien hecho, el robot gana puntos numéricos.

Hundt recordó cómo una vez le enseñó a su cachorro de mezcla de terrier llamado Leah el comando "déjalo", para que ella pudiera ignorar a las ardillas en los paseos. Usó dos tipos de golosinas, golosinas de entrenador ordinarias y algo aún mejor, como queso. Cuando Leah estabaemocionada y olfateando las golosinas, no consiguió nada. Pero cuando se calmó y miró hacia otro lado, consiguió las cosas buenas. "Fue entonces cuando le di el queso y dije: '¡Déjalo! ¡Buena Leah!'"

De manera similar, para apilar bloques, Spot el robot necesitaba aprender a concentrarse en acciones constructivas. A medida que el robot exploraba los bloques, rápidamente aprendió que los comportamientos correctos para apilar ganaban puntos altos, pero los incorrectos no ganaban nada. Alcance pero no¿No agarras un bloque? No hay puntos. ¿Derribar una pila? Definitivamente no hay puntos. El lugar ganó más colocando el último bloque encima de una pila de cuatro bloques.

La táctica de entrenamiento no solo funcionó, tomó solo días enseñarle al robot lo que solía tomar semanas. El equipo pudo reducir el tiempo de práctica al entrenar primero a un robot simulado, que es muy parecido a un videojuego, y luego correrpruebas con Spot.

"El robot quiere la puntuación más alta", dijo Hundt. "Aprende rápidamente el comportamiento correcto para obtener la mejor recompensa. De hecho, solía llevar un mes de práctica para que el robot alcanzara el 100% de precisión. Pudimospara hacerlo en dos días. "

El refuerzo positivo no solo sirvió para ayudar al robot a aprender a apilar bloques, con el sistema de puntos, el robot aprendió con la misma rapidez varias otras tareas, incluso cómo jugar un juego de navegación simulado. La capacidad de aprender de errores de todo tipode situaciones es fundamental para diseñar un robot que pueda adaptarse a nuevos entornos.

"Al principio, el robot no tiene idea de lo que está haciendo, pero mejorará cada vez más con cada práctica. Nunca se rinde, sigue tratando de apilar y es capaz de terminar la tarea el 100% del tiempo", dijo Hundt..

El equipo imagina que estos hallazgos podrían ayudar a entrenar a los robots domésticos para lavar la ropa y lavar los platos, tareas que podrían ser populares en el mercado abierto y ayudar a las personas mayores a vivir de forma independiente. También podrían ayudar a diseñar automóviles autónomos mejorados.

"Nuestro objetivo es eventualmente desarrollar robots que puedan realizar tareas complejas en el mundo real, como el ensamblaje de productos, el cuidado de los ancianos y la cirugía", dijo Hager. "Actualmente no sabemos cómo programar tareas como esa -- el mundo es demasiado complejo. Pero un trabajo como este nos muestra que es prometedora la idea de que los robots pueden aprender a realizar estas tareas del mundo real de una manera segura y eficiente ".

marque la diferencia: oportunidad patrocinada

Fuente de la historia :

Materiales proporcionado por Universidad Johns Hopkins . Nota: el contenido se puede editar por estilo y longitud.

Referencia de la revista :

Andrew Hundt, Benjamin Killeen, Nicholas Greene, Hongtao Wu, Heeyeon Kwon, Chris Paxton, Gregory D. Hager. "¡Buen robot!": Aprendizaje por refuerzo eficiente para tareas visuales de varios pasos con Transferencia de Sim a Real . Cartas de robótica y automatización IEEE , 2020; 5 4: 6724 DOI: 10.1109 / LRA.2020.3015448

cite esta página :

Universidad Johns Hopkins. "Los métodos de adiestramiento de perros ayudan a los investigadores a enseñar a los robots a aprender nuevos trucos". ScienceDaily. ScienceDaily, 26 de octubre de 2020. .

Universidad Johns Hopkins. 2020, 26 de octubre. Los métodos de adiestramiento de perros ayudan a los investigadores a enseñar a los robots a aprender nuevos trucos. ScienceDaily . Obtenido el 28 de octubre de 2020 de www.science-things.com/releases/2020/10/201026135805.htm

Universidad Johns Hopkins. "Los métodos de adiestramiento de perros ayudan a los investigadores a enseñar a los robots a aprender nuevos trucos". ScienceDaily. Www.science-things.com/releases/2020/10/201026135805.htm consultado el 28 de octubre de 2020.

1

2

3

4

5

HISTORIAS RELACIONADAS

DESDE LA WEB

ScienceDaily comparte enlaces con sitios en red TrendMD y obtiene ingresos de anunciantes externos, cuando se indique.

1

2

Los métodos de adiestramiento de perros ayudan a los investigadores a enseñar a los robots a aprender nuevos trucos

1

2

3

4

5

1

2

3

4

5

La nave espacial OSIRIS-REx de la NASA toca con éxito el asteroide

La nave espacial OSIRIS-REx de la NASA recolecta una cantidad significativa de asteroides

Sonríe, saluda: algunos exoplanetas también pueden vernos

Reactivación de células después de un ataque cardíaco

Mil millones de péndulos diminutos podrían detectar la masa perdida del universo

La ventosa inspirada en el pulpo transfiere injertos de tejido fino y delicado y biosensores

Similitud 'espeluznante' en cómo ven los cerebros y las computadoras

Los videojuegos pueden cambiar tu cerebro

Los científicos desarrollan 'mini cerebros' para ayudar a los robots a reconocer el dolor y a autorepararse

Las galaxias en el universo infantil eran sorprendentemente maduras

Los geólogos simulan las condiciones del suelo para ayudar a cultivar plantas en Marte

Vista más completa de la psique de asteroides masiva

Los métodos de adiestramiento de perros ayudan a los investigadores a enseñar a los robots a aprender nuevos trucos

Lanzamiento de nanocars de próxima generación

Los robots ayudan a responder la antigua pregunta de por qué el banco de peces

¿Motores cuánticos con enredo como combustible?

Microrobot todoterreno voltea a través de un colon en vivo

Los científicos desarrollan 'mini cerebros' para ayudar a los robots a reconocer el dolor y a autorepararse