Un sistema de simulación inventado en el MIT para entrenar autos sin conductor crea un mundo fotorrealista con infinitas posibilidades de dirección, lo que ayuda a los autos a navegar en una serie de peores escenarios antes de cruzar las calles reales.
Los sistemas de control o "controladores" para vehículos autónomos dependen en gran medida de conjuntos de datos del mundo real de trayectorias de conducción de conductores humanos. A partir de estos datos, aprenden a emular controles de dirección seguros en una variedad de situaciones. Pero datos del mundo realpor "casos extremos" peligrosos, como casi chocar o ser forzado a salir de la carretera o a otros carriles, son, afortunadamente, raros.
Algunos programas de computadora, llamados "motores de simulación", pretenden imitar estas situaciones al presentar caminos virtuales detallados para ayudar a entrenar a los controladores a recuperarse. Pero el control aprendido de la simulación nunca se ha demostrado que se transfiera a la realidad en un vehículo a gran escala.
Los investigadores del MIT abordan el problema con su simulador fotorrealista, llamado Síntesis de imagen virtual y transformación para la autonomía VISTA. Utiliza solo un pequeño conjunto de datos, capturado por humanos que conducen en una carretera, para sintetizar un número prácticamente infinito de nuevos puntos de vista desdetrayectorias que el vehículo podría tomar en el mundo real. El controlador es recompensado por la distancia que recorre sin chocar, por lo que debe aprender por sí mismo cómo llegar a un destino de manera segura. Al hacerlo, el vehículo aprende a navegar con seguridad cualquier situación que encuentre, incluido recuperar el control después de desviarse entre carriles o recuperarse de choques cercanos.
En las pruebas, un controlador entrenado dentro del simulador VISTA pudo desplegarse de manera segura en un automóvil sin conductor a gran escala y navegar por calles nunca antes vistas. Al colocar el automóvil en orientaciones todoterreno que imitaban varias situaciones cercanas al choque, el controlador también pudo recuperar con éxito el automóvil en una trayectoria de conducción segura en pocos segundos. Se publicó un documento que describe el sistema IEEE Robotics and Automation Letters y se presentará en la próxima conferencia de ICRA en mayo.
"Es difícil recopilar datos en estos casos extremos que los humanos no experimentan en el camino", dice el primer autor Alexander Amini, estudiante de doctorado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial CSAIL ". Sin embargo, en nuestra simulación"., los sistemas de control pueden experimentar esas situaciones, aprender por sí mismos a recuperarse de ellas y permanecer robustos cuando se implementan en vehículos en el mundo real ".
El trabajo se realizó en colaboración con el Toyota Research Institute. Junto a Amini en el papel están Igor Gilitschenski, un postdoctorado en CSAIL; Jacob Phillips, Julia Moseyko y Rohan Banerjee, todos estudiantes universitarios en CSAIL y el Departamento de Ingeniería Eléctrica y ComputaciónCiencia; Sertac Karaman, profesor asociado de aeronáutica y astronáutica; y Daniela Rus, directora de CSAIL y el profesor de Ingeniería Eléctrica y Ciencias de la Computación Andrew y Erna Viterbi.
simulación basada en datos
Históricamente, construir motores de simulación para entrenar y probar vehículos autónomos ha sido en gran medida una tarea manual. Las empresas y universidades a menudo emplean equipos de artistas e ingenieros para esbozar entornos virtuales, con marcas viales precisas, carriles e incluso hojas detalladas en los árboles.Los motores también pueden incorporar la física de la interacción de un automóvil con su entorno, basándose en modelos matemáticos complejos.
Pero dado que hay tantas cosas diferentes a considerar en entornos complejos del mundo real, es prácticamente imposible incorporar todo en el simulador. Por esa razón, generalmente hay una falta de coincidencia entre lo que los controladores aprenden en la simulación y cómo operan en el mundo realmundo.
En cambio, los investigadores del MIT crearon lo que llaman un motor de simulación "basado en datos" que sintetiza, a partir de datos reales, nuevas trayectorias consistentes con la apariencia de la carretera, así como la distancia y el movimiento de todos los objetos en la escena.
Primero recopilan datos de video de un humano que conduce por algunas carreteras y lo introducen en el motor. Para cada cuadro, el motor proyecta cada píxel en un tipo de nube de puntos 3D. Luego, colocan un vehículo virtual dentro de ese mundo.Cuando el vehículo realiza un comando de dirección, el motor sintetiza una nueva trayectoria a través de la nube de puntos, en función de la curva de dirección y la orientación y velocidad del vehículo.
Entonces, el motor utiliza esa nueva trayectoria para representar una escena fotorrealista. Para ello, utiliza una red neuronal convolucional, comúnmente utilizada para tareas de procesamiento de imágenes, para estimar un mapa de profundidad, que contiene información relacionada con la distanciade objetos desde el punto de vista del controlador. Luego combina el mapa de profundidad con una técnica que estima la orientación de la cámara dentro de una escena 3D. Todo eso ayuda a determinar la ubicación del vehículo y la distancia relativa de todo dentro del simulador virtual.
Basado en esa información, reorienta los píxeles originales para recrear una representación 3D del mundo desde el nuevo punto de vista del vehículo. También rastrea el movimiento de los píxeles para capturar el movimiento de los automóviles y las personas, y otros objetos en movimiento, en"Es equivalente a proporcionar al vehículo un número infinito de trayectorias posibles", dice Rus. "Porque cuando recopilamos datos físicos, obtenemos datos de la trayectoria específica que seguirá el automóvil. Pero podemos modificar esa trayectoria paracubrir todas las formas y entornos posibles de conducción. Eso es realmente poderoso "
refuerzo de aprendizaje desde cero
Tradicionalmente, los investigadores han estado entrenando vehículos autónomos siguiendo reglas de conducción definidas por humanos o tratando de imitar a los conductores humanos. Pero los investigadores hacen que su controlador aprenda completamente desde cero bajo un marco de "extremo a extremo", lo que significa que requierecomo entrada solo datos brutos del sensor, como observaciones visuales de la carretera, y, a partir de esos datos, predice comandos de dirección en las salidas.
"Básicamente decimos: 'Aquí hay un entorno. Puedes hacer lo que quieras. Simplemente no choques contra vehículos y quédate dentro de los carriles'", dice Amini.
Esto requiere "aprendizaje de refuerzo" RL, una técnica de aprendizaje automático de prueba y error que proporciona señales de retroalimentación cada vez que el automóvil comete un error. En el motor de simulación de los investigadores, el controlador comienza sin saber nada sobre cómo conducir, qué es un marcador de carril, o incluso cómo se ven otros vehículos, por lo que comienza a ejecutar ángulos de dirección aleatorios. Obtiene una señal de retroalimentación solo cuando se bloquea. En ese punto, se teletransporta a una nueva ubicación simulada y tiene que ejecutar un mejorconjunto de ángulos de dirección para evitar chocar nuevamente. Durante 10 a 15 horas de entrenamiento, utiliza estas señales de retroalimentación dispersas para aprender a viajar distancias cada vez mayores sin chocar.
Después de conducir exitosamente 10,000 kilómetros en simulación, los autores aplican ese controlador aprendido en su vehículo autónomo a gran escala en el mundo real. Los investigadores dicen que esta es la primera vez que un controlador entrenado usando aprendizaje de refuerzo de extremo a extremo en simulación tienese desplegó con éxito en un automóvil autónomo a gran escala ". Eso fue sorprendente para nosotros. No solo el controlador nunca antes había estado en un automóvil real, sino que nunca antes había visto las carreteras y no tiene conocimiento previo sobre cómo conducen los humanos,"Amini dice.
Obligar al controlador a correr a través de todo tipo de escenarios de manejo le permitió recuperar el control desde posiciones desorientadoras, como estar a medio camino fuera de la carretera o en otro carril, y volver al carril correcto en varios segundos ". Y otrotodos los controladores de última generación fallaron trágicamente en eso, porque nunca vieron datos como este en el entrenamiento ", dice Amini.
A continuación, los investigadores esperan simular todo tipo de condiciones de la carretera desde una sola trayectoria de conducción, como la noche y el día, y el clima soleado y lluvioso. También esperan simular interacciones más complejas con otros vehículos en la carretera ".¿otros autos comienzan a moverse y saltan delante del vehículo? ", dice Rus." Esas son interacciones complejas del mundo real que queremos comenzar a probar ".
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Rob Matheson. Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :