En 2016, una supercomputadora venció al campeón mundial en Go, un complicado juego de mesa. ¿Cómo? Mediante el aprendizaje por refuerzo, un tipo de inteligencia artificial mediante el cual las computadoras se entrenan a sí mismas después de ser programadas con instrucciones simples. Las computadoras aprenden de sus errores y,paso a paso, vuélvete muy poderoso.
El principal inconveniente del aprendizaje por refuerzo es que no se puede utilizar en algunas aplicaciones de la vida real. Esto se debe a que, en el proceso de entrenamiento, las computadoras inicialmente intentan casi cualquier cosa y todo antes de finalmente tropezar con el camino correcto.La fase de prueba y error puede ser problemática para ciertas aplicaciones, como los sistemas de control de clima donde no se tolerarían cambios abruptos de temperatura.
Aprender el manual del conductor antes de arrancar el motor
Los ingenieros de CSEM han desarrollado un enfoque que supera este problema. Demostraron que las computadoras se pueden entrenar primero en modelos teóricos extremadamente simplificados antes de configurarlas para aprender en sistemas de la vida real. Eso significa que cuando las computadoras inician el proceso de aprendizaje automáticoen los sistemas de la vida real, pueden aprovechar lo que aprendieron anteriormente en los modelos. Por lo tanto, las computadoras pueden tomar el camino correcto rápidamente sin pasar por un período de fluctuaciones extremas. La investigación de los ingenieros se acaba de publicar en Transacciones IEEE en redes neuronales y sistemas de aprendizaje .
"Es como aprender el manual del conductor antes de arrancar un automóvil", dice Pierre-Jean Alet, director de investigación de sistemas de energía inteligente en CSEM y coautor del estudio. "Con este paso previo a la capacitación, las computadoras se acumulanuna base de conocimientos a la que pueden recurrir para no volar a ciegas mientras buscan la respuesta correcta ".
Reducción del uso de energía en más del 20%
Los ingenieros probaron su enfoque en un sistema de calefacción, ventilación y aire acondicionado HVAC para un edificio complejo de 100 habitaciones utilizando un proceso de tres pasos. Primero, entrenaron una computadora en un "modelo virtual" construido a partir de ecuaciones simples quedescribieron de manera aproximada el comportamiento del edificio. Luego, introdujeron datos reales del edificio temperatura, cuánto tiempo estuvieron abiertas las persianas, condiciones climáticas, etc. en la computadora, para hacer el entrenamiento más preciso. Finalmente, dejaron que la computadora ejecutara sus algoritmos de aprendizaje por refuerzopara encontrar la mejor manera de administrar el sistema HVAC. Amplias aplicaciones
Este descubrimiento podría abrir nuevos horizontes para el aprendizaje automático al expandir su uso a aplicaciones donde grandes fluctuaciones en los parámetros operativos tendrían importantes costos financieros o de seguridad.
Fuente de la historia :
Materiales proporcionado por Centro Suizo de Electrónica y Microtecnología - CSEM . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :