Pre-entrenan a las computadoras de inteligencia artificial para hacerlas aún más potentes

En 2016, una supercomputadora venció al campeón mundial en Go, un complicado juego de mesa. ¿Cómo? Utilizando el aprendizaje de refuerzo, un tipo de inteligencia artificial en la que los ordenadores se entrenan a sí mismos después de ser programados con instrucciones simples. Los ordenadores aprenden de sus errores y, paso a paso, se vuelven muy poderosos.

El principal inconveniente del aprendizaje de refuerzo es que no se puede utilizar en algunas aplicaciones de la vida real. Eso es porque en el proceso de entrenamiento, los ordenadores inicialmente intentan casi todo antes de acabar tropezando con el camino correcto. Esta fase inicial de prueba y error puede ser problemática para ciertas aplicaciones, como los sistemas de control climático, en los que no se tolerarían cambios bruscos de temperatura.

Los ingenieros del CSEM han desarrollado un método que supera este problema. Demostraron que las computadoras pueden ser entrenadas primero en modelos teóricos extremadamente simplificados antes de ser preparadas para aprender sobre sistemas de la vida real. Esto significa que cuando las computadoras comienzan el proceso de aprendizaje automático en los sistemas de la vida real, pueden utilizar lo que aprendieron previamente en los modelos. Por lo tanto, las computadoras pueden tomar rápidamente el camino correcto sin pasar por un período de fluctuaciones extremas. La investigación de los ingenieros acaba de ser publicada en la revista IEEE Transactions on Neural Networks and Learning Systems.

«Es como aprender el manual del conductor antes de arrancar un coche», dice Pierre-Jean Alet, jefe de investigación de sistemas de energía inteligente en el CSEM y coautor del estudio. «Con este paso previo a la formación, los ordenadores construyen una base de conocimientos a la que pueden recurrir para no ir a ciegas mientras buscan la respuesta correcta».

Los ingenieros probaron su enfoque en un sistema de calefacción, ventilación y aire acondicionado (HVAC) para un complejo edificio de 100 habitaciones usando un proceso de tres pasos. Primero, entrenaron a una computadora en un «modelo virtual» construido a partir de ecuaciones simples que describían aproximadamente el comportamiento del edificio. Luego introdujeron en la computadora datos reales del edificio (temperatura, tiempo de apertura de las persianas, condiciones climáticas, etc.), para que el adiestramiento fuera más preciso. Finalmente, dejaron que la computadora ejecutara sus algoritmos de aprendizaje de refuerzo para encontrar la mejor manera de manejar el sistema de HVAC.

Este descubrimiento podría abrir nuevos horizontes para el aprendizaje automático al ampliar su uso a aplicaciones en las que las grandes fluctuaciones de los parámetros de funcionamiento tendrían importantes costes financieros o de seguridad. (Fuente: NCYT Amazings)