3 September 2022
Smart Thermostatic Valves
Cet article n'est disponible qu'en anglais....
Des ingénieurs du CSEM ont mis au point une nouvelle méthode d’apprentissage pour les ordinateurs, afin de faire entrer l’intelligence artificielle dans des domaines jusqu’ici trop sensibles. Testée en simulation pour gérer l’énergie d’un bâtiment de 100 pièces, elle promet des économies de l’ordre de 20%.
En 2016, un super ordinateur autodidacte devenait imbattable au jeu de go. Son secret ? l’apprentissage par renforcement. Cette branche de l’intelligence artificielle permet aux machines de s’entraîner de façon autonome à partir de consignes simples, d’apprendre de leurs erreurs, et de devenir ultra-performantes.
Seul inconvénient : ces méthodes sont inutilisables pour certaines applications de la vie réelle. Au début de l’apprentissage, les ordinateurs essayent en effet toutes sortes de possibilités avant d’obtenir la solution optimale. Ce cheminement exploratoire pose problème pour la gestion des systèmes de chauffage, par exemple, où des sauts rapides de températures ne sont pas acceptables.
Au CSEM, les ingénieurs ont mis au point une solution inédite pour contourner ce problème. Ils ont montré qu’il était possible de pré-entraîner les machines sur des systèmes théoriques ultrasimples, avant de les lancer dans la vie réelle. Résultats : l’ordinateur pré-entraîné, une fois confronté au système complexe, obtient rapidement de très bonnes performances, sans passer par des calculs extrêmes. Le travail des chercheurs est publié dans la revue scientifique IEEE Transactions on neural networks and learning systems.
«C’est un peu comme le fait d’apprendre la théorie avant de se mettre au volant d’une voiture», explique Pierre-Jean Alet, responsable des activités de digitalisation de l’énergie au CSEM, et co-auteur de l’étude. «Avec le préapprentissage, l’ordinateur possède des connaissances de base qui lui évitent de tâtonner à l’aveugle, à la recherche de la bonne solution.»
Pour démontrer leur concept, les chercheurs se sont attaqués au système de ventilation, chauffage et climatisation d’un bâtiment complexe de 100 pièces.
Le nouveau processus devrait ouvrir la voie à de nouvelles applications dans le domaine de l’apprentissage automatique. Elle pourrait s’appliquer pour toutes les situations où des perturbations liées aux phases exploratoires ont un coût monétaire ou sécuritaire.
Source : Baptiste Schubnel, Rafael E. Carrillo, Pierre-Jean Alet, and Andreas Hutter, A hybrid learning method for system identification and optimal control, IEEE Transactions on neural networks and learning systems.