Bon nombre des problèmes les plus urgents de la société sont devenus de plus en plus complexes, de sorte que la recherche de solutions peut sembler écrasante. Chez DeepMind et Google, nous pensons que si nous pouvons utiliser l’IA comme un outil pour découvrir de nouvelles connaissances, les solutions seront plus faciles à atteindre.
En 2016, nous avons développé conjointement un Système de recommandation alimenté par l’IA améliorer l’efficacité énergétique des centres de données de Google déjà hautement optimisés. Notre réflexion était simple : même des améliorations mineures permettraient de réaliser d’importantes économies d’énergie et de réduire les émissions de CO2 pour aider à lutter contre le changement climatique.
Maintenant, nous faisons passer ce système au niveau supérieur : au lieu de recommandations mises en œuvre par l’homme, notre système d’IA contrôle directement le refroidissement du centre de données, tout en restant sous la supervision experte de nos opérateurs de centres de données. Ce système de contrôle basé sur le cloud, le premier du genre, permet désormais de réaliser des économies d’énergie en toute sécurité dans plusieurs centres de données Google.
Comment ça marche
Toutes les cinq minutes, notre IA basée sur le cloud extrait un instantané du système de refroidissement du centre de données à partir de milliers de capteurs et l’alimente dans nos réseaux de neurones profonds, qui prédisent comment différentes combinaisons d’actions potentielles affecteront la consommation d’énergie future. Le système d’IA identifie ensuite les actions qui minimiseront la consommation d’énergie tout en satisfaisant un ensemble robuste de contraintes de sécurité. Ces actions sont renvoyées au centre de données, où elles sont vérifiées par le système de contrôle local, puis mises en œuvre.
L’idée est née des commentaires des opérateurs de nos centres de données qui utilisaient notre système de recommandation d’IA. Ils nous ont dit que, bien que le système leur ait enseigné de nouvelles pratiques exemplaires, comme répartir la charge de refroidissement sur plus d’équipement plutôt que sur moins d’équipement, la mise en œuvre des recommandations nécessitait trop d’efforts et de supervision de la part de l’opérateur. Naturellement, ils voulaient savoir si nous pouvions réaliser des économies d’énergie similaires sans mise en œuvre manuelle.
Nous sommes heureux de dire que la réponse a été oui!
Conçu pour la sécurité et la fiabilité
Les centres de données de Google contiennent des milliers de serveurs qui alimentent des services populaires, notamment Google Search, Gmail et YouTube. S’assurer qu’ils fonctionnent de manière fiable et efficace est essentiel à la mission. Nous avons conçu nos agents d’IA et l’infrastructure de contrôle sous-jacente à partir de zéro en gardant à l’esprit la sécurité et la fiabilité, et utilisons huit mécanismes différents pour nous assurer que le système se comportera comme prévu à tout moment.
Une méthode simple que nous avons mise en œuvre consiste à estimer l’incertitude. Pour chaque action potentielle – et il y en a des milliards – notre agent d’IA calcule sa confiance qu’il s’agit d’une bonne action. Les actions avec peu de confiance sont éliminées de la considération.
Une autre méthode est la vérification à deux couches. Les actions optimales calculées par l’IA sont vérifiées par rapport à une liste interne de contraintes de sécurité définies par nos opérateurs de centres de données. Une fois les instructions envoyées du cloud au centre de données physique, le système de contrôle local vérifie les instructions par rapport à son propre ensemble de contraintes. Cette vérification redondante garantit que le système reste dans les limites des contraintes locales et que les opérateurs conservent le contrôle total des limites d’exploitation.
Plus important encore, nos opérateurs de centres de données ont toujours le contrôle et peuvent choisir de quitter le mode de contrôle de l’IA à tout moment. Dans ces scénarios, le système de contrôle passera de manière transparente du contrôle de l’IA aux règles et heuristiques sur site qui définissent l’industrie de l’automatisation aujourd’hui.
Découvrez ci-dessous les autres mécanismes de sécurité que nous avons développés :
Augmenter les économies d’énergie au fil du temps
Alors que notre système de recommandation initial prévoyait que les opérateurs vérifiaient et mettent en œuvre les actions, notre nouveau système de contrôle de l’IA met directement en œuvre les actions. Nous avons délibérément limité les limites d’optimisation du système à un régime d’exploitation plus étroit pour donner la priorité à la sécurité et à la fiabilité, ce qui signifie qu’il existe un compromis risque/récompense en termes de réduction d’énergie.
Bien qu’il ne soit en place que depuis quelques mois, le système permet déjà de réaliser des économies d’énergie constantes d’environ 30 % en moyenne, avec d’autres améliorations attendues. C’est parce que ces systèmes s’améliorent avec le temps avec plus de données, comme le montre le graphique ci-dessous. Nos limites d’optimisation seront également élargies à mesure que la technologie mûrira, pour des réductions encore plus importantes.
Notre système de contrôle direct de l’IA trouve encore plus de nouvelles façons de gérer le refroidissement qui ont surpris même les opérateurs de centres de données. Dan Fuenffinger, l’un des opérateurs de centres de données de Google qui a beaucoup travaillé avec le système, a déclaré: « C’était incroyable de voir l’IA apprendre à tirer parti des conditions hivernales et à produire de l’eau plus froide que la normale, ce qui réduit l’énergie nécessaire au refroidissement dans le centre de données. Les règles ne s’améliorent pas avec le temps, mais l’IA le fait. »
Nous sommes ravis que notre système de contrôle direct de l’IA fonctionne de manière sûre et fiable, tout en réalisant constamment des économies d’énergie. Cependant, les centres de données ne sont que le début. À long terme, nous pensons qu’il est possible d’appliquer cette technologie dans d’autres contextes industriels et d’aider à lutter contre le changement climatique à une échelle encore plus grande.