Lorsque DeepMind, une filiale d’Alphabet, a commencé il y a plus de dix ans, la résolution de certaines questions de recherche et problèmes les plus urgents avec l’IA n’était pas au sommet de l’esprit de l’entreprise.
Au lieu de cela, la société a commencé la recherche sur l’IA avec des jeux informatiques. Chaque score et chaque victoire étaient un bâton de mesure du succès, et indiquaient que l’IA de DeepMind allait dans la bonne direction.
« Il y a cinq ans, nous avons conquis le jeu de Go. C’était un grand moment », a déclaré Colin Murdoch, le directeur des affaires, lors d’une discussion au coin du feu mardi au Sommet sur le matériel d’IA tenue à Santa Clara, en Californie.
De nombreuses années plus tard, l’expérience de jeu s’est maintenant transformée en un effort d’IA beaucoup plus ambitieux pour résoudre des problèmes massifs dans des domaines tels que le repliement des protéines, la fusion nucléaire et la chimie quantique.
Le projet de recherche DeepMind le plus remarquable est AlphaFold, qui peut prédire les structures 3D de plus de 200 millions de protéines connues. Le repliement des protéines est fondamental pour le processus de découverte de médicaments, et l’IA de DeepMind a été utilisée dans la recherche de vaccins et de médicaments contre le Covid-19.
« Cela signifie que nous sommes passés d’années à … compte-rendu. Nous pouvons maintenant plier une protéine en quelques minutes », a déclaré Murdoch au public.
Murdoch a également parlé de l’IA de DeepMind dans les réacteurs à fusion nucléaire. Lors de la construction de tels réacteurs, le plasma – qui est très chaud et volatil – doit être contrôlé. Les chercheurs ont travaillé pendant un certain nombre d’années pour contrôler le plasma, mais DeepMind a été en mesure d’utiliser ses recherches en IA pour contrôler la fusion nucléaire et le plasma.
Dans sa quête pour résoudre des problèmes scientifiques complexes, DeepMind n’a pas oublié les problèmes quotidiens. Murdoch a déclaré que les chercheurs de DeepMind ont développé une technologie pour optimiser la durée de vie de la batterie des smartphones Android, ce qui est une fonctionnalité demandée par les utilisateurs de smartphones.
La priorité de DeepMind est cependant beaucoup plus grande que la résolution de problèmes de smartphones ou de centres de données – l’organisation a pour objectif à long terme de créer un système d’«intelligence générale artificielle », qui ressemble davantage à un système d’IA à usage général capable d’effectuer des tâches humaines de routine. Par exemple, les robots avec un AGI seront capables d’effectuer des tâches de routine effectuées par des humains.
« Avec l’intelligence générale artificielle, vous pouvez jouer aux échecs, tic tac toe. Il pourrait écrire un essai. Vous pouvez répondre aux questions. Il peut faire plus de choses que nous pouvons faire en tant qu’humains », a déclaré Murdoch.
Murdoch a reconnu que la société essayait de recréer les fonctions d’un cerveau humain, mais a précisé que l’idée n’était pas de créer une IA sensible, ce qui a été un sujet controversé ces derniers temps. Un ingénieur de Google plus tôt cette année a affirmé qu’un chatbot IA avait gagné en sensibilité.
Les efforts de DeepMind dans des domaines tels que le repliement des protéines et la fusion nucléaire résolvent des problèmes spécifiques et ne relèvent pas de la fonctionnalité cérébrale de résolution de problèmes généraux. Mais Murdoch a déclaré que le traitement du langage naturel – où l’on peut obtenir des réponses cohérentes en parlant aux ordinateurs en phrases complètes ou partielles – était plus ambitieux pour l’intelligence générale de l’IA.
Les grands modèles de langage sont capables de faire un meilleur travail en complétant des choses comme remplir des e-mails, résumer des transcriptions et écrire du code, qui sont des tâches humaines quotidiennes, a déclaré Murdoch.
« Ce que nous avons découvert, c’est que ces modèles sont souvent capables de faire des choses dont on n’a pas encore entendu parler », a déclaré Murdoch.
Les modèles d’IA en langage naturel deviennent complexes, approchant près de 1 billion de paramètres et devraient encore augmenter. Bien que cela rende la formation des modèles d’IA plus précise, cela nécessite également plus de ressources informatiques.
DeepMind est en train de créer ce que Murdoch a appelé une « usine modèle » d’IA, dans laquelle de grands modèles d’IA peuvent être transformés en versions de la taille d’une bouchée en fonction de la tâche et des besoins informatiques. Certains de ces modèles d’IA dérivés peuvent faire partie des plans d’intelligence artificielle à long terme de DeepMind.
Murdoch a également déclaré que les ressources de Google telles que Google Cloud et les puces TPU ont été essentielles à la capacité de DeepMind à exécuter des projets de recherche.
« Nous avons une gamme diversifiée de systèmes matériels pour correspondre à ce large éventail de programmes de recherche », a déclaré Murdoch.
Les TPU de Google – qui sont des circuits intégrés spécifiques aux applications – ont été particulièrement utiles pour DeepMind dans la formation de modèles de langage à grande échelle. DeepMind utilise une variété de processeurs et de GPU, mais la feuille de route matérielle de Google aide DeepMind à façonner sa feuille de route de recherche, a déclaré Murdoch.