Bien que ce robot ne fonctionnera pas comme cuisinier à la chaîne de sitôt, il est représentatif d’une percée plus importante annoncée par les ingénieurs de Google mardi. En utilisant des logiciels d’intelligence artificielle récemment développés connus sous le nom de grands modèles de langage, les chercheurs disent qu’ils ont été en mesure de concevoir des robots qui peuvent aider les humains dans un plus large éventail de tâches quotidiennes.
Au lieu de fournir une liste d’instructions – en dirigeant chacun des mouvements du robot un par un – les robots peuvent maintenant répondre à des demandes complètes, plus comme un humain.
Lors d’une démonstration la semaine dernière, un chercheur a dit à un robot : « J’ai faim, pouvez-vous me prendre une collation ? » Le robot a ensuite fouillé dans une cafétéria, ouvert un tiroir, trouvé un sac de chips et l’apporter à l’humain.
C’est la première fois que des modèles de langage sont intégrés dans des robots, selon les dirigeants et les chercheurs de Google.
« C’est très fondamentalement un paradigme différent », a déclaré Brian Ichter, chercheur chez Google et l’un des auteurs d’un nouvel article publié mardi décrivant les progrès réalisés par l’entreprise.
Les robots sont déjà monnaie courante. Des millions d’entre eux travaillent dans des usines à travers le monde, mais ils suivent des instructions spécifiques et ne se concentrent généralement que sur une ou deux tâches, telles que le déplacement d’un produit sur la chaîne de montage ou le soudage de deux morceaux de métal ensemble. La course pour construire un robot capable d’effectuer une gamme de tâches quotidiennes et d’apprendre sur le tas est beaucoup plus complexe. Les entreprises technologiques, grandes et petites, ont travaillé pour construire de tels robots à usage général pendant des années.
Les modèles de langage fonctionnent en prenant d’énormes quantités de texte téléchargé sur Internet et en les utilisant pour former des logiciels d’intelligence artificielle à deviner quels types de réponses pourraient survenir après certaines questions ou commentaires. Les modèles sont devenus si bons pour prédire la bonne réponse que s’engager avec quelqu’un donne souvent l’impression d’avoir une conversation avec un humain bien informé. Google et d’autres entreprises, dont OpenAI et Microsoft, ont consacré des ressources à la construction de meilleurs modèles et à leur formation sur des ensembles de texte de plus en plus grands, dans plusieurs langues.
Le travail est controversé. En juillet, Google licencié un de ses employés qui avait affirmé qu’il croyait que le logiciel était sensible. Le consensus parmi les experts en IA est que les modèles ne sont pas sensibles, mais beaucoup craignent qu’ils présentent des biais parce qu’ils ont été formés sur d’énormes quantités de texte non filtré généré par l’homme.
Certains modèles linguistiques se sont révélés être raciste ou sexiste, ou facilement manipulé pour répandre des discours de haine ou des mensonges lorsqu’on y demande les bonnes déclarations ou questions.
En général, les modèles de langage pourraient donner aux robots une connaissance des étapes de planification de haut niveau, a déclaré Deepak Pathak, professeur adjoint à Carnegie Mellon, qui étudie l’IA et la robotique et commente le domaine, pas spécifiquement Google. Mais ces modèles ne donneront pas aux robots toutes les informations dont ils ont besoin – par exemple, la force à appliquer lors de l’ouverture d’un réfrigérateur. Cette connaissance doit venir d’ailleurs.
« Cela ne résout que le problème de planification de haut niveau », a-t-il déclaré.
Pourtant, Google va de l’avant et a maintenant fusionné les modèles de langage avec certains de ses robots. Désormais, au lieu d’avoir à encoder des instructions techniques spécifiques pour chaque tâche qu’un robot peut effectuer, les chercheurs peuvent simplement leur parler dans le langage courant. Plus important encore, le nouveau logiciel aide les robots à analyser eux-mêmes des instructions complexes en plusieurs étapes. Maintenant, les robots peuvent interpréter des instructions qu’ils n’ont jamais entendues auparavant et proposer des réponses et des actions qui ont du sens.
Les robots capables d’utiliser des modèles linguistiques pourraient changer la façon dont les installations de fabrication et de distribution sont gérées, a déclaré Zac Stewart Rogers, professeur adjoint de gestion de la chaîne d’approvisionnement à la Colorado State University.
« Un humain et un robot travaillant ensemble sont toujours les plus productifs » maintenant, a-t-il déclaré. « Les robots peuvent soulever manuellement des objets lourds. Les humains peuvent faire le dépannage nuancé. »
Si les robots étaient capables de comprendre des tâches complexes, cela pourrait signifier que les centres de distribution pourraient être plus petits, avec moins d’humains et plus de robots. Cela pourrait signifier moins des emplois pour les gens, bien que Rogers souligne qu’en général, lorsqu’il y a une contraction due à l’automatisation dans un domaine, des emplois sont créés dans d’autres domaines.
C’est aussi probablement encore loin. Les techniques d’intelligence artificielle telles que les réseaux de neurones et l’apprentissage par renforcement sont utilisées pour entraîner des robots depuis des années. Cela a conduit à quelques percées, mais les progrès sont encore lents. Les robots de Google sont loin d’être prêts pour le monde réel, et dans des interviews, les chercheurs et les dirigeants de Google ont déclaré à plusieurs reprises qu’ils dirigeaient simplement un laboratoire de recherche et n’avaient pas encore l’intention de commercialiser la technologie.
Mais il est clair que Google et d’autres grandes entreprises technologiques ont un intérêt sérieux pour la robotique. Amazon utilise de nombreux robots dans ses entrepôts, expérimente la livraison par drone et a accepté plus tôt ce mois-ci d’acheter le fabricant du robot aspirateur Roomba pour 1,7 milliard de dollars. (Le fondateur d’Amazon, Jeff Bezos, est propriétaire du Washington Post).
Tesla, qui a développé certaines fonctionnalités de conduite autonome pour ses voitures, est également travailler sur des robots à usage général.
En 2013, Google s’est lancé dans une frénésie de dépenses, en achetant plusieurs sociétés de robotique, dont Boston Dynamics, le fabricant du chiens robots qui deviennent souvent virales sur les médias sociaux. Mais l’exécutif responsable du programme a été accusé d’inconduite sexuelle, et a quitté l’entreprise peu de temps après. En 2017, Google vendu Boston Dynamics au géant japonais des télécommunications et de l’investissement technologique Softbank. Le battage médiatique autour de robots toujours plus intelligents conçus par les entreprises technologiques les plus puissantes s’est estompé.
Dans le cadre du projet de modèle linguistique, les chercheurs de Google ont travaillé aux côtés de ceux de Robotique de tous les jours, une société distincte mais en propriété exclusive au sein de Google qui travaille spécifiquement sur la construction de robots capables d’effectuer une gamme de tâches « répétitives » et « corvées ». Les robots sont déjà à l’œuvre dans diverses cafétérias Google, essuyant les comptoirs et jetant des ordures.