Une équipe de chercheurs de Caltech, Stanford, de l’Université du Texas et NVIDIA ont construit et partagé un agent logiciel nommé Voyager qui joue à Minecraft avec les informations et l’intelligence fournies par GPT-4. Voyager apprend, se souvient et présente ce que l’équipe appelle « une maîtrise exceptionnelle du jeu à Minecraft », en obtenant 3 fois plus d’objets, en voyageant 2 fois plus loin et en déverrouillant des étapes 15 fois plus rapidement que les agents logiciels de pointe précédents.
C’est aussi très doué pour innover.
« Voyager est capable d’utiliser la bibliothèque de compétences acquises dans un nouveau monde Minecraft pour résoudre de nouvelles tâches à partir de zéro, tandis que d’autres techniques ont du mal à se généraliser », ont déclaré les chercheurs. rapport.
À ce stade, nous devons commencer à nous demander : y a-t-il quelque chose que GPT-4 ne peut pas faire ? Le grand modèle de langage phare d’OpenAI est mieux que la plupart des avocats au passage de la barre, se classe dans le 88e centile à l’écriture du LSAT, le 99e centile à la réussite du GRE, transforme un dessin en un site Web fonctionnelaide les développeurs de logiciels à coder et imite les styles des auteurs lors de l’écriture.
Bien sûr, les grands modèles de langage ont tendance à halluciner et à inventer simplement des données aléatoires, comme l’a découvert assez péniblement un avocat qui aurait utilisé ChatGPT pour faire des recherches.
Le projet Voyager montre cependant qu’en associant les capacités de GPT-4 à un logiciel agent qui stocke les séquences qui fonctionnent et mémorise ce qui ne fonctionne pas, les développeurs peuvent obtenir des résultats époustouflants.
« Les compétences développées par Voyager sont temporellement étendues, interprétables et compositionnelles, ce qui augmente rapidement les capacités de l’agent et atténue les oublis catastrophiques », rapportent les chercheurs.
Ce qui est intéressant avec Minecraft, c’est qu’il s’agit d’un jeu en monde ouvert. Il n’y a pas d’objectifs prédéterminés, de niveaux requis ou de scénarios fixes. Cela récompense une exploration ouverte et nécessite des compétences assez générales et un large éventail d’apprentissages. Cela nécessite également un certain niveau de motivation pour explorer et rechercher de nouvelles tâches, ce que les chercheurs ont fourni en générant un « programme » via GPT-4 axé sur la découverte.
Au fur et à mesure que Voyager apprenait de nouvelles choses, ses développeurs stockaient des capacités dans une « bibliothèque de compétences » via un programme également généré par GPT-4.
En associant le tout à un mécanisme d’invite itératif auto-correctif, les chercheurs ont obtenu des capacités significatives par rapport aux agents logiciels précédents qui n’utilisaient pas GPT-4.
« Par rapport aux lignes de base, Voyager déverrouille le niveau en bois 15,3 fois plus rapidement (en termes d’itérations d’invite), le niveau en pierre 8,5 fois plus rapidement, le niveau en fer 6,4 fois plus rapidement, et Voyager est le seul à débloquer le niveau diamant de la technologie. arbre », rapportent les chercheurs.
Voyager apprend également avec succès des tâches vraiment nouvelles, en fabriquant avec succès des pioches en diamant, des épées en or, des seaux de lave et des boussoles sans formation ni connaissances préalables.
Les chercheurs et conseillers du projet sont Guanzhi Wang de NVIDIA et CalTech, Yuqi Xie de l’Université du Texas à Austin, Yunnan Jiang de Stanford, Ajay Mandlekar de NVIDIA, Chaowei Xiao1 de NVIDIA et ASU, Yuke Zhu de NVIDIA, Linxi « Jim » Fan chez NVIDIA et Anima Anandkumar chez NVIDIA et Caltech.
Suivez-moi sur Twitter ou LinkedIn. Vérifier mon site web ou un de mes autres travaux youtube.com/johnkoetsier » rel= »nofollow noopener noreferrer » target= »_blank »>ici.