Des chercheurs de Caltech, de Stanford, de l’Université du Texas et de NVIDIA ont développé et publié en collaboration Voyageurun agent de puissance LLM qui utilise GPT-4 s’engager Minecraft.net/ »>Minecraft jouabilité. Voyager démontre des capacités remarquables en apprenant, en conservant ses connaissances et en mettant en valeur une expertise exceptionnelle dans Minecraft.
Voyageur fonctionne de manière autonome, explore en permanence le monde virtuel, acquiert diverses compétences et fait des découvertes révolutionnaires sans aucune intervention humaine. L’innovation de Voyager réside dans son programme automatique qui optimise l’exploration, une bibliothèque de compétences en constante expansion pour stocker et récupérer des comportements complexes, et un mécanisme d’incitation itératif qui intègre les commentaires sur l’environnement, les erreurs d’exécution et l’auto-vérification pour l’amélioration du programme.
Voyager se compose de trois éléments clés: un programme automatique pour l’exploration ouverte, une bibliothèque de compétences pour des comportements de plus en plus complexes et un mécanisme d’incitation itératif qui utilise le code comme espace d’action.
En utilisant des requêtes de boîte noire pour interagir avec GPT-4, Voyager contourne le besoin d’affiner les paramètres du modèle. Les compétences développées par Voyager sont à la fois étendues dans le temps et interprétables, ce qui entraîne une croissance composée rapide des capacités de l’agent et atténue l’oubli catastrophique.
Selon Jim Fanl’un des chercheurs du projet, l’expérience GPT-4 dans Minecraft est un bon point de départ pour créer des Agents IA. Les agents autonomes dotés de larges capacités sont la prochaine étape de l’intelligence artificielle. Ils sont motivés par la curiosité et la survie pour explorer, planifier et apprendre de nouvelles capacités dans des environnements ouverts.
Par rapport aux lignes de base, Voyager déverrouille le niveau en bois 15,3 fois plus rapidement en termes d’itérations d’incitation, le niveau en pierre 8,5 fois plus rapidement, le niveau en fer 6,4 fois plus rapidement, et Voyager est le seul à déverrouiller le niveau diamant de l’arbre technologique.
Un attribut sans précédent de Voyager est sa capacité à utiliser la bibliothèque de compétences apprises dans un nouveau monde Minecraft pour résoudre de nouvelles tâches à partir de zéro, un exploit que d’autres approches ont du mal à réaliser lors de la généralisation.
Les agents d’apprentissage tout au long de la vie sont des modèles d’IA conçus pour acquérir des connaissances et des compétences en continu tout au long de leur durée de vie opérationnelle. Ils possèdent la capacité de s’adapter, d’apprendre et de s’améliorer à mesure qu’ils rencontrent de nouvelles informations et expériences. Les agents d’apprentissage tout au long de la vie excellent dans la conservation et le transfert des connaissances, ce qui leur permet de gérer efficacement des tâches et des domaines divers. Leur capacité d’apprentissage continu les rend précieux dans divers domaines, notamment les jeux, la robotique, la santé et l’éducation.
Avec Voyager, Minecraft entre dans une nouvelle ère d’innovation, jetant les bases des avancées futures des agents incarnés d’apprentissage tout au long de la vie.