L’intelligence artificielle (IA) et l’apprentissage automatique (ML) sont des domaines en pleine évolution qui ont eu un impact considérable sur divers secteurs. Les agents autonomes, une branche spécialisée de l’IA, sont conçus pour fonctionner de manière indépendante, prendre des décisions et s’adapter à des environnements changeants. Ces agents sont essentiels pour les tâches qui nécessitent une planification à long terme et une interaction avec des environnements complexes et dynamiques. Le développement d’agents autonomes capables de gérer des tâches en monde ouvert marque une étape majeure vers la réalisation de l’intelligence artificielle générale (AGI), qui vise à créer des systèmes dotés de capacités cognitives comparables à celles des humains.
Dans des environnements dynamiques et imprévisibles, les agents autonomes sont confrontés à de nombreux défis. Les méthodes traditionnelles doivent souvent rattraper leur retard dans leur capacité à planifier et à s'adapter sur le long terme, ce qui est essentiel pour mener à bien des tâches complexes. Le principal défi réside dans la nécessité d'un cadre permettant d'évaluer et d'améliorer efficacement les capacités de planification et d'exploration de ces agents, leur permettant de naviguer et d'interagir efficacement avec des environnements complexes du monde réel.
Les méthodes actuelles d'évaluation des agents autonomes sont limitées, en particulier dans les contextes de monde ouvert. Les agents d'apprentissage par renforcement ont démontré des connaissances limitées et ont du mal à planifier à long terme. Les repères existants n'évaluent pas de manière exhaustive les performances d'un agent dans des tâches diverses et dynamiques, soulignant la nécessité d'un cadre d'évaluation plus robuste et polyvalent pour répondre à ces limitations.
Des chercheurs de l'Université du Zhejiang et de l'Université de la ville de Hangzhou ont présenté le « Odyssey Framework », une nouvelle approche conçue pour évaluer les capacités de planification et d'exploration des agents autonomes. Ce cadre innovant s'appuie sur de grands modèles de langage (LLM) pour générer des plans et guider les agents dans des tâches complexes. Des entreprises telles que Microsoft Research et google DeepMind ont également contribué au développement de ce cadre de pointe.
Le framework Odyssey utilise des LLM pour faciliter la planification à long terme, la planification dynamique-immédiate et les tâches d'exploration autonomes. En générant des plans basés sur le langage, le framework permet aux agents de décomposer les objectifs de haut niveau en sous-objectifs spécifiques, ce qui rend les tâches complexes plus faciles à gérer. Cette méthode utilise la récupération sémantique pour faire correspondre les compétences les plus pertinentes à partir d'une bibliothèque prédéfinie, permettant aux agents de s'adapter efficacement aux nouvelles situations et d'exécuter les tâches de manière efficace.
L'architecture du framework Odyssey se compose d'un planificateur, d'un acteur et d'un critique, chacun jouant un rôle crucial dans l'exécution des tâches de l'agent. Le planificateur élabore un plan complet, décomposant les objectifs de haut niveau en sous-objectifs spécifiques et réalisables. L'acteur exécute ces sous-objectifs en récupérant et en appliquant les compétences les plus pertinentes de la bibliothèque de compétences. Le critique évalue l'exécution, fournit des commentaires et des informations pour affiner les stratégies futures. Cette approche globale garantit que les agents peuvent s'adapter et s'améliorer en permanence.
Les expériences avec le framework Odyssey ont donné des résultats impressionnants, soulignant son efficacité. Les agents utilisant le framework ont réalisé 85 % des tâches de planification à long terme, contre 60 % pour les modèles de base. Les tâches de planification dynamique-immédiate ont enregistré un taux de réussite de 90 %, ce qui est nettement supérieur aux 65 % obtenus par les méthodes précédentes. De plus, les tâches d'exploration autonome ont démontré une amélioration de 40 % de l'efficacité, les agents parvenant à naviguer avec succès dans des environnements complexes et à terminer les tâches en 30 % de temps en moins. Le taux d'erreur global a été réduit de 25 % et les agents ont montré une augmentation de 20 % du taux d'achèvement des tâches. Ces résultats soulignent la capacité du framework à améliorer efficacement les performances des agents autonomes dans des scénarios en monde ouvert.
En conclusion, le cadre Odyssey répond aux défis cruciaux de l'évaluation et de l'amélioration des capacités de planification et d'exploration des agents autonomes. Le cadre fournit une solution complète pour le développement d'agents autonomes avancés en s'appuyant sur des LLM et une méthode d'évaluation robuste. Cette approche innovante marque une étape importante vers la réalisation de l'AGI, offrant des informations précieuses et des avantages pratiques pour la recherche et les applications futures.
Vérifiez Papier et GitHub. Tous les mérites de cette recherche reviennent aux chercheurs de ce projet. N'oubliez pas non plus de nous suivre sur Twitter et rejoignez notre Chaîne Telegram et LinkedIn Groups. Si vous aimez notre travail, vous allez adorer notre bulletin..
N'oubliez pas de nous rejoindre Plus de 47 000 sous-reddits ML
Trouver à venir Webinaires sur l'IA ici
Nikhil est consultant stagiaire chez Marktechpost. Il poursuit un double diplôme intégré en matériaux à l'Indian Institute of Technology de Kharagpur. Nikhil est un passionné d'IA/ML qui recherche en permanence des applications dans des domaines tels que les biomatériaux et les sciences biomédicales. Fort d'une solide expérience en science des matériaux, il explore de nouvelles avancées et crée des opportunités de contribution.