Screenshot 2024 04 02 at 2.08.29 PM
https://arxiv.org/abs/2403.19267v1

L’intelligence artificielle (IA) a connu des progrès remarquables ces dernières années, les chercheurs repoussant constamment les limites de ce que les machines peuvent réaliser. Un domaine qui a retenu beaucoup d’attention est le développement de simulateurs multi-agents, qui visent à créer des environnements virtuels dans lesquels les agents d’IA peuvent interagir entre eux et avec leur environnement. Ces simulations offrent une opportunité unique d'étudier les comportements collectifs, les dynamiques sociales et l'émergence de systèmes complexes. Cependant, de nombreux simulateurs multi-agents existants fonctionnent dans des conditions idéalisées, en supposant une information parfaite et des capacités illimitées pour les agents impliqués. Cette déconnexion des contraintes du monde réel peut limiter la validité écologique et la richesse des interactions observées dans ces environnements simulés.

MtY48Hh0CcQSo0eelntgGL6kj9yunLK46g53PR1QtB4Sqb6y klJnqneF5AriDrauNOSJYEZtOttnEs3 UDRHZT2deZNJhv0AUuKYe5 a pCDo2DFWO c5nlme4lMgArmt8v WxGB08T2xWrDr NmO8

Afin de combler cet écart, les chercheurs ont développé MineTerre (illustré dans la figure 2), un simulateur multi-agents basé sur Minecraft qui introduit des sens multimodaux limités et des besoins physiques comme principaux moteurs du comportement et de l'interaction des agents. À la base, MineLand est conçu pour gérer simultanément un nombre sans précédent d'agents, prenant en charge jusqu'à 48 agents sur un ordinateur de bureau grand public. Cet exploit est réalisé grâce à une conception architecturale innovante qui optimise les performances et l’utilisation des ressources. Inspirés par l'hypothèse selon laquelle les agents ne possèdent que des sens multimodaux limités, les agents de MineLand opèrent dans des environnements partiellement observables avec une perception visuelle et auditive restreinte. Cela reflète les interactions sociales réelles, où la visibilité et l'audibilité sont affectées par des facteurs tels que la distance, le terrain et le contexte. De plus, MineLand intègre dans ses agents des besoins physiques réalistes, tels que la faim et le besoin d’un abri. Ces besoins introduisent un aspect temporel dans la routine quotidienne des agents, nécessitant une collaboration et une compétition pour les ressources, à l'image des interactions complexes observées dans les sociétés humaines.

MineLand propose diverses structures de tâches et difficultés, couvrant des scénarios tels que la récolte, la progression de l'arbre technologique, le combat, la survie, la construction et les performances scéniques. Les utilisateurs peuvent personnaliser le nombre de joueurs et choisir entre les modes coopératif ou compétitif et le mode gratuit par défaut. Cette flexibilité fait de MineLand une excellente plate-forme pour évaluer les capacités multi-agents émergentes. Pour intégrer les agents dans ce simulateur, les chercheurs ont développé un framework d'agents IA appelé Alex (illustré dans la figure 3), inspiré de la théorie du multitâche du domaine de la cognition. Alex permet la simulation et l'exécution simultanées de coordination et de planification complexes sur plusieurs tâches. Ce cadre intègre un composant multitâche qui permet aux agents de contrôler efficacement leur attention et leur mémoire de travail, en basculant de manière transparente entre les activités de communication et les actions axées sur des objectifs, un peu comme les humains dans des scénarios du monde réel.

Les chercheurs ont obtenu des résultats intrigants grâce à leurs expériences avec MineLand et Alex. Par exemple, ils ont observé que les informations multimodales permettaient aux agents d’effectuer des actions plus appropriées, tandis que le mécanisme multitâche permettait aux agents de traiter plusieurs tâches simultanément en déterminant de manière autonome leur priorité. De plus, des sens limités obligeaient les agents à communiquer activement pour compenser leurs déficiences sensorielles, et les agents ayant des besoins physiques présentaient des durées de survie plus longues, reflétant leur comportement réel. Les chercheurs ont notamment constaté que les agents travaillant ensemble réduisaient plus efficacement la charge de travail par agent, mais au prix d’une augmentation des dépenses de communication. En outre, les traits de personnalité ont joué un rôle important dans la détermination du comportement des agents dans les sociétés multi-agents, les agents faisant preuve d'une grande ouverture ayant tendance à établir une collaboration et à s'engager dans une communication mutuelle.

Publicité

MineLand représente une avancée significative pour combler le fossé entre les agents virtuels et les humains du monde réel. En introduisant des sens multimodaux et des besoins physiques limités, ce simulateur offre un environnement plus réaliste et nuancé pour étudier les interactions d'agents et les dynamiques sociales complexes. Les découvertes obtenues grâce à MineLand et Alex font non seulement progresser notre compréhension des multi-agents de l’IA, mais recèlent également un immense potentiel d’applications dans des domaines tels que la dynamique humaine, la psychologie sociale, la robotique et la conception de jeux. Alors que les chercheurs continuent d’explorer les capacités de cette plateforme innovante, nous pouvons nous attendre à de nouveaux développements et progrès passionnants dans le domaine des systèmes multi-agents d’IA incorporée.


Vérifiez Papier et GitHub. Tout le mérite de cette recherche revient aux chercheurs de ce projet. N'oubliez pas non plus de nous suivre sur Twitter. Rejoignez notre Chaîne de télégramme, Chaîne Discordeet LinkedIn Groups.

Si vous aimez notre travail, vous allez adorer notre bulletin..

N'oubliez pas de rejoindre notre 39 000+ sous-reddit ML

Vineet Kumar est stagiaire consultant chez MarktechPost. Il poursuit actuellement son BS à l'Institut indien de technologie (IIT), Kanpur. Il est passionné de Machine Learning. Il est passionné par la recherche et les dernières avancées en matière de Deep Learning, de Computer Vision et de domaines connexes.

4.7/5 - (4 votes)
Publicité
Article précédentAperçu : investissements dans la 5G et la fibre de l'opérateur de télécommunications d'État uruguayen Antel
Article suivantLa demande d'iPhone OLED d'Apple baisse de 19% alors que Huawei et Xiaomi voient une augmentation – Display Daily

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici