Un groupe de chercheurs de l’Université de Stanford et Google ont créé un monde virtuel miniature de style RPG similaire à Les Simsoù 25 caractères, contrôlés par ChatGPT et le code personnalisé, vivent leur vie de manière indépendante avec un haut degré de comportement réaliste. Ils ont écrit sur leur expérience dans un papier académique préimprimé sorti vendredi.
« Les agents génératifs se réveillent, préparent le petit-déjeuner et se rendent au travail ; les artistes peignent pendant que les auteurs écrivent ; ils se forgent des opinions, se remarquent et initient des conversations ; ils se souviennent et réfléchissent aux jours passés tout en planifiant le lendemain », écrivent les les chercheurs dans leur papier« Agents générateurs : simulacres interactifs du comportement humain. »
Pour y parvenir, les chercheurs se sont fortement appuyés sur un grand modèle de langage (LLM) pour l’interaction sociale, en particulier le API ChatGPT. De plus, ils ont créé une architecture qui simule les esprits avec des souvenirs et des expériences, puis laisse les agents se perdre dans le monde pour interagir. Et les humains peuvent aussi interagir avec eux.
« Les utilisateurs peuvent observer et intervenir pendant que les agents planifient leurs journées, partagent des nouvelles, établissent des relations et coordonnent les activités de groupe », écrivent-ils. C’est l’œuvre de Joon Sung Park, Joseph C. O’Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang et Michael S. Bernstein.
Les jeux informatiques et vidéo incluent des personnages contrôlés par ordinateur depuis les années 1970, mais jamais auparavant ils n’avaient été en mesure de simuler un environnement social avec la complexité du langage naturel qui pourrait maintenant être possible grâce à des modèles d’IA génératifs comme ChatGPT. Bien que la recherche du groupe ne soit pas nécessairement un « jeu », elle pourrait être le prototype d’un avenir où des personnages de RPG dynamiques interagissent de manière complexe et inattendue.
« Imaginez tuer un PNJ et revenir en ville et assister à des funérailles pour lui », a plaisanté un utilisateur de Twitter nommé Denis Hansen en répondant à un fil de discussion sur les implications émergentes du document. À en juger par cette recherche, ce n’est peut-être pas un scénario farfelu.
La vie à Smallville
Pour étudier le groupe d’agents de l’IA, les chercheurs ont créé une ville virtuelle appelée « Smallville », qui comprend des maisons, un café, un parc et une épicerie. À des fins d’interaction humaine, le monde est représenté à l’écran à partir d’une vue aérienne à l’aide de graphiques en pixels de style rétro rappelant un RPG japonais 16 bits classique.
Smallville abrite une communauté de 25 individus distincts, chacun représenté par un avatar de sprite de base. Pour capturer l’identité de chaque agent et ses liens avec les autres membres de la communauté, les chercheurs ont créé un paragraphe de description en langage naturel comme mémoire germe. Ces descriptions incluent des détails sur la profession de chaque agent et ses relations avec d’autres agents. Par exemple, voici un extrait d’une de ces mémoires de départ fournies dans l’article :
John Lin est un commerçant de pharmacie au Willow Market and Pharmacy qui aime aider les gens. Il est toujours à la recherche de moyens de faciliter le processus d’obtention de médicaments pour ses clients. John Lin vit avec sa femme, Mei Lin, qui est professeur d’université, et son fils, Eddy Lin, qui étudie la théorie musicale. John Lin aime beaucoup sa famille.
En tant qu’environnement virtuel, Smallville est divisé en zones et en objets. Les utilisateurs humains peuvent entrer dans le monde en tant qu’agent existant ou nouveau, et les utilisateurs et les agents peuvent influencer l’état des objets par des actions. Les utilisateurs humains peuvent également interagir avec des agents d’intelligence artificielle par le biais d’une conversation ou en émettant des directives en tant que « voix intérieure ». Les utilisateurs communiquent en langage naturel, en spécifiant un personnage que l’agent les perçoit comme, ou peuvent utiliser la voix intérieure pour influencer les actions de l’agent.