Minecraft n'est pas seulement le jeu vidéo le plus vendu de l'histoire, il pourrait également jouer un rôle clé dans la création de modèles d'intelligence artificielle adaptables, capables d'effectuer une variété de tâches comme le font les humains.
Steven James à l'Université du Witwatersrand en Afrique du Sud et ses collègues ont développé un test de référence dans le cadre Minecraft pour mesurer l’intelligence générale des modèles d’IA. MinePlanner évalue la capacité d'une IA à ignorer les détails sans importance tout en résolvant un problème complexe en plusieurs étapes.
De nombreuses formations en IA « trichent » en donnant à un modèle toutes les données dont il a besoin pour apprendre à faire un travail et rien de superflu, explique James. C'est une approche fructueuse si vous souhaitez créer un logiciel pour accomplir une tâche spécifique, comme prédire la météo ou protéines repliables – mais pas si vous essayez de créer une intelligence générale artificielle, ou AGI.
James dit que les futurs modèles d'IA devront s'attaquer à des problèmes complexes, et il espère que MinePlanner guidera cette recherche. L'IA travaillant pour résoudre un problème dans le jeu verra le paysage, les objets superflus et d'autres détails qui ne sont pas nécessairement nécessaires pour résoudre un problème et doivent être ignorés. Il devra étudier son environnement et déterminer par lui-même ce qui est nécessaire ou non.
MinePlanner se compose de 15 problèmes de construction, chacun avec un niveau facile, moyen et difficile, pour un total de 45 tâches. Pour accomplir chaque tâche, l’IA devra peut-être franchir des étapes intermédiaires – construire un escalier afin de placer des blocs à une certaine hauteur, par exemple. Cela exige que l’IA puisse s’écarter du problème et planifier à l’avance afin d’atteindre un objectif.
Lors d'expériences avec les modèles d'IA de planification de pointe ENHSP et Fast Downward, des programmes open source conçus pour gérer des opérations séquentielles dans la poursuite d'un objectif global, aucun des deux modèles n'a été en mesure de résoudre aucun des problèmes difficiles. Fast Downward n'a pu résoudre qu'un seul des problèmes moyens et cinq des problèmes faciles, tandis que ENHSP a obtenu des résultats légèrement meilleurs en résolvant tous les problèmes faciles sauf un et tous les problèmes moyens sauf deux.
« Nous ne pouvons pas exiger qu'un concepteur humain vienne dire à l'IA exactement ce dont elle devrait et ne devrait pas se soucier pour chaque tâche qu'elle pourrait avoir à résoudre », explique James. « C'est le problème que nous essayons de résoudre. »
Les sujets: