Google DeepMind a présenté mercredi un modèle unique d’intelligence artificielle (IA) capable de jouer à des jeux vidéo 3D comme le ferait un humain. Le modèle d’IA s’appelle Scalable Instructable Multiworld Agent ou SIMA, et il apprend à interagir avec divers environnements de jeu et à effectuer différentes tâches. Le modèle est actuellement en recherche et est toujours en cours de formation pour acquérir une expertise dans l’exécution de mouvements plus complexes. Google affirme qu’une fois perfectionné, le modèle d’IA peut avoir un large éventail de cas d’utilisation dans le monde en ligne et réel.
Dans un article de blog, l’équipe SIMA de DeepMind a expliqué que le modèle d’IA n’est pas développé pour devenir un joueur super intelligent capable de battre n’importe quel jeu. L’objectif est plutôt de lui apprendre à se déplacer dans un jeu 3D dans des situations de monde ouvert et à comprendre comment un humain réagirait et interagirait avec lui à l’aide d’instructions en langage naturel. Google souligne qu’il s’agit d’une tâche très difficile et qui devrait être une priorité.
“Il s’agit d’un objectif important pour l’IA en général, car même si les grands modèles linguistiques ont donné naissance à des systèmes puissants capables de capturer des connaissances sur le monde et de générer des plans, ils n’ont actuellement pas la capacité d’agir en notre nom”, a déclaré l’équipe SIMA. .
Pour créer un environnement d’apprentissage pour le modèle d’IA, Google DeepMind s’est associé à huit studios de jeux et a formé SIMA sur neuf jeux vidéo différents. Certains d’entre eux incluent No Man’s Sky de Hello Games, Teardown de Tuxedo Labs, Goat Simulator 3 et Valheim de Coffee Stain Studios, et plus encore. Le modèle d’IA a été exposé à de nouveaux mondes interactifs dans chaque jeu et a dû apprendre à naviguer dans le monde, à interagir avec les objets, à utiliser les menus, etc.
L’entreprise a également créé quatre environnements de recherche, dont un nouvel environnement construit avec Unity appelé Construction Lab. Dans cet environnement particulier, le modèle d’IA a été chargé de construire des sculptures à partir de blocs de construction pour tester sa manipulation d’objets et sa compréhension intuitive du monde physique.
Google a souligné que la version actuelle de SIMA a été évaluée sur 600 compétences de base, notamment la navigation, comme tourner à gauche et conduire une voiture, l’interaction avec des objets, comme grimper sur une échelle et fabriquer un casque, et bien plus encore. Les tâches étaient en grande partie simples et pouvaient être accomplies en 10 secondes.
Selon l’entreprise, entraîner un modèle d’IA sur un ensemble diversifié de jeux vidéo 3D où il suit les instructions humaines et agit en conséquence peut avoir un impact majeur à l’avenir. L’entreprise se concentre désormais sur la formation SIMA avec des instructions plus complexes « qui nécessitent une planification stratégique de haut niveau et de multiples sous-tâches, comme trouver des ressources et construire un camp ». Google laisse entendre que ces tâches peuvent être transposées dans le monde réel et l’entreprise s’efforce de trouver des moyens d’aider les humains.