DeepMind, l'intelligence artificielle née dans les labos de Google, a réussi un véritable exploit en dominant des humains à Starcraft II, l'un des jeux les plus populaires de stratégie en temps réel. Il y a encore 15 mois, la machine n'en était pas capable...

Cela vous intéressera aussi [EN VIDÉO] Interview : comment est née l'intelligence artificielle ? L’intelligence artificielle vise à mimer le fonctionnement du cerveau humain, ou du moins sa logique lorsqu’il s’agit de prendre des décisions. Jean-Claude Heudin, directeur du laboratoire de recherche de l’IIM (Institut de l’Internet et du multimédia), nous explique l'origine de ces recherches.

Des chercheurs de DeepMind viennent de publier en ligne les conclusions de leurs récentes recherches en intelligence artificielle (IA), baptisée AlphaStar. Ce programme, sorte de joueur virtuel, est le premier à battre un joueur humain professionnel au jeu très populaire StarCraft II. Pour jauger l'un des jeux les plus complexes à maîtriser pour l'IA, les chercheurs de l'entreprise londonienne ont mis au point cet AlphaStar en utilisant différentes techniques d'apprentissage profond.

Jusqu'à présent, l'intelligence artificielle était déjà parvenue à battre des joueurs humains sur des jeux Atari, Mario, Quake III ou encore Dota 2. Cependant, pour maîtriser StarCraft II, il était pour l'instant nécessaire de faire appel à des cartes simplifiées, de modifier les règles du jeu ou de créer des éléments du système à la main. AlphaStar est le premier à réussir l'exploit de battre un humain sans circonstances spéciales. Dans les faits, l'IA est ainsi parvenue à battre Grzegorz « MaNa » Komincz, de l'équipe Team Liquid, l'un des meilleurs joueurs professionnels au monde. Le programme a remporté la partie 5 à 0 dans des conditions de match professionnelles et sans restrictions. En fait, la seule restriction était pour la machine, trop rapide dans ses déplacements pour l'Homme. Il a donc fallu, volontairement, ralentir son exécution pour permettre au participant de jouer dans des conditions « humaines ».

Un jeu très complexe

Pour la première fois, DeepMind a dominé des humains dans un jeu de stratégie en temps réel. Une avancée importante pour les chercheurs et les ingénieurs © Blizzard Entertainment

Les chercheurs ont dû faire face à cinq obstacles de taille. Comme dans le jeu « pierre-papier-ciseaux », il n'existe pas de stratégie unique gagnante et l'IA doit constamment s'adapter. L'information est incomplète, les joueurs découvrant la carte au fur et à mesure. La relation de cause à effet n'est pas immédiate, et il faut être capable de planifier à long terme. De plus, le jeu se déroule en temps réel, plutôt qu'au tour par tour. Enfin, le nombre d'actions possibles est gigantesque, avec des centaines d'unités et de bâtiments à gérer dans l'immédiat. Les chercheurs avancent le chiffre de 10²⁶ actions possibles à tout moment.

Ils ont réussi cet exploit grâce à un système reposant sur le principe du Deep Learning. Il utilise un réseau neuronal profond ainsi que l'apprentissage supervisé qui s'apparente à l'apprentissage par concept chez l'humain, et l'apprentissage par renforcement qui vise à obtenir une récompense maximale.

D’autres applications envisagées

Les ingénieurs de Google ne s'intéressent pas à StarCraft II uniquement pour le jeu en lui-même. Il représente un défi capable de faire évoluer la manière d'aborder l'intelligence artificielle. Les chercheurs espèrent utiliser les techniques d'AlphaStar pour résoudre d'autres problèmes complexes. Avec des parties du jeu pouvant durer une heure et plus, et des dizaines de milliers d'actions, son réseau neuronal est capable de modéliser des séquences d'actions très longues, basées sur des informations incomplètes.

Ces avancées pourraient trouver des applications dans le monde réel, tel que les prédictions météo, la modélisation du climat ou la compréhension du langage. Ils estiment aussi que leurs méthodes pourraient être utilisées pour l'étude d'IA plus robustes, AlphaStar étant conçu pour trouver les solutions les plus sûres, avec le moins de risques d'erreurs ou de bugs.

Pour en savoir plus

StarCraft : les humains meilleurs que les IA, pour le moment…

Article de Marc Zaffagni publié le 3 novembre 2017

À l'occasion du premier tournoi opposant des humains à des intelligences artificielles dans des parties de Starcraft, un joueur professionnel a battu quatre IA, dont celle développée par Facebook.

Contrairement aux échecs ou au jeu de go, les humains ont encore le dessus sur l'intelligence artificielle (IA) avec le jeu vidéo Starcraft. Une compétition opposant des joueurs professionnels de ce jeu de stratégie en temps réel à plusieurs IA s'est tenue en début de semaine à Séoul, en Corée du Sud, et a vu la domination sans équivoque d'un humain. Song Byung-gu, l'un des meilleurs joueurs actuels de Starcraft, a remporté toutes ses parties contre quatre agents informatiques (bots en anglais) différents.

Il s'agissait d'IA développées par des spécialistes en Australie, Corée et Norvège ainsi que « CherryPi », entrainée par Facebook. C'est la première fois que ce concours qui existe depuis 2010 met aux prises des humains contre des machines. Les parties furent courtes (10,5 mn maximum) et les IA n'ont semble-t-il pas fait preuve d'une grande audace dans leur stratégie comme l'explique le MIT Technology Review. Mais tout de même, les machines ont montré des dispositions intéressantes dans leur système de défense.

Starcraft, un défi majeur pour l’intelligence artificielle

Starcraft est considéré comme le nouveau défi majeur pour la recherche en intelligence artificielle. Contrairement au jeu de go où les protagonistes ont une vision complète du plateau, les jeux de stratégie imposent une information partielle sur ce que fait l'adversaire. La part d'incertitude est donc beaucoup plus importante. Pour les chercheurs, une IA capable de battre un humain à Starcraft sera en mesure d'accomplir des tâches complexes dans le monde réel.

Après avoir démontré sa supériorité au jeu de go, DeepMind, filiale d'Alphabet (Google), a décidé de relever ce défi. L'une des clés de la victoire d'AlphaGo est que le programme a pu s'améliorer en ingurgitant des milliers de parties de go. Or, une telle masse de données n'est pas encore disponible pour Starcraft. Mais cela va changer. Cet été, DeepMind et Blizzard Entertainment (éditeur de ce jeu de stratégie en temps réel) ont annoncé la mise à disposition d'une interface de programmation (API) d'apprentissage automatique (machine learning) ainsi qu'une base de données de 65.000 parties anonymes de Starcraft II pour entraîner les IA. Les progrès ne devraient pas tarder à se faire sentir. Dès lors, ce ne sera plus qu'une question de temps avant que le règne des humains sur Starcraft ne soit sérieusement contesté.