Lee Sedol, à droite, lors du premier match l'opposant à Alphago, le 9 mars. Lee Jin-man / AP

Le Sud-Coréen Lee Sedol, numéro trois mondial au classement officiel mais souvent considéré comme le meilleur joueur au monde, a concédé sa défaite, ce mercredi, face au programme Alphago conçu par Deep Mind (Google), au terme d’une partie serrée qui inaugurait une série de cinq matches prévus.

Contrairement à la série de matches remportée cinq à zéro par Alphago contre Fan Hui, l’un des meilleurs joueurs européens, en janvier, ce premier affrontement a été extrêment serré. Quelques dizaines de minutes avant la fin de la partie, le commentateur Michael Redmond (joueur professionnel, 9e dan), estimait que la partie pouvait se jouer à « un point ou deux » - un différentiel ridiculement faible dans une partie de go. M. Sedol a finalement reconnu sa défaite, malgré une position plutôt favorable sur le plateau, mais qui ne lui permettait pas de l’emporter aux points.

Lee Sedol, connu pour son style de jeu agressif, a trouvé face à lui une intelligence artificielle qui a également joué la partie de manière très volontaire. En début de partie, le champion coréen avait opté pour des coups peu orthodoxes - une manière classique de destabiliser les programmes de jeu, déjà utilisée en 1996 par le champion d’échecs Gary Kasparov avec un certain succès dans sa série de matches mythiques contre Deep Blue.

Le go est le dernier jeu « classique » dans lequel l’homme conserve un avantage net sur la machine - la taille du plateau, et le très grand nombre de mouvements possibles à chaque tour, donnent un avantage aux joueurs dotés de grandes capacités d’abstraction et de réflexion stratégique.

L’intelligence artificielle, malgré ses progrès fulgurants ces dernières années, est surtout efficace au niveau tactique, lorsque le nombre de choix est suffisament réduit pour lui permettre d’explorer chaque « branche » de décisions en profondeur. Un avantage qui favorise normalement la machine en fin de partie, lorsque le plateau est rempli

et que les choix possibles sont plus limités - mais alors que les deux compétiteurs étaient restés très proches en termes de temps utilisé pour réfléchir durant les deux premiers tiers de la partie, Alphago a pris nettement plus de temps que son adversaire pour calculer ses coups dans le dernier tiers, laissant près de 25 minutes d’avance à Lee Sedol.

« Deep learning »

Si Alphago a obtenu jusqu’à présent de bien meilleurs résultats que ses prédécesseurs, c’est en bonne partie parce qu’elle fait appel à un mélange de technologies, dont le Deep learning - une technique qui « imite » la manière dont les humains apprennent de leurs erreurs. Le logiciel a analysé des centaines de millions de parties pour « apprendre » à repérer les choix qui s’avèrent payants sur le long terme, et pouvoir ainsi faire le tri plus facilement dans les décisions possibles, comme le font les joueurs humains.

A terme, il fait peu de doute que l’intelligence artificielle parviendra à battre régulièrement les meilleurs joueurs humains - M. Sedol, pourtant coutumier des sorties bravaches, l’a lui-même reconnu. Son premier match contre Alphago a d’ores et déjà démontré, avant même la fin de la série de cinq parties prévues, que le logiciel conçu par les équipes de Deep Mind est capable de jouer au niveau des tout meilleurs joueurs mondiaux.

Le second match est prévu ce jeudi 10, à partir de cinq heures du matin heure de Paris, et sera diffusé en direct sur YouTube.

Revoir la première manche :

Le Monde