L'intelligence artificielle de Facebook écrase plusieurs champions de poker

SCIENCES Il s'agit d'une première, alors que les jeux à plusieurs représentaient jusqu'à présent une tâche complexe pour la machine

20 Minutes avec AFP

— 

Le bluff de Pluribus, l'intelligence artificielle de Facebook, a déstabilisé les champions humains de poker.
Le bluff de Pluribus, l'intelligence artificielle de Facebook, a déstabilisé les champions humains de poker. — FACEBOOK

Après les dames, les échecs, le jeu de go et le poker à deux, une intelligence artificielle a battu des champions de poker dans des parties à six, ont annoncé jeudi des chercheurs de l’université Carnegie Mellon et de Facebook. L’exploit de cette intelligence artificielle, appelée Pluribus, est décrit dans la prestigieuse revue américaine Science.

« Pluribus a accompli une performance surhumaine au poker multijoueurs, ce qui constitue une étape majeure pour l’intelligence artificielle et pour la théorie des jeux », relève Tuomas Sandholm, professeur de sciences informatiques à Carnegie Mellon, et co-développeur de Pluribus avec le doctorant Noah Brown, actuellement dans l’unité d’intelligence artificielle de Facebook.

Entraînée contre elle-même

« Jusqu’à présent, les grandes étapes d’intelligence artificielle surhumaine en termes de raisonnement stratégique se limitaient à des jeux à deux », poursuit-il dans un communiqué de l’université.

Selon les deux concepteurs de Pluribus, la voie est ouverte pour que l’intelligence artificielle résolve davantage de problèmes du monde réel où, comme au poker, des informations sont cachées ou indisponibles et des joueurs bluffent.

Pluribus a d’abord battu deux grands champions de poker, Darren Elias et Chris Ferguson. Chacun a joué plus de 5.000 parties contre Pluribus, qui a largement gagné. La machine s’est ensuite opposée à treize professionnels – cinq à la fois – pour un total de 10.000 parties. Là encore, Pluribus est ressortie victorieuse. Elle s’était d’abord entraînée à jouer contre elle-même au poker Texas hold’em, apprenant au fil de décisions aléatoires les subtilités du jeu. Ses inventeurs l’ont laissée développer ses tactiques, avec des surprises à la clé.

Un coup surprenant

« Sa principale force est sa capacité à recourir à différentes stratégies », a commenté le joueur Darren Elias. « Les humains essaient de faire pareil mais, pour les humains, l’exécution laisse à désirer. La plupart des gens n’arrivent pas vraiment à le faire de façon parfaitement aléatoire et avec constance ».

Pluribus a ainsi recouru à des coups surprenants, par exemple une décision souvent considérée comme mauvaise par les pros et appelée en anglais « donk betting », quand un joueur mise de façon agressive quand cela ne présente pas d’avantage tactique. Noah Brown va jusqu’à penser que la victoire de Pluribus pourrait « changer la façon dont les pros jouent au poker ». Ça va devenir impossible de gagner à Las Vegas contre la machine.