L'intelligence artificielle de Deepmind (Google) apprend en se souvenant

SCIENCES Il s'agit d'une avancée importante en vue d'un apprentissage généralisé...

Philippe Berry

— 

Le système de la filiale de Google, Deepmind, a appris à jouer à une dizaine de jeux en utilisant ses progrès précédents.

Le système de la filiale de Google, Deepmind, a appris à jouer à une dizaine de jeux en utilisant ses progrès précédents. — DEEPMIND

Les systèmes d’apprentissage par « deep learning » ont une limitation majeure : ils perdent la mémoire face à chaque nouveau problème. Du coup, ils excellent à une tâche spécifique (reconnaître une image, traduire un texte, jouer au Go) mais ils ont une polyvalence inférieure à celle d’un poisson rouge. Deepmind, la start-up rachetée par Google en 2014, affirme cependant avoir mis au point des réseaux neuronaux capables d’apprendre « en continu », une percée majeure sur la route d’une intelligence artificielle générale (IA « forte ») qui nous mettra tous au chômage.

Attention à ne pas s’enflammer, on est encore très loin de la « singularité », ce moment hypothétique où émergera une « super-intelligence ». Mais selon Deepmind, l’avancée prouve que le problème de « l’oubli catastrophique » des réseaux neuronaux n’est pas insurmontable.

« Consolidation synaptique »

Le système de Deepmind avait déjà mis l’humain minable en apprenant tout seul à jouer à une trentaine de jeux d’arcade (Space Invaders, Pong etc.) en se basant uniquement sur le score pour évaluer l’impact positif ou négatif d’une action. Mais pour cela, la start-up avait mis au point autant de systèmes que de jeux. A chaque fois, il fallait tout reprendre de zéro. Cette fois, un seul système a réussi à maîtriser dix jeux en mettant à profit ses avancées précédentes, avec un niveau « approchant » celui des humains. Traduction : le système général n’excelle pas encore autant que l’algorithme spécialisé mais il est davantage polyvalent. Comme nous.

Le système, qui s’appuie sur une approche statistique, s’inspire d’ailleurs de la « consolidation synaptique » humaine pour solidifier la mémoire de court terme : si une connexion est jugée importante, elle est protégée et archivée afin de ne pas être effacée. Chez l’homme, la seconde étape de la consolidation de la mémoire intervient, selon les chercheurs, pendant le sommeil. A quand des androïdes qui rêvent de moutons électriques comme chez Philip K. Dick ?