La vision artificielle de la machine trop forte pour les Captchas?

SCIENCES La startup Vicarious affirme avoir conçu un système déjouant à 90% ce test...

Philippe Berry

— 

Un exemple de Captcha résolu par la startup Vicarious.
Un exemple de Captcha résolu par la startup Vicarious. — DR

De notre correspondant en Californie

Vous ne connaissez peut-être pas le nom mais vous avez déjà pesté contre les Captchas (1). Depuis des années, ce test nécessitant de recopier des caractères presque illisibles est utilisé pour prouver que l'internaute est bien humain –et pas un robot spammeur. Lundi, la startup Vicarious a suscité une certaine excitation avec un système déchiffrant, affirme-t-elle, 90% des Captchas utilisés par Google et Yahoo. La prouesse serait possible grâce à des progrès en matière de «vision artificielle» qui permettraient de rendre la machine plus intelligente. Prudence, disent des chercheurs.

>> Démonstration en vidéo

Les rumeurs de la mort des Captchas sont souvent exagérées. Régulièrement, des démos les mettent à mal. Mais son inventeur, Luis von Ahn, qui a vendu l'entreprise ReCAPTCHA à Google, en 2009, précise au magazine Scientific American que si le système n'est pas infaillible, il est régulièrement modifié pour compliquer la vie des spammeurs, par exemple en utilisant des lignes courbes ou un arrière plan contrasté.

Sur le modèle du cerveau humain

Ce qui fait débat dans la communauté scientifique, ce sont les affirmations de Vicarious sur le background nébuleux de son approche. «C'est la première fois qu'un stade humain de la perception est atteint, et nous utilisons peu de données et de puissance de calcul», écrit la startup. Elle dit exploiter une architecture de «réseau cortical récursif» qui se démarque des approches de Google ou d'IBM en misant moins sur la puissance brute et plus sur les capacités d'apprentissage de la machine. Cette dernière serait capable d'analyser la composition d'une image sur le modèle du cerveau humain.

«L'annonce de Vicarious est un non-événement», juge pour 20 Minutes le Français Yann LeCun, directeur du Center for Data Science à l'université NYU. Selon ce pionnier de la vision artificielle, la startup «n'a révélé aucun détail» sur son approche et «n'a pas prouvé qu'elle était supérieure, ou même comparable, aux méthodes existantes sur des problèmes standards». Google, par exemple, ne se contente pas de comparer deux images pour jouer au jeu des sept erreurs. Récemment, son cerveau artificiel avait appris tout seul ce qu'était un chat après avoir regardé des milliers de vidéo YouTube.

Recherches non publiées

De son côté, Vicarious a choisi ne de pas publier ses recherches et refuse pour l'instant de passer des tests pour étalonner sa méthode. Un contributeur du magazine Science a envoyé plusieurs Captchas à la startup, qui a buté sur des caractères cyrilliques et sur un fond en damier noir et blanc. Elle affirme cependant que son système peut s'adapter, et que déjouer ce test n'est pas son but de long terme.

Des progrès en matière de vision artificielle auront des applications puissantes, par exemple pour des diagnostics médicaux ou pour qu'une voiture autonome puisse faire la différence entre un chien et un enfant traversant la route. On en est loin. Si le cerveau humain consacre entre 25 et 30% de sa puissance à la vision, «les robots les plus sophistiqués d'aujourd'hui ont une vision moins performante que celle d'un rat», note Yann LeCun. «Mais les progrès sont rapides», conclut le chercheur.

(1) Captcha est un acronyme pour «completely automated public Turing test to tell computers and humans apart», «Test public de Turing complètement automatisé pour différencier les ordinateurs et les humains», en référence au test du pionnier de l'informatique Alan Turing.