Facebook met au point un outil de traduction automatique entre 100 langues différentes

INTELLIGENCE ARTIFICIELLE Les précédents traducteurs devaient utiliser l’anglais comme étape intermédiaire entre deux idiomes

20 Minutes avec agence

— 

Facebook, illustration
Facebook, illustration — Igor Golovniov / SOPA Images/Sip/SIPA

Facebook a mis au point une nouvelle intelligence artificielle, baptisée M2M-100, capable de traduire depuis ou vers cent langues différentes sans utiliser l’anglais. Cette langue était en effet jusqu’ici une étape intermédiaire obligatoire pour la plupart des 20 milliards de traductions effectuées chaque jour par le réseau social sur la page d’accueil de chacun de ses utilisateurs.

Une traduction automatique du chinois au français consistait en fait à deux opérations successives, a par exemple expliqué l’entreprise sur son blog ce lundi.

Plus besoin de l’anglais

Les outils automatisés précédents fonctionnaient en effectuant un passage du chinois à l’anglais puis de l’anglais au français. Ces étapes successives étaient dues à la présence prépondérante de l’anglais parmi les contenus en ligne analysés par les algorithmes pour enrichir leur connaissance en matière de traduction. Elles entraînaient cependant une perte de qualité et de fluidité, tout en compliquant le processus.

Désormais, l’exactitude des résultats obtenus par M2M-100 est supérieure à celle observée dans les traductions automatiques réalisées par les programmes précédents.

Une base de 7,5 milliards de phrases

Pour arriver à leurs fins, les ingénieurs du géant californien ont créé une base de données renfermant 7,5 milliards de phrases dans les 100 langues concernées. L’algorithme a ensuite été affiné et configuré à l’aide de 15 milliards de paramètres qui « prennent en compte une plus grande diversité de structure en matière de langue et de morphologie », écrit Angela Fan, chercheuse en IA chez Facebook.

Seul un tiers des milliards de messages publiés quotidiennement par les utilisateurs de Facebook sont en anglais, précise la spécialiste. L’accès aux données et les outils utilisés par l’entreprise pour créer M2M-100 ont été publiés en open source​.