Un livre sur l'intelligence artificielle, traduit par une intelligence artificielle : la boucle est bouclée. "Deep learning", l'ouvrage de référence sur l'apprentissage profond, "seul livre compréhensible sur le sujet" d'après Elon Musk, sort enfin en version française le 18 octobre. Sa particularité : il est le premier livre au monde à être entièrement traduit par une intelligence artificielle. Ce défi technologique - l'ouvrage comporte de nombreux termes techniques et formules mathématiques -, est le fruit d'une collaboration entre l'expert français Quantmetry et la startup allemande DeepL.

Première mondiale et performance technologique majeure

Écrit par trois pointures mondiales de l'IA (l'ancien employé de Google Brain Ian Goodfellow, les chercheurs Yoshua Bengio et Aaron Courville), "Deep learning", 800 pages, sorti aux États-Unis en 2016, est considéré comme la bible des étudiants, professeurs, chercheurs et ingénieurs spécialisés dans l'intelligence artificielle. S'il ne s'agit pas d'un ouvrage grand public, il fait tout de même partie des best-sellers des livres scientifiques (10.000 ventes en trois mois sur Amazon fin 2016). Il est non seulement une référence pour décrire l'état de l'art des concepts et des techniques d'apprentissage profond dans le monde, mais le livre est aussi considéré comme un support de choix pour nourrir le débat montant autour des implications sociétales, culturelles et économiques de l'intelligence artificielle, notamment autour de l'intelligibilité et de la puissance prédictive des algorithmes.

"Traduire un livre aussi technique que "Deep learning" ne représente pas le même niveau de difficulté que de traduire un roman, notamment pour les figures, les graphiques et les formules mathématiques", explique Jérémy Harroch, le fondateur et Pdg de Quantmetry, société de conseil spécialisée dans l'IA.

Pour résoudre cette difficulté, Quantmetry a fait appel à la startup allemande DeepL, qui a développé début 2018 un outil de traduction automatique basée sur l'apprentissage profond, considéré comme "le meilleur du marché" par Jérémy Harroch et Nicolas Bousquet, le directeur scientifique de Quantmetry. "Nous les avons associés pour créer un outil capable de traduire le langage informatique au format LateX, qui est le Word des articles scientifiques [prononcer "la tech", Ndlr]", précise Nicolas Bousquet.

Au total, deux mois et demi de travail ont été nécessaires pour créer l'outil, traduire le texte de 800 pages en moins de douze heures, puis effectuer des relectures humaines. Quatre correcteurs, des chercheurs issus de l'ENSAI, de l'INRIA et du CNRS y ont contribué.

"La traduction par l'IA, même à ce niveau d'excellence, nécessite toujours un petit travail de relecture humaine, pour effectuer des ajustements et quelques corrections. Mais 85% du texte est resté tel que traduit par l'IA. Les corrections ont donc été marginales", assure Jérémy Harroch.

Le gain de temps et d'argent par rapport à une traduction classique est spectaculaire, assure Quantmetry. "Pour traduire 'Deep learning' en français, il aurait fallu mobiliser une dizaine d'excellents spécialistes déjà très occupés, cela aurait pris au moins un an et aurait coûté très cher", explique Nicolas Bousquet, qui estime le gain de temps et d'argent à environ 80%. L'entreprise refuse d'indiquer le coût de sa traduction.

Positionner le français en tant que langue pour enseigner et penser l'IA

Édité par Quantmetry et les Éditions Massot, 'L'Apprentissage profond' pourrait se vendre, d'après les estimations de la maison d'édition, entre 2.000 et 3.000 exemplaires en France. Pour Quantmetry, qui "ne va pas gagner d'argent" sur cette opération, l'enjeu est surtout symbolique. La prouesse technique devrait contribuer à crédibiliser l'entreprise, qui compte une cinquantaine de clients grands groupes et 80 employés, comme un acteur majeur de l'IA en France.

Mais Jérémy Harroch et Nicolas Bousquet souhaitent également que cette traduction aide à "penser les sciences différemment", en affirmant le français comme une langue d'étude et d'analyse de l'IA.

"Tous les étudiants, chercheurs, entrepreneurs et ingénieurs spécialisés dans l'IA sont capables de lire un ouvrage en anglais, donc il n'y avait pas de réel besoin pour que 'Deep learning' trouve son public en France. Mais la traduction va grandement simplifier les choses pour les étudiants. De plus, populariser des termes de l'IA en français est important pour développer une pensée propre sur l'IA en France et défendre la francophonie dans l'enseignement des disciplines scientifiques", affirme Nicolas Bousquet.

--

[La couverture originale du livre]

--

Pour parfaire l'ouvrage, même sa couverture - une image de la Tour Eiffel, voir l'illustration de l'article -, a été "traduite". Fidèle à l'esprit de la couverture originale - une vue de Central Park à New York -, Quantmetry a choisi un lieu emblématique parisien et l'a soumis au même traitement que la photo originale : une transformation par des outils de transfert de style open source, notamment DeepDream Generator de Google.