Le tribunal de commerce de Paris a condamné le développeur d'un moteur de recherche à « cesser de dénigrer » Qwant, au motif que « la divulgation d’une information de nature à jeter le discrédit sur un concurrent constitue un dénigrement, peu important qu’elle soit exacte, l’exception de vérité n’étant pas admise en [la] matière ». Nous avons donc voulu vérifier ce qu’il en était. Retour d'abord sur la génèse du conflit, puis, dans un second temps, sur son « fact-check ».

Il se demandait également « pourquoi cela a demandé 2 ans pour créer ce site, sachant qu’il n’y a aucune réelle technologie originale ni innovante derrière ? », tout en déplorant « beaucoup de buzz pour peu de chose et un pauvre travail d’investigation de la part de la presse spécialisée ».

En guise de conclusion, le blogueur qualifiait Qwant de « vraie déception » : « ce n’est pas un nouveau moteur de recherche et encore moins un moteur de recherche « made in France ». C’est juste une interface, pas forcément réussie, qui utilise les technologies d’autres moteurs de recherche et qui les présente à sa sauce ».

Son « knowledge graph », lui, ne faisait que « récupérer le résumé de la colonne de droite de Wikipedia et l’intégrer dans sa page », mais sans le préciser, contrairement à ce que prévoyait la licence de Wikipedia. Cet « oubli » fut d'ailleurs rectifié dans la foulée.

Mais trois jours plus tard, un blogueur anonyme révélait que celui qui était alors présenté comme un « Google killer 100 % français », ne faisait jamais, pour ses recherches web et médias, « qu’utiliser et resservir les résultats de Bing : toutes les requêtes renvoient exactement les mêmes résultats que Bing (...) En gros : Qwant paye Bing pour afficher ses résultats ».

En réponse à un journaliste qui lui demandait pourquoi il avait, jusque là, « gardé le secret sur ce moteur », Jean-Manuel Rozan, co-fondateur de Qwant, expliquait avoir « fait exprès de développer discrètement, pendant deux ans, ce moteur de recherche pour éviter de donner nos bonnes idées à nos concurrents ».

Edward Snowden n’avait pas encore fait son coming out, et la protection de la vie privée n’était donc pas le maître-mot du moteur. Dans son tout premier communiqué de presse, Qwant se présentait en effet comme « un moteur de recherche révolutionnaire comme il n'en a jamais existé », et qui « innove radicalement ». De fait, il proposait, sur une seule et même page, les résultats issus du web, des images et vidéos, des actualités, du shopping et « surtout les réseaux sociaux ».

Véritable serpent de mer, la question de la dépendance de Qwant à Microsoft Bing est un boulet qu’il traîne depuis son lancement, en février 2013.

En réponse, un certain Laurent Bourrelly, se présentant comme un « search engine hacker », l’abreuvait d’insultes, au motif qu’il aurait « étripé Qwant anonymement, sans avoir pris la peine de (s)’informer correctement », et de conclure : « Ça mérite l’échafaud ».

Suite à la polémique, Qwant reconnaissait sur son blog que s’il avait bien « développé un système propre d’indexation », ce dernier nécessitait « non seulement de gigantesques puissances de calcul et de stockage, mais également un historique important ». Ce pourquoi Qwant complétait ses propres données avec des informations « obtenues auprès d’autres moteurs de recherches durant la phase de montée en puissance de son infrastructure ».

« Ces mélanges disparaîtront dès lors que le déploiement sera finalisé et l’ensemble des résultats proposés proviendront dès lors du seul travail d’indexation et de classement effectué par Qwant », précisait le communiqué.

Au Figaro, qui s’étonnait de découvrir que le moteur recourait « aussi massivement aux résultats de Bing (…) moyennant finances, selon un contrat passé avec Microsoft », Qwant reconnut que le fait de ne l’avoir jamais mentionné au préalable était une « erreur ».

« C'était une façon de faire pour que tous les mots donnent immédiatement des résultats », avait expliqué son directeur général, Éric Léandri. Le but de la manœuvre était de profiter des requêtes des premiers utilisateurs pour établir des statistiques et affiner la recherche sémantique du moteur, puis de basculer progressivement vers des résultats maison, accompagnés de ceux de Bing et d'autres sources.

Bourrelly publiait dans la foulée sur son blog une (longue) interview d’Eric Léandri, en réponse à ces accusations. En commentaire, un certain Marc, de l’annuairefrancais.fr, le félicitait : « il semble évident que Qwant aura sa chance quand il aura scanné lui-même le web pour le comprendre à sa manière et en donner une meilleure essence sémantique que la concurrence, pour apporter de la nouveauté » (les passages en gras sont de l'auteur, NDLR) :

« Je n’ai pas osé croire, par logique, que l’on mette des millions d’euros sur la table pour une supercherie et un gros buzz ... et qu’il était probable que cet outil vienne à faire son propre crawl…»

Une idylle brisée

Six ans plus tard, Qwant est devenue la bête noire de Marc Longo qui, via son compte Twitter, @annuaire_fr, n’a eu de cesse, ces derniers mois, de témoigner de son dépit d’avoir été « trahi » : « On nous a pris vraiment pour des billes, je supporte pas ça... Voilà pourquoi je suis fâché contre Qwant », écrivait-il ainsi en mars dernier.

En mai 2016, Bourrelly annonçait que ses podcasts étaient désormais sponsorisés par Qwant, et y qualifiait Éric Léandri (qu’il interviewe régulièrement depuis) de « mon ami ». Advisor de Qwant depuis janvier 2018, il en est aussi et surtout le « spin doctor », traitant Longo de « gros mytho » et de « grand taré », qui aurait besoin de « soins psychiatriques », entre autres.

Les médias ayant l’heur de publier des articles ne se contentant pas d’encenser le moteur ont eux aussi droit à son courroux, de Libération, accusé de « mensonge et de manipulation », au Figaro, de « mauvais journalisme et #QwantBashing mal placé ».

Sur le fil consacré à Qwant du forum de WebRankInfo, site de référence en la matière, Marc Longo, sous le pseudo Longo600, commençait à exprimer des doutes en janvier 2016, le qualifiant de « très bon méta-moteur mais pas du tout un vrai moteur de recherche », tout en précisant : « Souhaitons-leur d'y arriver, si c'est réellement leur objectif ».

En mars 2017, le même n’en décidait pas moins de « mettre les pieds dans le plat » dans un fil censé « ouvrir une polémique » :

« 42 millions d'Euros d'argent public pour un méta-moteur basé sur des API, les politiques ont perdu la tête ou quoi ? Qwant en est toujours à fournir des résultats identiques à Bing (…) à la lettre près, au mot près et à la quantité près (49 résultats fournis par l’API de Bing) ».

Pour lui, la communication de Qwant relevait de la « supercherie » : « les journalistes et les pouvoirs publics se laissent "enfumer" ». À quoi Bourrelly répondait, sobrement, via des interviews vidéo de Léandri, qu’indexer le web prenait du temps : « N'oubliez pas que Qwant n'a que 3 ans. Un peu de patience ».

Dans la foulée, sur Twitter, Longo tentait d'alerter la #presse, @ccifrance, la @CaissedesDepots et l’@AssembleeNat, sans pour autant être entendu, ni relayé. À l’époque, Qwant ne prit même pas la peine de répondre à ses accusations – hormis celle, polie, de Bourrelly. Depuis, la guerre est consommée.

En novembre 2018, Qwant décidait en effet de lever une partie du voile entourant le fonctionnement de son Index. « C'est un projet dont nous parlons peu mais c'est pourtant notre plus grande ambition : créer une indexation du Web indépendante », précisait-il sur Twitter, tout en renvoyant à un billet de blog intitulé « Indexation du Web : où en est l’indépendance de Qwant ? », qui se voulait pédagogique :

« Lorsque l’on parle de moteurs de recherche, il y a encore beaucoup de confusion entre les méta-moteurs qui se contentent d’afficher des résultats fournis par d’autres dans une interface différente, et les moteurs de recherche indépendants qui indexent eux-mêmes le contenu du Web et disposent de leurs propres algorithmes de classement des résultats. Chez Qwant, nous avons pris le pari depuis le premier jour de créer un véritable moteur de recherche indépendant, en indexant nous-mêmes le Web et en mettant au point nos propres algorithmes ».

À l’en croire, « c’est extrêmement important pour garantir une souveraineté technologique européenne. Il était en effet anormal que notre connaissance du Web dépende d’un ou deux acteurs américains, qui décident pour 95 % des Européens de ce qui est pertinent pour leurs recherches, en imposant leur vision et leurs intérêts ».

Qwant disposait alors « dans ses serveurs de 20 milliards de pages Web indexées » : « chaque jour nos crawlers passent sur plus d’un milliard de pages pour en ajouter, supprimer celles qui n’existent plus, ou mettre à jour toutes les informations qui les concernent », ce qui donnait à Qwant « la plus grande capacité d’indexation en Europe ».

« Des dizaines de millions de sites sont ainsi présents dans notre index », qui n’aurait recours à Bing que « pour compléter les résultats de recherche sur lesquels nous n’avons pas une pertinence suffisante, et sur les images où les capacités de stockage sont très importantes ».

« Nous faisons évoluer chaque jour nos algorithmes », concluait Qwant. « La bascule vers l’indépendance totale se fait donc progressivement », même si c’est « difficile à voir d’un œil extérieur ! »

Lanceur d’alerte, ou concurrent ?

Les réponses à ce billet furent, de fait, dubitatives : « ce qui serait réellement transparent, ce serait de montrer, ou de créer un baromètre, indiquant où en est le moteur aujourd’hui en termes de dépendance (ou d’indépendance) de Qwant par rapport à Bing » rétorquait ainsi Olivier Andrieu, du site Abondance.com, source de référence en matière de moteurs de recherche.

« L’immense majorité des SEO pensent que vous utilisez Bing et que vous êtes “seulement” un méta-moteur », embrayait Olivier Duffez, de WebRankInfo.com, autre source faisant autorité en la matière, tout en déplorant l’absence d’indications « sur le crawler et encore moins sur l’algo ».

Sur Twitter, tous deux déploraient par ailleurs que Qwant ne répondait pas à leurs questions et commentaires (Eric Léandri a depuis répondu à Andrieu).

En mars, Marc Longo, venait ajouter son grain de sel : « Pour des spécialistes, le résultat que vous affichez laisse à penser que l’indépendance n’est pas là, que les dépenses sont assez astronomiques et orientées vers la communication et le lobbying ».

Dans la foulée, il décidait de mandater un huissier afin de vérifier la pertinence de l’index de Qwant. Et le constat fut, à l’en croire, accablant, à mesure que son index n’aurait pas (ou marginalement) été mis à jour depuis 2017 :

« En réalité, lorsque l’on tape MACRON dans Qwant Junior éducation (https://www.qwantjunior.com/?q=macron&t=education ), il n’y a que ce vieil index de 2017, « Macron a toutes les chances d’être élu », « macron un candidat aux présidentielles »... Si l’on a le malheur de cliquer sur le premier lien, la page n’existe même plus, on est renvoyé a l’accueil site consulté ! Le deuxième lien peut-être ? Non plus, retour a l’accueil... Le 3eme lien ? Pareil, la page n’existe plus. Où est la promesse de mise à jour quotidienne, des retraits des pages introuvables ? »

Sur la partie web (et non Junior) de Qwant, les profils Instagram et Facebook d’Emmanuel Macron indiquaient, par ailleurs, un nombre d’abonnés largement inférieur à ce dont ils disposaient en avril dernier, les résultats semblant là aussi dater de 2017. Les recherches aux mots-clefs Tour de France, motogp, festival de Cannes, grand prix F1 ou rentrée scolaire ne renvoyaient, de même, qu'à des pages datant de 2017, sans aucune mention des années 2018 et 2019.

Aucune des pages indexées par Qwant (et donc non fournies par le moteur Bing de Microsoft) ne semblait avoir été mise à jour depuis 2017, et les liens étaient « soit périmés, soit répétitifs, les textes mal décodés, en résumé, inexploitables industriellement », déplorait Longo.

Mi-avril, Longo envoyait un courriel alarmiste et accusatoire à l’ensemble des parlementaires, comme l’avait révélé La Lettre A. Contacté par nos confrères, Qwant avait rétorqué que ce courrier contenait « de très nombreux éléments mensongers et diffamatoires », et qu’il allait engager les « procédures nécessaires ». En l’espèce, une assignation en justice.

Déplorant dans sa plainte une « campagne de dénigrement » qui se poursuivait par « des tweets quasi-quotidien », Qwant lui réclamait 15 000 euros par infraction constatée, 100 000 euros de dommages et intérêts, et 5 000 euros de frais de procédure, à mesure que le courriel envoyé aux parlementaires comportait des « indications trompeuses et dénigrantes », à commencer par un index « abandonné depuis 2017 », « ce qui est évidemment faux ».

Le 14 juin dernier, Marc Longo a en conséquence été condamné pour « dénigrement » en concurrence déloyale par le tribunal de commerce de Paris, à « cesser tout acte de dénigrement, sous quelque forme que ce soit et sous quelque support que ce soit, à l’encontre de la SAS Qwant et de son moteur de recherche », ainsi qu’à 2 000 euros de frais de procédure, mais sans dommages et intérêts.

Le conseil de Longo avait estimé que ses écrits relevaient de la liberté de parole, et que Qwant aurait donc dû l’attaquer pour « diffamation ». Mais le tribunal de commerce, suivant en cela la jurisprudence, ne fut pas de cet avis : « lorsque des propos litigieux ont pour objet de mettre en cause la qualité des prestations fournies par une entreprise et émanent d’une société concurrente exerçant dans le même secteur, ces propos relèvent d’une action en dénigrement et non d’une action en diffamation ».

Car Marc Longo a également lancé Premsgo.fr, un « moteur orienté marchand et e-commerce ». S’il ne cible pas les mêmes utilisateurs que Qwant, ne propose pas les mêmes fonctionnalités, ni ne boxe dans la même catégorie, il se présente comme « le seul moteur de recherche Français 100% indépendant et souverain anti-GAFAM ». Ce sur quoi repose précisément la communication de Qwant.

« La divulgation d’une information de nature à jeter le discrédit sur un concurrent constitue un dénigrement, peu important qu’elle soit exacte, l’exception de vérité n’étant pas admise en matière de dénigrement », estima dès lors le tribunal (nous avons surligné ces passages, NDLR).

Qwant visé par deux audits

Il convenait donc d’aller vérifier, a fortiori parce que Longo, qui a fait appel, a depuis été de nouveau assigné devant le juge de l’exécution du tribunal de grande instance de Paris, ce 22 juillet.

Qwant lui réclamait cette fois « une astreinte de 15 000 euros par infraction constatée afin d’assurer de façon effective l’exécution de cette décision », ainsi que la « condamnation solidaire de la société nouvelle l’Annuaire français et de Mr Longo à payer la somme de 10 000 euros à titre de dommages et intérêts ».

Il lui reprochait en effet d’avoir tweeté, à l’adresse des comptes du Sénat, de l’Assemblée, d’Emmanuel Macron, Cédric O et Matignon, un texte publié sur Linkedin suite à sa condamnation, intitulé « Quand la justice muselle les parlementaires d’accéder à l’information critique et avec elle la démocratie... », l’accusant de vouloir l’empêcher d’alerter le Parlement sur les carences supposées de Qwant.

De plus, Longo aurait également, d’après l’assignation, adressé un nouvel email à l’ensemble des parlementaires « critiquant violemment » Qwant, tout en continuant à « publier ou diffuser des tweets dérogatoires sur Qwant (...) se moquant totalement de la décision rendue par le Tribunal de commerce ».

À l’en croire, « ce dénigrement constant est extrêmement grave et de nature à décrédibiliser la société Qwant auprès du public et des pouvoirs publics, alors même que cette société poursuit des démarches afin de développer la fréquentation de son site, notamment auprès des administrations ».

Cédric O, secrétaire d’État au Numérique, avait en effet annoncé (.pdf), début mai, lors d’une table ronde du CEO Forum de VivaTech, que l’État avait choisi Qwant comme moteur de recherche pour ses administrations, suivant en cela de nombreuses entreprises et collectivités, et qu’il serait bientôt installé par défaut sur les postes de 2,5 millions de fonctionnaires.

Or, « malgré la volonté de l’Élysée d’avancer vite, le dossier Qwant suscite de nombreux doutes au sein de l’administration » révélait, début juillet, une enquête du Figaro. Au point que Cédric O a demandé deux audits à l’ANSSI et à la Direction interministérielle du numérique et du système d’information et de communication de l’État (DINSIC). Objectif : « vérifier ce qui se passe sous le capot de Qwant et s’assurer que l’entreprise progresse sur le plan technologique ».

« Nous déployons depuis quatre mois l’équivalent, selon nous, de la technologie de Google en 2016 », expliquait Éric Léandri au Figaro : « nous avons recours à Bing pour compléter nos résultats, et le déploiement de ces nouvelles technologies nous permettra à court terme d’assurer nous-mêmes 82 % des requêtes ». Qwant estimait alors pouvoir passer des 20 milliards de pages indexées à ce jour à 100 milliards de pages d’ici à la fin de l’année.

« L’État français y croit dur comme fer. La société fait l’objet d’un intérêt manifeste de l’Élysée, du gouvernement et de son bras armé, la CDC. Cette dernière a déjà investi près de 15 millions d’euros dans le projet début 2017 et s’apprête donc à suivre l’émission d’obligations convertibles », écrivait Le Figaro.

« Personne n’avait réussi à rafler le moindre point d’audience à Google depuis dix ans », précisait Éric Léandri, qui soupçonnait des « tentatives de déstabilisation de la concurrence et de la presse» : « Alors que nous préparons notre émission d’obligations convertibles pour accélérer, c’est comme par hasard maintenant que les attaques infondées convergent. »

Revenant de son côté sur le fait que Qwant serait « dépeint ici et là comme en faillite, une gabegie, un faux nez de Microsoft, une officine de l'État, un échec, une réussite suspecte... », Guillaume Champeau, directeur éthique et affaires juridiques de Qwant, relayait de son côté sur Twitter les conclusions d’un article de Challenges, qui se demandait d’où pourraient bien venir ce qu’il qualifiait d’« attaques grotesques et coordonnées » : « à mots couverts, certains administrateurs, comme l'entourage de Cédric O., secrétaire d'État en charge du Numérique, se demandent si le géant Google n'a pas décidé de se débarrasser du nain Qwant ».

Les (premières) explications de Qwant

Déplorant les attaques incessantes dont le moteur ferait l'objet, notamment de la part de Marc Longo (sans, pour autant, le citer), Tristan Nitot, vice-président Advocacy de Qwant, avait répliqué début juin par un post LinkedIn intitulé « Qwant : arrêtons la parano ! »

Dans un paragraphe intitulé « L’index date-t-il vraiment de 2017 ? », Nitot répondait : « Bien sûr que non, il est rafraîchi régulièrement. Par contre, lors du déploiement partiel d'un changement de stack logicielle au niveau de l'index, un fichier de cache contenant les résultats pour un ensemble de "top" requêtes datant de 2017 a pris la place du cache actuel pour ces requêtes. Dès que nous avons appris le problème, nous nous sommes employés à le comprendre et à le régler. Désormais, ces requêtes fonctionnent normalement. »

Seul « l'onglet "éducation" de Qwant Junior (1,2% des requêtes), qui fonctionne sur liste blanche, était bloqué sur un vieil index de 2017 » avait de son côté précisé, sur Twitter, Guillaume Champeau, quelques semaines plus tôt : « personne nous l'avait signalé jusque là puisque l'onglet est utilisé en classe pour des requêtes genre « orthographe », « addition », « gaulois », « dinosaures »... où a priori les contenus de 2019 ne révolutionnent pas la connaissance à avoir du sujet à l'école ; pour les contenus frais, la recherche par défaut («Web») ou spécialisée («actus») fonctionnait très bien, sur un index mis à jour chaque jour ».

Interrogé à ce sujet dans le n° de juin du Virus Informatique, Qwant expliqua : « c’est un bogue spécifique à l’onglet Éducation de Qwant Junior qui ne tape pas sur le même index que les autres et n’utilise pas les mêmes algorithmes. Fort heureusement, l’index de Qwant ne se résume pas à cet onglet de Qwant Junior ! »

Mais des recherches sur la page principale de Qwant étaient, elles aussi, « bloquées sur 2017 », selon le constat d’huissier consulté par le Virus, qui précisait : « Et, là, plus difficile d’avoir une explication officielle de la part de la société ». Un employé évoqua « un incident », suivi d’une « erreur » conduisant à « restaurer un index de 2017 sans s’en apercevoir ». « Un problème qui ne devrait être que ponctuel : l’index devant être recalculé en permanence », concluait le Virus.

D’autres employés évoquaient aussi « des changements en cours dans l’architecture matérielle et logicielle pouvant être à l’origine de dysfonctionnements temporaires », ainsi que « des bogues » pouvant « empêcher la régénération de certaines grappes de l’index ».

De fait, et « curieusement », écrivait le Virus, une recherche effectuée aux mots-clefs « le Bon Coin » (qui, d’après un employé de Qwant interrogé par le Virus, fait bien partie du corpus traité par son index, et n’émanant pas de Bing) renvoyait, à quelques heures d’intervalle, des résultats différents.

Après avoir affiché un compteur de J’aime de sa page Facebook « quasiment à jour », mais avec des résultats faisant « au mieux apparaître 2017, jamais 2018 ou 2019 », quelques heures plus tard, « les seules années qui apparaissent dans les résultats sont 2013 et 2014, et le compteur Facebook de la page Leboncoin est revenu en arrière (de deux ans ?), identique à celui figurant dans le constat d’huissier réalisé deux semaines plus tôt », soit « 359 373 J’aime ».

Mi-juillet, soit trois mois après que Marc Longo avait commencé à pointer du doigt l'âge de l'index de Qwant, et un mois et-demi après le même constat par Le Virus, ladite requête indiquait toujours que Facebook avait « 359 373 J’aime », alors qu’il en dénombre pourtant plus de 500 000.

De plus, la description enregistrée par Qwant de la page Le Bon coin sur Wikipédia (« leboncoin.fr est un site internet, leader des sites d'annonces gratuites en France, caractérisé par une interface minimaliste »), était celle en vigueur du 5 janvier 2013 au 15 août 2017. À défaut de savoir pourquoi elle n’aurait pas été mise à jour depuis, son indexation par Qwant datait donc a priori, et au plus tard, du premier semestre 2017.

Vérification faite, ce 31 juillet, deux jours avant la publication de notre article (et alors que nous avions posé nos questions à Qwant il y a près de 15 jours), son Index a de nouveau été (re)mis à jour : Facebook y affiche « 494k likes », soit 5 000 de moins que ce qu’il comptait le 10 juillet.

Et la description du Bon Coin sur Wikipédia, telle que présentée par Qwant (« Le Bon Coin, ou leboncoin.fr, est un site web d'annonces commerciales, fondé en France, durant l'année 2006, à l'initiative du conglomérat norvégien »), avait été introduite le 9 février de cette année, avant d’être de nouveau modifiée le 18 juin dernier.

La pertinence – et la véracité – des accusations de Marc Longo restaient donc, à l’aune des explications de Qwant, à « fact-checker ». Ce qui sera l'objet de la suite de notre enquête, avec les (nouvelles) explications de Qwant, aussi : Qwant : des résultats datés, limités (mais répétés).