Google fête ses 20 ans en septembre. CHARLES PLATIAU / REUTERS

« Organiser les informations à l’échelle mondiale dans le but de les rendre accessibles et utiles à tous. » C’est la mission qu’avaient fixée à Google, lors de sa création, ses deux fondateurs Larry Page et Sergey Brin. Cette phrase un brin mégalomaniaque, digne d’un film de science-fiction, répondait à la fin des années 1990 à un contexte bien particulier : celui d’un Web qui s’étendait à une vitesse exponentielle, mais qui manquait d’outils efficaces pour trouver ce qui y existait déjà.

A l’époque, les moteurs de recherche, qui fonctionnaient par mots-clés, étaient peu efficaces, et la plupart des internautes passaient par de vastes annuaires de liens, difficilement mis à jour, pour trouver des sites ou des ressources correspondant à leurs intérêts. Des millions de pages Web étaient invisibles ou très difficilement trouvables, et leur consultation était réservée à celles et ceux qui en connaissaient l’adresse ou qui y parvenaient en cliquant de lien en lien.

« Rendre l’information utile »

En créant l’outil de classement PageRank, les fondateurs de Google introduisent une nouvelle manière de « classer la connaissance ». L’outil s’inspire du fonctionnement de la littérature scientifique, dans laquelle on considère généralement que l’importance d’un article est proportionnelle au nombre de fois où il est cité par d’autres articles. En appliquant un principe similaire aux liens hypertextes, le PageRank permet de classer, de manière logique, l’importance des pages Web.

Brève histoire de Google à travers le portrait de Eric Schmidt, le PDG qui a fait grandir la start-up

Par rapport aux concurrents de l’époque, la supériorité de Google était spectaculaire : les résultats de recherche étaient plus précis, et donc plus utiles. La troisième partie de la mission que s’étaient fixée les cofondateurs de l’entreprise était en bonne voie, au fil du temps, elle a beaucoup investi dans ce domaine. Les résultats de Google sont, désormais, personnalisés en fonction de l’historique de navigation, de la géolocalisation ou du profil de l’internaute – informations également utilisées par le moteur de recherche pour affiner « l’utilité » des publicités qu’il affiche.

« Rendre l’information accessible »

Pour ce qui est de « rendre universellement accessible » l’information, en revanche, les années suivantes se sont révélées beaucoup plus compliquées. En 2006, l’entreprise ouvre des bureaux à Pékin. Le service de recherche est populaire – plus d’un tiers des parts de marché –, mais les pages de résultats ne présentent pas vraiment toute l’information du monde. A la demande du régime chinois, les résultats de certaines recherches, comme celles qui portent sur la révolte de la place Tiananmen, sont censurés. En 2010, plus d’un milliard de personnes se retrouvent du jour au lendemain sans accès à Google : le moteur de recherche quitte la Chine continentale pour Hongkong, et l’accès à Google est bloqué dans toute la Chine. Seul un très faible pourcentage d’utilisateurs disposant d’outils de contournement de la censure peut continuer à l’utiliser.

Entretien avec Patrick Poon, chercheur à Amnesty International, sur le possible retour de Google en Chine

Encore aujourd’hui, la Chine représente un malaise profond au sein de Google. En juillet, après la révélation de l’existence d’un projet secret de moteur de recherche destiné au marché chinois – et donc censuré –, Google a dû faire face à une fronde d’une partie de ses salariés. « Notre mission est d’organiser l’information du monde. La Chine représente un cinquième de la population mondiale. Pour accomplir notre mission, nous devons réfléchir sérieusement à ce que nous pouvons faire en Chine », a dit Sundar Pichai, le PDG de Google, lors d’une rencontre avec les salariés.

Même dans les pays démocratiques, Google ne donne plus accès, dans de nombreux cas, à l’ensemble des informations qu’il indexe. Au fil du temps, et des décisions de justice dans certains cas, Google a accepté de supprimer des pages de ses résultats de recherche. Sites de téléchargement illégaux (un peu partout dans le monde), sites déclarés illégaux par des tribunaux (sites néonazis en Allemagne, par exemple)… Les pages de résultats comportent depuis plusieurs années, sur certains sujets, des mentions précisant qu’en application de la loi, certains résultats ont pu être supprimés.

Après une décision d’un tribunal espagnol, confirmée au niveau européen, Google applique désormais également le « droit au déréférencement », parfois appelé « droit à l’oubli ». Lorsque certains critères sont respectés, Google accepte, désormais, de supprimer des résultats de recherche certains liens apparaissant lorsque l’on y tape le nom et le prénom d’une personne. Dans un premier temps, ce filtrage ne s’appliquait qu’à la version nationale du pays d’origine de la demande – si un Français demandait la suppression d’un lien, il disparaissait de Google.fr, mais restait visible sur Google.com. Après une nouvelle décision de justice, Google utilise désormais une méthode de géolocalisation pour déterminer si le résultat peut ou non être affiché.

Toute « l’information du monde »

A la création de Google, on estime que le Web comptait environ 2,4 millions de sites. La croissance a été exponentielle : Google affirme aujourd’hui, sans donner de comptes précis, indexer « plusieurs centaines de milliards de pages Web ». S’y ajoutent les quantités astronomiques d’informations collectées par Google sur ses utilisateurs : courriels, historique des recherches, géolocalisation…

Mais ce volume phénoménal d’informations cache aussi le fait qu’une part de plus en plus importante du Web échappe, désormais, aux logiciels utilisés par Google pour indexer les pages. Parfois appelés « Web profond », ces pans du réseau sont, volontairement ou techniquement, impossibles à indexer dans les moteurs de recherche. C’est le cas, par exemple, des pages protégées par un mot de passe ou accessibles uniquement sur abonnement, mais aussi d’une partie non négligeable de Facebook – les utilisateurs dont le profil est paramétré en « privé » ne sont pas accessibles à Google. S’y ajoutent des cas plus particuliers, comme les sites hébergés sur le réseau anonyme Tor.

Notre entretien avec Larry Page en 2010 : "Notre ambition est d'organiser toute l'information du monde, pas juste une partie"

D’autres « informations », pourtant librement accessibles, sont encore aujourd’hui mal référencées dans Google. Lors de la création du moteur de recherche, la quasi-totalité du contenu mis en ligne était constitué de textes et de photos, et tout le fonctionnement du moteur était basé sur l’analyse de textes. Aujourd’hui, la vidéo constitue une part importante des pages consultées par les internautes. Si l’indexation de pages contenant des vidéos ne pose pas, en soi, de difficulté particulière pour les moteurs, il leur est beaucoup plus difficile de « comprendre » ce que montrent les images. Google a massivement investi ces dernières années pour tenter de résoudre cette difficulté, à la fois dans la transcription automatique du son, et dans l’analyse des images.

Et l’avenir ?

« Notre moteur de recherche a fait de grands bonds en avant depuis le lancement de Google en 1998, mais notre mission reste la même », affirme toujours aujourd’hui Google sur la page de son site consacré à sa mission. Pourtant, Google a fait évoluer d’autres parties de ses règles internes : en 2015, au moment de la création du conglomérat Alphabet, dont le moteur de recherche n’est qu’une partie, il avait notamment supprimé de son code de conduite la phrase « don’t be evil » (ne soyez pas mauvais), pour la remplacer par « do the right thing » (faites ce qui est juste).

En 2014, le cofondateur de Google, Larry Page, jugeait toutefois qu’il était peut-être temps de faire évoluer les buts de l’entreprise. « Nous sommes dans des territoires inexplorés, disait-il. Comment allons-nous utiliser toutes ces ressources… pour avoir un impact sur le monde plus positif ? » La question n’a visiblement pas encore été tranchée.