Tout le monde ment. Sur Facebook, Instagram, auprès de nos amis, amants, voisins ou cousins, nous tordons, remanions, embellissons nos vies sociales, sexuelles, sportives, familiales, intellectuelles. La vérité est ailleurs… Sur Google. À cette petite boîte blanche accessible d’un clic, l’humanité confie ses questions les plus urgentes, les plus stupides aussi, ou parfois s’épanche, avec la sérénité de ceux qui chuchotent au confessionnal. Si bien qu’en quelques années, les recherches Google sont devenues « la plus grande base de données jamais collectée sur la psyché humaine ». C’est ce que s’attache à démontrer le data scientist Seth Stephens-Davidowitz, passé par Google et Harvard, et qui publie Everybody lies : Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are (Harper Collins, mai 2017). Usbek & Rica l'a lu pour vous. Fascinant, déprimant, mais édifiant quant aux promesses immenses du big data, dont les sciences sociales commencent tout juste à se saisir. Un livre d'autant plus important qu'il remet également en question la théorie de la « bulle de filtre », qui semblait faire l'unanimité depuis le Brexit et l'élection de Trump.

Les recherches Google sont consternantes. Ses suggestions d'« autocomplete » relaient rumeurs, racisme et clichés. Mais elles sont aussi inspirantes : on y trouve ce qu'Internet recèle de plus « What The Fuck », entre ceux qui comptent sur le moteur de recherche pour leur trouver une « chanson française contenant na, na, na, na, na », un « andré rieu célib ? » ou se demandent « comment lancer une recherche sur Google » (champions). Le tumblr, puis le livre Devenir un ninja gratuitement (2013) rendaient hommage à ces fulgurances d’intelligence collective… Google peut aussi inspirer les artistes. En récupérant depuis 2006 son historique et en l’imprimant en plusieurs tomes, Albertine Meunier souhaite nous faire prendre conscience des millions d’octets engloutis quotidiennement par la plateforme alors que mis bout à bout, ils disent tant de notre intimité.

« My Google Search History », de l'artiste Albertine Meunier.



La relève de « Freakonomics »

Pour Seth Stephens-Davidowitz, nos recherches Google sont bien plus encore. Rien de moins, même, que « la plus grande base de données jamais collectée sur la psyché humaine ».

L’auteur est data scientist, ce métier que l’on peut traduire par « scientifique ou analyste de données » (mais qu’en réalité on ne traduit pas), et que les recruteurs s’arrachent. Diplômé d’Harvard en économie, il explique avoir choisi le domaine après sa lecture du célèbre Freakonomics, aujourd’hui écoulé à plus 4 millions d’exemplaires dans 35 langues. Que le livre qu’il vient de publier soit comparé au best-seller des années 2000 doit donc lui faire plaisir. Là où l’économiste Steven Levitt démontrait la force du raisonnement économique pour résoudre les questions les plus insolites, Seth Stephens-Davidowitz veut, quant à lui, prouver la richesse du big data, mine d’or encore largement sous-estimée, voire méprisée par les chercheurs en sciences sociales.

La couverture du livre de Stephens-Davidowitz, Harper Collins, mai 2017.

Son potentiel est pourtant immense, défend Stephens-Davidowitz, et permet de mieux cerner un éventail de sujets quasiment infini, allant du racisme à la dépression en passant par les détails les plus inavouables de nos vies sexuelles. Son intérêt pour les recherches Google commence en 2008, alors que le premier président noir de l’histoire des Etats-Unis franchit les portes de la Maison Blanche.



(Image : Doug Mills via nytimes.com)

À cette époque, à en croire les sondages et les chercheurs, la question raciale n’a pas joué dans l’élection d’Obama, et une société post-raciale est née. Quand il tape sur Google Trends un mot aussi toxique que « nigger », Stephens-Davidowitz s’attend donc, en 2012, à un faible résultat (il précise que le rap emploie le mot « nigga », donc ne peut gonfler les chiffres). Mais le volume des recherches dépasse de loin ses attentes. « Nigger » est inclus dans 7 millions de recherches (par an, aux Etats-Unis), est aussi recherché que « migraine », « économiste » ou « Lakers », et 20% des recherches sur « nigger » s’accompagnent du mot « blague ». « Stupides nègres » ou « je hais les nègres » sont des recherches courantes, et le soir de l'élection d’Obama, une recherche sur 100 sur Obama incluait le mot « nigger ».

La recherche «porno» dépasse celle de «météo», quand seuls 25% des hommes américains admettent en regarder, et 8 % des femmes

Là où les préjugés et les sondages situent généralement le racisme au Sud et chez les Républicains, Stephens-Davidowitz comptabilise au contraire autant de recherches racistes dans les régions démocrates. Il finit par montrer qu’Obama a obtenu les scores les plus bas là où la proportion de recherches Google incluant le mot « nigger » était la plus élevée.

L’outil d’analyse est donc loin d’être anecdotique. Cinq ans plus tard, alors que Trump vient d’être élu, Stephens-Davidowitz préconise de prêter une attention plus sérieuse aux capacités prédictives de ces data. Ne serait-ce qu’en observant l’ordre dans lequel les candidats sont les plus recherchés - « Trump Clinton » ou « Clinton Trump » (associés à “sondage”, “débat”, “élection”) - on pouvait débusquer des indices d’intention de vote…

Autre exemple des Google Trends en politique : Le soir du 24 juin 2016, alors que viennent de fermer les bureaux de vote dans lesquels le Royaume Uni a choisi de mettre fin à quarante-trois années d' appartenance à l'UE, le pays s'interroge, pendant la nuit et le jour suivant, "what is the eu" (en rouge) et "what is brexit" (en bleu).

Le pouvoir de Google n’est pas tant dans la quantité des données récoltées que dans le rôle complètement inédit que joue cette petite boîte blanche à laquelle nous confions tout sans rougir et sans craintes, insiste Stephens-Davidowitz. Tout chercheur sait qu’une réponse honnête sera obtenue plus facilement en ligne qu’au téléphone, et plus facilement au téléphone qu’en face-à-face, car on réduit alors le « biais de désirabilité sociale », qui consiste à vouloir se présenter sous un jour favorable à ses interlocuteurs, donc à son sondeur.

Or personne ne cherche à plaire à Google. « Son pouvoir est que les gens lui disent ce qu’ils ne disent à personne d’autre. » Sinon, pourquoi la recherche « porno » dépasserait-elle celle de la « météo », quand seuls 25% des hommes américains admettent en regarder, et 8 % des femmes ? Et à quelle personne de son entourage peut-on oser avouer que l’on « regrette d’avoir eu des enfants », recherche loin d'être isolée sur Google ?

Toute la vérité, rien que la vérité

Stephens-Davidowitz nous promet donc la « vérité », obtenue grâce à plusieurs années de recherche, en partie publiée dans le New York Times.

Le chapitre « Sexe » est, sans surprise, très fourni. Voilà ce qu’on y apprend, entre autres choses :



> Le big data « peut apporter la meilleure réponse qui ait jamais été donnée » à la question « Combien d’hommes américains sont gays ? », estime l’auteur. Pour les sondages, la proportion varie de 2 à 3%. En analysant les données indiquées publiquement sur Facebook (qui se définit comme gay et parmi eux, qui a déménagé d’un Etat “intolérant” à un Etat “tolérant”?) ou les recherches Google sur le porno gay, Stephens-Davidowitz aboutit lui au chiffre de 5%, soit « un nombre effrayant d’hommes qui n’ont pas encore fait leur coming out, surtout dans les Etats “intolérants” sur le sujet. Ils ne le disent pas sur Facebook. Ils ne l'admettent pas dans les sondages. Et sont la plupart du temps mariés à des femmes. »

> Sur la recherche « Est ce que mon mari est... », « gay » a 10 % de chances de plus de compléter la recherche que « en train de me tromper », et la question est la plus posée en Louisiane et en Caroline du Sud. Autre élément marquant : la recherche « porno gay » est très souvent suivie de la recherche « gay test ».

> Hommes et femmes mentent sur leur activité sexuelle. À la hausse, bien sûr. Google compte « 16 fois plus de plaintes relatives à un partenaire qui ne veut pas faire l’amour qu’à un partenaire qui ne veut pas parler ». Contrairement aux idées reçues, il y a « deux fois plus de plaintes envers un partenaire homme qui ne veut pas faire l’amour qu’il n’y en a envers une partenaire femme opposant le même refus ».

Une des questions les plus communes posées à Google sur le sujet de l'anatomie masculine est : « De quelle taille est mon pénis ? »

> Les hommes sont complètement obsédés par la taille de leur pénis. « Ce qui n’est pas un scoop, mais le degré d’inquiétude est très profond ». Stephens-Davidowitz signale qu’une des questions les plus communes posées à Google sur le sujet de l'anatomie masculine est : « De quelle taille est mon pénis ? ». Commentaire de l’auteur : « Que les hommes se tournent vers Google plutôt que vers une règle graduée est à mon sens la quintessence de notre ère digitale ».

> De façon générale, les inquiétudes des hommes ne correspondent pas aux attentes des femmes et vice-versa. Les recherches montrent « que chacun est tellement obsédé par son propre corps qu’il reste très peu de place pour juger celui de l’autre ».

> Les fantasmes les plus délirants existent et certains sont terrifiants, mais d’autres rappellent que la sexualité est beaucoup diverse qu’on ne le croit.

Le chapitre « Préjugés » dévoile une « vérité » qu’aucun parent, a priori convaincu d’éduquer ses enfants de façon égalitaire, n'avouerait : la recherche « mon fils est-il surdoué » est plus de deux fois plus commune que celle équivalente pour les petites filles, tandis que « ma fille est-elle en surpoids » est deux fois plus demandé que « mon fils est-il en surpoids » (alors que 28 % des petites filles américaines le sont, contre 35 % des garçons).

Google, merci de confirmer que mon fils est un génie.

Contre la théorie de la bulle de filtre

La « vérité » sur Internet telle que Stephens-Davidowitz la lit dans le big data vient contredire la théorie de la bulle de filtre, formulée en 2011 par Eli Pariser, selon lequel les algorithmes nous enferment en vase clos, dans le confort de nos propres opinions. Stephens-Davidowitz cite les résultats d’une recherche de 2015 ayant montré que Facebook, en nous exposant à des connexions sociales faibles, une connaissance de lycée, un cousin éloigné, l’ami d’un ami d’un ami, nous confronte à des opinions contraires aux nôtres bien plus que ne nous le permet « la vraie vie ».

La collecte des recherches Google peut également alerter sur des sujets plus délicats comme la maltraitance des enfants, et à cet égard s’avérer précieuse pour les associations. Pendant la crise financière de 2007-2008, beaucoup d’experts se sont inquiétés des effets négatifs que le stress et la dépression des parents pourraient avoir sur les enfants, mais ont baissé la garde en constatant les résultats neutres de leurs enquêtes. Pourtant, le nombre de recherches comme « Ma mère / Mon père me frappe » a très sensiblement augmenté pendant cette période, leur courbe était en lien direct avec le taux de chômage, et ce n’était qu’un signe parmi d’autres fournis par les data, assure Stephens-Davidowitz, qui collabore avec plusieurs associations sur différents sujets (maltraitance, avortement clandestin...).



« Ne comparez jamais vos recherches Google aux posts de qui que ce soit sur les réseaux sociaux »

Ne manquait plus que la vérité sur nos « amis Facebook », ceux dont les carrières sont toujours fabuleusement épanouissantes, les dimanches sportifs et culturels, et les vacances sans galère, ni météo pourrie, ni engueulade, ni tourista. Ceux qui ne partagent - aux Etats-Unis - que des articles de The Atlantic, liké 1.5 million de fois, et jamais ô grand jamais ceux de The Enquirer, liké 50 000 fois, alors qu’étonnamment, les magazines (l’un est intello, l’autre people) se vendent autant l’un que l’autre. Ceux qui disent que leur mari est le meilleur au monde, quand les recherches Google sur le sujet témoignent de moins d’enthousiasme…

Recherches les plus fréquentes pour « Mon mari est... », sur les réseaux sociaux vs sur Google / Seth Stephens-Davidowitz sur CBS le 10 mai 2017.

Au proverbe « Se comparer aux autres ne sert à rien, car on ne peut comparer qu'en surface », le data scientist propose une alternative : « Ne comparez jamais vos recherches Google aux posts de qui que ce soit sur les réseaux sociaux ». On serait tenté d’ajouter : tant que cet espace de libre expression est encore préservé des injonctions qui dominent les réseaux sociaux, profitons-en… Car sans craindre un scénario à la Dave Eggers dans son roman d’anticipation Le Cercle (Gallimard, 2016), où la transparence est une dictature et toute activité en ligne tracée, ces data sont convoitées, et bien moins par des chercheurs qui veulent y lire notre âme que par des entreprises amatrices d’analyse prédictive.

Stephens-Davidowitz ne fait pas l’économie d’un chapitre consacré aux risques de voir toutes ces data tomber entre les mauvaises mains - une compagnie d’assurance, la police… - mais reste un amoureux transi de la data, convaincu de son pouvoir pour améliorer notre quotidien, encourager nos enfants à mieux apprendre, ou nous aider à mieux dormir. Le bracelet connecté Jawbone, qui calcule vos heures de sommeil et vous rappelle à l’ordre quand vous aviez promis de vous coucher tôt ? Une idée fantastique, pour le data scientist. Enfin un coup de pouce efficace des data pour résoudre le fléau du manque de sommeil !

C’est drôle, il nous évoque au contraire les effets pervers du quantified self ou les bracelets de contrôle des employés du Cercle… Le Cercle, un super-GAFA fictif qui ne contredirait pas Stephens-Davidowitz quand il imagine l'avenir « brillant » de l'analyse de data, et promet aux data scientists qu'ils seront les prochains Marx, Freud ou Foucault.

SUR LE MÊME SUJET :

> On a essayé d'effacer nos traces à l'expo « Terra Data »

> Français et réseaux sociaux : le grand désenchantement ?

> Performeurs du quotidien