Quels sont, pour chaque culture, les personnages les plus importants ?

La Technology Review nous apprend que Peter Gloor et son équipe du centre du MIT pour l’intelligence collective ont utilisé Wikipédia pour répondre à cette question.

Ils ont effectué des recherches sur les pages « célébrités » de quatre Wikipédia différentes : l’anglo-saxonne, l’allemande, la chinoise et la japonaise.

Les chercheurs ont commencé par télécharger les pages « personnalités » de chacune des encyclopédies (pour Wikipédia en anglais : 800 000 entrées). Ils ont ensuite cherché à créer un « réseau social » des personnes en question, en analysant les liens qui pointaient dans chaque page vers un de leurs contemporains (et en enregistrant également les liens d’autres célébrités vers le personnage analysé). Cela a permis d’utiliser un algorithme de type page rank afin de classer les grands « influenceurs ».

Réseau de contemporains

Les anthropologues se sont bien assurés que n’étaient liés au sein d’un même réseau que les gens qui ont vécu à la même époque et étaient donc susceptibles de se connaître. Par exemple, nous explique le papier, en ce qui concerne l’historien Plutarque, les noms de César, Néron ou Hadrien sont conservés, tandis que ceux pointant vers Pyrrhus, mort longtemps avant la naissance de Plutarque, ou vers les historiens plus tardifs comme George le Syncelle ou Paul Pisani sont éliminés.

Les chercheurs espéraient ainsi cartographier les personnes les plus influentes de tous les temps.

Les résultats sont très différents entre l’Est et l’Ouest :

si l’on prend le top 10 des Wikipédia allemande et anglaise, par exemple, il existe un relatif équilibre entre personnalités politiques et militaires d’un côté, et les artistes, figures religieuses, scientifiques ou intellectuelles ;

au contraire, dans les Wikipédia chinoise et japonaise, les places les plus influentes sont réservées presque uniquement aux conquérants, bâtisseurs d’empires et figures militaires.

Précisons bien que de telles statistiques reflètent les conceptions des contributeurs de la Wikipédia, et non la réalité de l’histoire culturelle d’un pays : la Chine et le Japon ne manquent pas de penseurs ou d’artistes, loin de là. A noter d’ailleurs que, sans grande surprise, d’après les recherches de l’équipe du MIT, la plupart des contributeurs appartiennent à la culture de la Wikipédia qu’ils modifient : ce sont surtout des Chinois ou des Taïwanais qui écrivent dans la Wikipédia chinoise, des Anglais et des Américains dans l’anglo-saxonne, etc.

Un examen poussé permet aussi de repérer les relations d’une culture avec ses voisins. Ainsi, 80% des « grands personnages » de la Wikipédia anglaise n’appartiennent pas à la sphère culturelle anglo-saxonne.

Surprise chez les historiens

En revanche, dans la Wikipédia chinoise, on ne trouve que deux personnages issus d’une culture étrangère à se hisser dans le hit-parade : Napoléon III et le shogun Tokugawa Ieyasu. La Wikipédia japonaise, elle, reconnaît 40% d’étrangers parmi ses influenceurs les plus notables.

Reste bien sûr à savoir si l’état de la Wikipédia reflète réellement certains aspects de la culture dont elle est issue. Avez-vous entendu parler par exemple de Sidney Lee ? Il s’agit d’un obscur historien de l’époque victorienne qui arrive à se hisser à la troisième place du top 10 de la Wikipédia anglaise. Mais pourquoi lui, et pas (pour citer des historiens de langue anglaise bien plus connus), Arnold Toynbee ou Will Durant ? Probablement parce que Lee était très prolifique et a signé 800 articles pour le « Dictionary of national biographies ». Pourtant, nous dit la Wikipédia, la plupart de ses écrits concernent surtout des personnages de l’époque élisabéthaine, qui ne peuvent donc pas appartenir à son « réseau social ». Autant dire que le mystère demeure…

La dynamique sociale de l »histoire du monde vue à travers Wikipédia, par Peter Gloor et son équipe.

Mesurer la « production culturelle »

Le MIT n’abrite pas qu’une seule entreprise d’anthropologie computationnelle (oui, c’est le nom barbare de cette discipline). Le projet Pantheon utilise lui aussi Wikipédia mais il ne se concentre pas sur les influenceurs ; il s’intéresse à la « production culturelle globale ».

Les personnages de l?histoire de France les plus clbres selon Pantheon." /'gt;

Les personnages de l »histoire de France les plus célèbres selon Pantheon. Les personnages de l?histoire de France les plus clbres selon Pantheon." /'gt;

Autrement dit, il s’agit de savoir, pour tout pays à une date donnée, quel est le nombre de personnalités connues qui y sont apparues et quelle était leur activité.

Cette production culturelle est dite globale, parce qu’elle ne prend en compte que les personnalités dont la réputation à franchi les frontières de leur contrée et les limites de leur époque. Sont donc éliminés plusieurs aspects de la culture qui, précisent les chercheurs, sont largement aussi importants, mais bien plus difficiles à cartographier : l’ensemble des données culturelles passant par la famille ou d’autres institutions sociales, ou la culture locale propre à un lieu ou une période donnée.

Pantheon utilise deux sources principales d’information :

comme pour l’équipe de Gloor, l’équipe de Pantheon recourt beaucoup à Wikipédia. Elle se repose notamment sur 11 340 fiches biographiques présentes dans 25 langues de l’encyclopédie.

La deuxième source est un livre paru en 2003, « Human Accomplishment, The pursuit of excellence in the Arts and Sciences, 800BC to 1950 », par Charles Murray, qui offre quant à lui 4 002 biographies.

Le site de Pantheon est interactif et permet à tout un chacun de profiter des recherches du groupe et de naviguer entre les pays et les époques, en commençant en 4000 av. J.C.

Par exemple, si je veux savoir quels sont les Français les plus connus, j’obtiens en premier Napoléon Bonaparte et j’apprends qu’il possède une fiche Wikipédia dans 145 langues différentes, et qu’il a bénéficié de 57 559 307 pages vues depuis 2008. Mais si on analyse sa position parmi les politiciens du monde entier, il n’arrive que cinquième, et il est moins connu que César, Hitler, Charlemagne ou l’empereur Auguste (mais il coiffe Cléopâtre au poteau).

Le groupe à l’origine de Pantheon, le Macro Connections Group, dirigé par César Hidalgo, a également développé le Global Language Network, qui cartographie les relations entre les langues à partir du nombre de traductions de livres d’un idiome vers un autre.

« La position d’une langue au sein du Global Language Network est fortement corrélée avec le nombre de personnes célèbres nées dans les territoires qui lui sont associés“, nous explique-t-on, ce qui implique un lien entre les données explorées par ce projet et celles révélées par Pantheon.

Egalement élaboré par le même groupe, l’Observatoire de la complexité économique propose lui ‘une narration visuelle sur les échanges entre pays.

Ces deux expériences ne sont bien sûr que des exemples de ce domaine en pleine expansion que sont les sciences humaines computationnelles. Par exemple, à l’université de Dallas, l’équipe de l’historien de l’art Maximilian Schich s’est essayée à analyser les mouvements de population au cours de l’histoire (vidéo) en se basant sur les lieux de naissance et de mort de 120 000 personnes célèbres, en commençant par Solon (né vers -638 à Athènes et mort vers -558 à Chypre) et en allant jusqu’à Jett Travolta, fils de l’acteur, né en 1992 à Los Angeles et décédé en 2009 aux Bahamas. Ils ont pour cela utilisé Freebase, une version sémantisée’ de Wikipédia.