Emmanuel Macron vient d’être élu à la présidence de la République sur un programme dont une des priorités est la recomposition de la vie politique. La période que nous traversons, entre les deux tours des législatives, est donc sujette à de fortes interrogations quant à la réorganisation à venir des partis politiques.

Afin d’apporter un éclairage sur ce point, nous avons étudié pendant les semaines qui ont précédé le second tour de l’élection présidentielle les mouvements et transferts entre les partis, avec un prisme particulier, celui du web social. Grâce à notre plateforme Linkage, nous avons analysé en partenariat avec l’entreprise Linkfluence la recomposition des partis sur Twitter, suite au premier tour.

Étude du web social

À partir de tous les tweets des Français liés à la politique, extraits et formatés par Linkfluence, nous nous sommes concentrés sur deux périodes : 17-18 avril et 24-25 avril 2017, c’est-à-dire quelques jours avant, et juste après le premier tour de la présidentielle. La plupart des outils permettant d’analyser ce type de données perçoivent les tweets comme un ensemble de documents : ils ont donc pour objectif d’étudier le choix des mots, les thèmes de discussion majoritaires, et les sentiments relayés par ces messages de 140 signes.

Et pourtant, les tweets sont par nature des données plus riches que de simples documents puisqu’ils caractérisent des interactions entre des individus. Par exemple, un individu A interagit avec B s’il retweete un message de B ou s’il écrit un message faisant référence à B. Un ensemble de tweets est alors vu comme un graphe ou réseau (Figure 1, en tête de cet article). Malheureusement, les outils d’analyse de réseaux sont eux aussi limités et ne peuvent pour l’essentiel gérer que des interactions binaires (interagit ou n’interagit pas) entre les individus.

L’analyse des réseaux est un domaine de recherche particulièrement actif dont un des objectifs est l’extraction automatique d’informations pertinentes au regard des interactions observées entre des individus. Alors que les premiers développements ont été réalisés en sciences sociales dès les années 30, l’immense majorité des outils ont, depuis, été proposés par des physiciens et informaticiens afin de maximiser un critère bien particulier, la modularité.

Ce critère vise à identifier des groupes d’individus ayant plus de connexions entre eux qu’avec des individus d’autres groupes. C’est le principe de la communauté. Nous observons des communautés dans les réseaux sociaux vérifiant le principe de transitivité, c’est-à-dire : l’ami de mon ami est mon ami. Malheureusement, les réseaux en général et sociaux en particulier sont souvent construits à partir d’autres types de groupes. Il existe par exemple des individus ayant une forte influence sur les avis/comportements des autres. On parle alors de groupes d’influenceurs et d’influencés. De la même manière, nous trouvons également régulièrement des structures inversées où il existe plus de connexions entre des individus de groupes différents qu’entre des individus d’un même groupe.

La recherche en mathématiques, et en particulier en statistique, a fourni ces quinze dernières années plusieurs solutions permettant de pallier les limites des outils existants. Ces approches permettent en particulier d’identifier des individus organisés en communautés, mais également en d’autres types d’organisations sociales. La recherche française en statistique a largement contribué aux avancées théoriques et méthodologiques dans ce domaine.

Modèle statistique

Dans le cadre d’une collaboration entre les laboratoires de Mathématiques des universités Paris 1 Panthéon-Sorbonne et Paris Descartes, nous avons proposé un nouveau modèle statistique et une méthode d’estimation associée permettant de réaliser une analyse conjointe d’un réseau et d’un ensemble de textes. Le réseau social à analyser n’est alors plus vu comme un objet binaire. Un individu A interagit avec un individu B sur un texte donné. L’individu A peut par exemple envoyer plusieurs emails à B. Dans ce cas, l’interaction de A vers B est caractérisée par cet ensemble d’emails.

Pour des données de type tweet, une interaction de A vers B rassemble tous les tweets écrits par A faisant directement ou indirectement (retweet) référence à B. L’analyse de ce réseau social permet alors d’identifier des groupes d’individus en fonction de à qui ils s’adressent et de quoi ils parlent. La méthode détermine les thèmes de discussion propres aux échanges entre les groupes. Elle permet ainsi de dire : le groupe A identifié discute beaucoup avec le groupe B, sur le sujet C identifié.

Recomposition politique

La méthode a ainsi été appliquée sur les deux réseaux construits à partir des tweets des 17- 18 avril et 24-25 avril. Elle a identifié cinq thèmes de discussion et dix groupes d’individus, dans les deux cas.

￼

Pour la 1ère période (17-18 avril), quatre des thèmes trouvés correspondent aux tweets des Français à propos des principaux candidats. Il est particulièrement intéressant de constater que le cinquième thème rassemble uniquement les tweets critiquant le système politique en général. Ce thème, au cœur de la campagne, est relayé par tous les partis politiques. Un examen des comptes présents dans chacun des groupes identifiés par la méthode nous a également permis d’étiqueter chaque groupe vis-à-vis de sa tendance politique. Contrairement à tous les partis, le Parti socialiste se retrouve isolé et n’interagit pas ou peu avec le groupe central en gris sur la Figure 2, rassemblant les comptes Twitter des candidats et des principaux médias.

P. Latouche , CC BY

De manière surprenante, les poids des partis que nous avons identifiés se sont avérés proches du vote des Français (figure 3, ci-dessous). 24,1 % des comptes analysés ont ainsi été classés dans le groupe EM. Pour rappel, Emmanuel Macron a obtenu 24,01 % des voix.

P. Latouche , CC BY

Nous avons réalisé une analyse similaire sur la période des 24-25 avril 2017, entre les deux tours de l’élection présidentielle, afin notamment d’observer la recomposition du paysage politique sur le réseau Twitter après les résultats du 1er tour (Figure 4, ci-dessous). Deux thèmes sont associés à EM. Un est uniquement dédié à EM alors qu’un autre rassemble des discussions mentionnant à la fois EM et les Insoumis. Un thème correspond au FN et nous retrouvons deux thèmes de critique dont un de rejet du système politique.

P. Latouche , CC BY

Comme pour le premier tour, nous avons pu identifier le poids des partis sur Twitter. Les résultats bruts donnent 66 % pour EM et 34 % pour le FN. Au vu des résultats du second tour, cette estimation du poids des partis sur le web social est bien sûr troublante. Il est néanmoins important de garder à l’esprit que le web social ne peut pas être directement utilisé aujourd’hui comme source pour le sondage, tout simplement par ce qu’une grande partie de la population française n’est pas présente sur ces réseaux !

Fait rare, notre étude nous a permis de suivre les changements de comportement des comptes entre les deux tours. En utilisant les résultats des analyses sur les deux périodes, il nous a ainsi été possible d’estimer la recomposition du paysage politique à l’issue du 1er tour. Nous avons communiqué ces résultats avant le second tour :

Il nous paraissait important de montrer que, sur le web social, les Insoumis semblaient finalement se tourner vers EM. Ainsi, sur Twitter, plus de 79 % des Insoumis identifiés ont été classés EM après le premier tour. Nous voulions également témoigner de la fracture que nous avions observée à droite. Une part importante des comptes actifs et proches de François Fillon a en effet été classée FN. Contrairement au groupe identifié à droite qui est passé à hauteur de 17 % au FN, le groupe associé à François Fillon est passé à plus de 53 % au FN. Les autres comptes de droite et issus de LR sont allés majoritairement vers EM.