Le week-end, il faut bien s’occuper et parmi mes lecteurs, il s’en trouve certains qui aiment les statistiques. L’un d’eux m’a contacté dernièrement pour me faire part de ses découvertes concernant les résultats des dernières élections en France. Le résultat vaut largement un billet.

Avant d’aller plus loin, un petit point méthodologique s’impose.

Pour réaliser l’analyse, les fichiers qui ont été utilisés sont ceux fournis par le ministère de l’Intérieur (résultats du second tour par régions, départements et circonscriptions) dans lesquels on trouvera les acronymes suivants : LUG pour Liste Union de Gauche, LUD pour Liste Union de Droite, LFN pour Liste FN. Pour éviter une trop grande dispersion des données, les autres acronymes et groupes de données (comme LDVG, LREG, LSOC, par exemple) n’ont pas été inclus dans l’analyse.

Ces fichiers ont été recoupés avec la structure de la population par circonscription par âge, sexe, logement et catégorie socio-professionnelle, obtenue par le recensement partiel de 2012 sur la base des chiffres de 2008 fournis par l’INSEE.

Enfin, pour effectuer l’analyse en question, notre aimable lecteur s’est muni du puissant outil open-source R, avec le package Factominer des statisticiens de l’Agrocampus de Rennes, grâce auquel il a effectué une AFC (Analyse Factorielle des Correspondances).

En substance, il s’agit du moteur au cœur de tous les logiciels de datamining, et qui permet de réaliser de l’analyse de données non-supervisée. Autrement dit, il s’agit de laisser parler les données et de voir quelles sont les formes ou correspondances qui émergent en premier, puis en second, etc. Ce seront les « dimensions », visibles dans les graphiques un peu plus bas, qui permettent d’identifier les facteurs qui structurent le plus fortement les données. De dimensions en dimensions, on peut alors expliquer laquelle contribue à quelle quantité de données observées, comme on pèle un oignon, et ce jusqu’à ce qu’il ne reste plus que du bruit statistique.

Cette technique identifie de fortes « correspondances » statistiques entre variables. Reste enfin à interpréter ces correspondances, ce qui revient à répondre aux questions qu’on se pose sur les découvertes que l’outil permet. Par exemple, pourquoi diable les circonscriptions qui se caractérisent le plus par un vote Liste Union de Gauche sont des circonscriptions avec beaucoup d’étrangers ou des circonscriptions avec beaucoup de professions libérales ou de cadres supérieurs ?

Avant de tenter de répondre à ces questions, si on regarde d’un peu plus près les résultats bruts, on découvre que près de 70% de la variabilité du vote par circonscription est expliquée par seulement deux dimensions : la localisation des votants (ruraux ou urbains), et leur positionnement face aux listes de gauche (en accord ou en rejet). En effet, et peut-être pour la première fois en France, le vote jadis droite-gauche ressemble maintenant à un vote de rejet complètement orthogonal à la structuration des catégories socio-professionnelles (i.e. statistiquement indépendant des CSP).

La première force qui structure le vote, c’est la corrélation entre bobos et étrangers dans le vote de gauche, c’est-à-dire entre les circonscriptions d’urbains diplômés (qu’on pourrait synthétiser grossièrement mais pas inexactement par « bobos ») et les circonscriptions avec un fort taux d’étrangers, dans un vote pour les listes à gauche (LUG, ou listes d’union de gauche).

Cette tranche de France-là, surtout urbaine, s’oppose à l’autre tranche (et en particulier au monde rural) suivant un gradient des CSP. Cette autre France se compose, elle, de circonscriptions avec beaucoup de Professions Intermédiaires et autres inactifs (dont les chômeurs), celles avec beaucoup d’employés et d’abstention, celles avec beaucoup d’ouvriers, d’artisans, de commerçants, de retraités (qui ont particulièrement exprimé leur vote), et enfin les circonscriptions sans doute les plus rurales, avec beaucoup d’agriculteurs exploitants.

Cette corrélation des circonscriptions à fortes populations étrangères avec celles des professions libérales et des cadres supérieurs, unis dans un même vote de gauche, éclaire assez nettement les stratégies du PS, la fameuse ligne « Terra Nova » appliquée jusqu’à présent, qu’on pourrait résumer par « Plus d’État pour les bobos, et plus d’État pour les populations en otage ou en assistanat ».

De façon complètement orthogonale à cela, la deuxième force qui structure le vote est le rejet.

Par exemple, le vote pour le Front National est très associé aux bulletins blancs et nuls, ce qui montre de façon assez claire là aussi qu’au lieu d’une montée de l’idéologie du FN, il faut voir une montée visible du rejet du système, de façon très claire, et le long de toutes les CSP.

NB : rappelez-vous que ces graphiques sont issus d’une analyse dirigée par les données et non par l’opérateur. Les regroupements visibles ci-dessus sont ce qui ressort des corrélations, pas d’un choix volontaire du statisticien.

Plus dramatiquement encore, ce découpage montre, si quelqu’un pouvait encore en douter, le rôle réel des listes de droite : celui d’un bouche-trou entre deux les grandes forces politiques qui restent, à savoir le Parti Socialiste ou le rejet. Si quelqu’un doutait de ce rôle de bouche-trou, il est démontré par l’association des listes de droite (LUD) au paquet « rejet », de l’autre coté du véritable fossé entre les Français qui se matérialise sur les graphiques de l’Analyse Factorielle des Correspondances ci-dessous.

Cliquez pour agrandir – les n° sur les points indiquent la circonscription ; ex : 9306 est la sixième circonscription du département 93

Une telle répartition montre bien l’abandon par toute la gauche d’une partie du peuple : les ouvriers, les artisans, les commerçants ont un vote majoritairement opposé à celui de la gauche, et se retrouvent écartelés entre le vote de protestation et le vote conservateur.

Par exemple, sur le graphique ci-dessus, les points « O » (ouvriers) et « AI » (autres inactifs, les chômeurs, donc) sont au bord du gouffre créé par le clivage, à la fois le plus loin possible de la gauche sans être à droite, partagés par leur différence socio-professionnelle (des chômeurs plutôt urbains, des ouvriers plutôt ruraux), et sur le point de rejeter le système, de l’autre côté du gouffre. D’autres études prouvent d’ailleurs encore et encore que ce sont ces deux catégories socio-professionnelles, socialement les plus vulnérables, qui rejettent le plus clairement la gauche et sont récupérées par le Front National ou s’associent à un vote rageur nul ou blanc.

D’autre part, ces graphiques expliquent assez bien les récents éclats entre NKM et Sarkozy : la droite, qui accepterait de marchander (c’est la « ligne NKM ») tomberait dans un véritable piège et serait complètement mangée par le vote protestataire. La « ligne Sarkozy » semble alors plus cohérente puisqu’il vaut mieux recevoir des reports de votes du PS que de disparaître.

Enfin, en tant que force progressiste, la gauche n’existe plus. Elle n’est plus qu’un outil de préservation des avantages d’un assemblage hétéroclite composé d’une caste de bourgeois et d’une caste d’assistés ou de populations dépendantes des aides. Ceci est d’ailleurs corroboré par le dernier scrutin ; en abandonnant trois régions, la gauche a préféré isoler complètement ses électeurs plutôt qu’accepter un changement paradigmatique, d’ailleurs confirmé par le renouvellement du rejet au second tour par les circonscriptions concernées.

Quant à la France, ce graphique illustre un terrible clivage, un gouffre même, entre deux peuples, créé par la petite politique politicienne, allant de la diabolisation du Front National jusqu’aux calculs politiciens pendant les scrutins, les discours communautaristes ou l’illisible politique laïcarde, et surtout, l’absence complète de toute volonté d’agir autrement que pour les intérêts spécifiques des élus.

On n’ose imaginer le degré de frustration qui doit se créer chez les électeurs qui, progressivement ostracisés par ces basses manœuvres, ne trouvent plus que le rejet pour s’exprimer.

En somme, si quelqu’un veut la guerre civile, c’est bien le PS.

—-

Données brutes

Résultats bruts

Archive des données et résultats au format XLS