

Pas de lauréat, pas de chocolat : méfiez-vous des statistiques !



« L es statistiques, on peut leur faire dire ce qu'on veut », c'est bien connu. Un article publié dans le New England Journal of Medicine en 2012 annonçait par exemple la découverte d'une corrélation statistique troublante entre le nombre de prix Nobel et… la consommation nationale de chocolat.



Faut-il en déduire que le chocolat rend intelligent ?

Pourquoi une étude pareille ?

L'idée peut sembler étrange, mais le raisonnement de l'auteur de cette étude, Franz H. Messerli, n'est pas complètement absurde. On suspecte en effet certains flavonoïdes, des molécules présentes en grande quantité dans de nombreux aliments dérivés de plantes et notamment dans le chocolat, d'avoir un impact positif sur les capacités cognitives.

Étant donné qu'il n'existe aucune mesure objective des « capacités cognitives moyennes » des habitants des différents pays du monde, Messerli a choisi de se baser sur un autre indicateur national qui lui semblait pertinent : le nombre de lauréats du prix Nobel par dix millions d'habitants.



Nombre de prix Nobel par dix millions d'habitants en fonction de la consommation nationale de chocolat en kilogrammes par personne et par an.

Image : Franz H. Messerli, The New England Journal of Medicine 367(16) (2012), p. 1562-1564 Nombre de prix Nobel par dix millions d'habitants en fonction de la consommation nationale de chocolat en kilogrammes par personne et par an. Et ses résultats sont surprenants : tracez la proportion de prix Nobel parmi les habitants de différents pays en fonction de leur consommation moyenne de chocolat et vous obtiendrez une jolie droite. En d'autres termes, les pays qui ont reçu le plus grand nombre de prix Nobel (proportionnellement à leur nombre d'habitants) sont ceux où l'on consomme le plus de chocolat !

De là à conclure que la consommation de bonheur en tablettes augmente les chances de décrocher la plus prestigieuse des récompenses scientifiques, il n'y a qu'un pas.



De grands titres accrocheurs, mais trompeurs...

Images : 20minute.fr, lexpress.fr, atlantico.fr De grands titres accrocheurs, mais trompeurs... Messerli se montre relativement prudent à ce sujet dans les conclusions de son article, mais la presse généraliste, qui a rapidement repris l'information, s'est parfois montrée moins regardante... et de nombreux journaux et sites internet d'information ont donc annoncé que consommer du chocolat augmente les chances d'obtenir le prix Nobel !

Où est l'astuce ?

Biais de sélection Comme toute personne sensée, je suis prêt à croire à peu près n'importe quelle information susceptible de me donner bonne conscience lorsqu'il s'agit de manger du chocolat... mais cette étude souffre de problèmes courants dans le domaine des statistiques, qui méritent d'être mis en évidence et expliqués.

les données choisies sont-elles représentatives de ce que l'on étudie ou sont-elles biaisées ? Première question à se poser :



Pour la défense de Metterli, je connais pas mal de scientifiques qui seraient prêts à jurer que le chocolat (et/ou le café) est essentiel au bon déroulement de leurs recherches...

Image : auteur original inconnu ( Nous contacter Pour la défense de Metterli, je connais pas mal de scientifiques qui seraient prêts à jurer que le chocolat (et/ou le café) est essentiel au bon déroulement de leurs recherches... Corrélation n'est pas causalité Dans son article, Franz Messerli fait preuve de recul à ce niveau-là en signalant que ses statistiques se basent sur les moyennes nationales de consommation de chocolat plutôt que sur la consommation individuelle des lauréats des prix Nobel : en d'autres termes, il n'y a rien qui prouve que les chercheurs qui ont eu le prix Nobel consomment exactement autant de chocolat que l'habitant moyen de leur pays...

Avec une touche d'humour, Messerli fait également preuve de recul à un autre niveau, en envisageant brièvement la possibilité que ce soit l'obtention des Nobel qui booste la consommation nationale de chocolat et non le contraire (certains pourraient fêter le prix en se gavant de cacao – ou à l'inverse, s'en priver selon le célèbre principe « pas de lauréat, pas de chocolat »).

ce n'est pas parce que deux grandeurs sont corrélées statistiquement qu'il y a forcément une relation de cause à effet directe entre elles ! De façon plus fondamentale, cette étude est toutefois un exemple d'erreur archiclassique en statistiques :

Des grandeurs peuvent par exemple être corrélées par pur hasard. Prenez un ensemble de données suffisamment grand, triturez-les suffisamment et vous finirez forcément par voir émerger des liens apparents entre des grandeurs sans rapport : c'est statistiquement inévitable, mais dénué de sens. En réponse à l'article de Messerli, des chercheurs de l'Université catholique de Louvain ont par exemple montré qu'il existe une corrélation encore plus forte entre le nombre de prix Nobel et… le nombre de magasins IKEA par pays.



Le nombre de prix Nobel par pays en fonction : (A) de la consommation nationale de thé, (B) de la consommation nationale de vin et (C) du nombre de magasins IKEA. Il n'y a corrélation statistique que dans le troisième cas.

Image : Pierre Maurage et al., The Journal of Nutrition 143(6) (2013), p. 931-933 Le nombre de prix Nobel par pays en fonction : (A) de la consommation nationale de thé, (B) de la consommation nationale de vin et (C) du nombre de magasins IKEA. Il n'y a corrélation statistique que dans le troisième cas. Par contre, la corrélation entre le nombre de prix Nobel et la consommation nationale d'autres substances riches en flavonoïdes, comme le thé ou le vin, est très mauvaise. Il ne semble donc pas que ce soit une consommation moyenne de substances riches en flavonoïdes qui soit responsable du fait que certains pays reçoivent proportionnellement plus de prix Nobel que d'autres !

Plutôt qu'être la cause et la conséquence l'un de l'autres, deux phénomènes peuvent aussi être corrélés parce qu'ils ont une cause commune plus ou moins lointaine.