En science aussi, la fraude existe. Au regard de certaines réactions outrées qui ont suivi la publication de mon billet sur la validité des études scientifiques, d'aucuns m'accusant de jeter le discrédit sur la recherche parce que j'évoquais quelques inconduites, il me semble utile de faire un point sur ce phénomène, certes marginal mais bien réel. Je profite pour cela d'une belle coïncidence car, dans leur livraison du 1er octobre, les Proceedings of the National Academy of Sciences (PNAS, qui sont les comptes-rendus hebdomadaires de l'Académie des sciences américaine) publient une étude qui éclaire le sujet d'un jour nouveau mais, hélas, pas très reluisant.

Les auteurs de cet article, Ferric Fang, Grant Steen et Arturo Casadevall, ont travaillé sur la base de données PubMed qui regroupe quelque 25 millions d'études – essentiellement dans le domaine de la recherche biologique et médicale –, dont les plus anciennes remontent aux années 1940. En décembre 2010, à l'occasion d'une étude parue dans le Journal of Medical Ethics, Grant Steen avait déjà exploré la période 2000-2010 de cette base de données en s'intéressant tout particulièrement aux rétractations, c'est-à-dire aux articles que l'on retire de la publication et dont on demande aux chercheurs de ne plus tenir compte. Deux causes principales motivent une rétractation. La première est une erreur involontaire, où la bonne foi des chercheurs n'est pas remise en cause : problème expérimental, mauvaise interprétation des résultats, etc. La seconde est une violation délibérée des bonnes pratiques et de la déontologie. Du véniel au très grave, on trouve l'auto-plagiat (c'est-à-dire la mauvaise habitude que prennent certains chercheurs de multiplier les articles à partir d'une seule expérience, de façon à faire grimper leur nombre de publications), le plagiat d'une autre équipe et, enfin, la fraude.

Par fraude, on entend une manipulation voire une invention des résultats. Parmi les exemples de ces dernières années, citons ceux qui sont probablement les deux plus célèbres. Tout d'abord, l'étude dirigée par le Britannique Andrew Wakefield montrant, à partir d'une douzaine de cas, un lien entre le vaccin ROR (rougeole-oreillons-rubéole) et un autisme doublé d'un problème intestinal. L'enquête a non seulement montré que ce lien avait été fabriqué de toutes pièces par Wakefield, à l'insu des co-auteurs, mais que le médecin avait également fait subir aux enfants qu'il suivait pour son étude des examens pénibles sans aucune raison. Le "tricheur" menait en fait (et mène toujours même s'il a été interdit d'exercer) une croisade anti-vaccin et, malgré la rétractation, les résultats de cette pseudo-étude sont restés ancrés dans bien des esprits et ont mené à une baisse de la vaccination dans certains pays. Le second exemple, lui aussi très médiatisé, est celui du Sud-Coréen Hwang Woo-suk qui était devenu une vedette mondiale après avoir annoncé, en 2004 dans Science, le clonage d'un embryon humain dans le but de produire des cellules souches. Un résultat imaginé, étayé par de fausses photographies, qui a conduit le chercheur à une spectaculaire disgrâce.

Dans son étude de 2010, Grant Steen avait recensé 742 rétractations en dix ans dans la base PubMed. Grâce aux notices les accompagnant, il avait pu classer les raisons pour lesquelles ces études étaient retirées du champ de la science. Quasiment les trois-quarts (73,5 %) l'étaient pour de simples erreurs tandis que le reste tombait dans la catégorie des fraudes. L'auteur précisait toutefois que pour 134 des 742 articles, la raison de la rétractation demeurait ambiguë. L'étude des PNAS publiée le 1er octobre a, tout en s'ouvrant à une période plus large (1977-mai 2012), voulu enquêter afin de réduire ces ambiguïtés et ses auteurs ont consulté de multiples sources d'information pour chacune des 2047 études retirées au cours des 35 dernières années. En plus des notices de rétractation, ces sources sont l'Office of Research Integrity aux Etats-Unis (qui publie un rapport annuel sur les mauvaises pratiques scientifiques), des articles de presse généraliste ou spécialisée, ainsi que le blog Retraction Watch, tenu par les journalistes Adam Marcus et Ivan Oransky, qui est une référence en la matière et que je recommande à tous ceux qui s'intéressent à ces questions.

Cette enquête fouillée a donné des résultats bien différents de ceux de 2010. Sur ces quelque 2 000 rétractations, la fraude constitue la cause principale dans 43,4 % des cas, le plagiat dans 9,8 % des cas et la duplication de ses propres travaux dans 14,2 % des cas. Soit un total de 67,4 % de rétractations pour non-respect de la déontologie. On est bien loin du 26,5 % de 2010 ! Les erreurs involontaires sont invoquées dans 21,3 % des cas, le restant des rétractations étant soit imputables à des causes peu claires, soit sans explication du tout, certaines revues ne daignant pas les justifier.

Même si elle concerne actuellement moins d'un article scientifique sur 10 000, ce qui est plutôt rassurant, la fraude scientifique est un phénomène qu'il faut réévaluer à la hausse (voir les diagrammes ci-dessous). La différence entre les chiffres de 2010 et ceux de 2012 s'explique essentiellement par le modus operandi qu'a suivi l'article des PNAS, lequel ne s'est pas contenté de la version officielle contenue dans les notices de rétractation. Après analyse poussée, 15 % des 742 rétractations répertoriées dans l'étude de 2010 sont ainsi passées de la catégorie "erreur de bonne foi" à la catégorie "tricherie" ! Les notices sur lesquelles cette étude s'appuyait sont en effet souvent rédigées par les auteurs des études eux-mêmes et l'on comprend aisément qu'en cas de mauvaise conduite, ceux-ci trouvent des circonlocutions trompeuses (ou de beaux mensonges) pour maquiller leur forfait. Une notice concernant la rétractation d'un article publié en 1989 dans la revue Biochemical and Biophysical Research Communications fait ainsi état de "résultats provenant d'expériences qui se sont révélées avoir des failles dans leur méthodologie et dans l'analyse des données". Très curieusement, l'enquête menée par l'université Harvard a plutôt évoqué "de nombreux exemples de fabrication et de falsification de données"...

Autre point important, les articles sont souvent retirés avant que les enquêtes les concernant aient livré leurs conclusions, ce qui permet aux auteurs d'évoquer des raisons autres qu'une fraude pas encore prouvée. Par ailleurs, certaines études soupçonnées d'être entachées par des malversations ne sont jamais retirées. Si l'on met tout bout à bout, on arrive "à la sous-estimation systématique, dans les rétractations, du rôle de l'inconduite et à la sur-estimation du rôle de l'erreur", estiment Ferric Fang, Grant Steen et Arturo Casadevall, qui plaident pour que les notices de rétractation soient standardisées, que la formation des chercheurs insiste davantage sur le respect de l'éthique et que, côté sanctions, l'on crée un fichier centralisé des fraudeurs.

Comme on le voit sur ces diagrammes, le nombre de fraudes est en nette hausse depuis quelques années. Une des explications à cette inflation tient certainement à la surveillance renforcée qui est aujourd'hui en place, notamment pour les cas de plagiat ou de duplication d'études, plus facilement repérés grâce à des logiciels d'analyse de texte. Mais il serait naïf de ne pas chercher également les causes profondes du phénomène dans la manière dont la recherche elle-même est construite. Les auteurs de l'étude des PNAS ont par le passé souligné que "l'augmentation des rétractions et des manquements à l'éthique peut résulter, au moins en partie, du système de la science au résultat, basé sur la logique économique de la prime au vainqueur, qui confère au premier des récompenses disproportionnées, sous la forme de subventions, de postes et de prix, à une période où le financement de la recherche se restreint".

Pierre Barthélémy (@PasseurSciences sur Twitter)