Nous parlions récemment (avant d’être déraillé par le débat OGM, comme d’hab) de tolérance au lactose chez certains humains : mutations au hasard ? et état normal = maladie.

Dans ce dernier billet, je m’étonnai de ce qu’un résultat de génétique de quelques populations humaines soit labellisé « African » et un autre « Finnish » (finois) sur un site d’information officiel américan, alors que dans l’étude originale les groupes ethniques africains concernés étaient bien spécifiés. Je pense que cela se rattache en partie à la réification (croire qu’un concept est réel) du concept de « races humaines ». Pour rappel, j’avais écrit mon premier billet sur ce blog à ce sujet.

Concernant la tolérance au lactose, voici une carte de l’ancien monde avec la fréquence de la tolérance :

Sur cette carte vous voyez des zones rouge-orange, qui correspondent aux origines des mutations permettant la digestion du lactose chez l’adulte (il y en a plusieurs, indépendantes, à différents endroits). A ces endroit la sélection naturelle a eu le temps d’augmenter la fréquence de la mutation dans la population jusque presque tout le monde (rouge = plus de 90% de la population tolérante). En bleu, les endroits où la mutation n’a pas encore eu le temps d’acquérir une fréquence élevée, car elle doit d’abord arriver par le jeu des migrations et des mariages / reproduction, et elle ne présente un avantage que depuis la domestication des vaches veaux cochons couvées (surtout les premiers), donc pas très longtemps en termes évolutifs.

Voici maintenant une carte des « races humaines » traditionnelles (j’ai pris le premier résultat Wikipedia, mais l’idée générale serait la même avec n’importe quelle carte) :

Est-ce qu’en louchant bien vous arrivez à faire correspondre les couleurs sur ces deux cartes ? Parce que moi, non. Et pourtant.

Le site d’information cité précédemment est une collection d’articles médicaux sur l’intolérance au lactose, et ils classifient tout le temps les gens en groupes raciaux socialement reconnus, dont « African Americans », pour lesquels on attribue les différences à l’origine génétique « africaine ». Par exemple :

Frequency of Lactose Intolerance in Adults in Various Populations

Location % Lactose Intolerant Adults Asians, US 90–100 Ibo, Yoruba, Africa 90 Inuits, Greenland 85 Southern Italians 71 African Americans 65 Caucasians, US 21 British, UK 6 Danes 3

ou encore :

Lactose intolerance is estimated to affect 25% of the American population.

Group prevalence is as follows:

— 15% (6% to 19%) – whites

— 53% – Mexican Americans

— 62% to 100% – Native Americans

— 80% – African Americans

— 90% – Asian Americans

et :

Within the United States, 80–90% of African Americans, 95–100% of Native Americans, 80–90% of Asian Americans, and 50–55% of Latinos may be lactose intolerant.

En regardant ces chiffres, il est naturel de penser que les différences de tolérance au lactose sont structurées selon les « races » traditionnelles, et que notamment les africains / africains-américains ne digèrent pas le lactose. Pourtant ce n’est pas ce que l’on voit sur la première carte, qui représente les vraies données.

Plusieurs choses contribuent à cette incohérence. Premièrement, et la génétique de la lactase, et la classification en « races », suivent la géographie. On a donc un problème classique de corrélation erronée due à un facteur confondant : si A est corrélé à la géographie et que B est corrélé à la géographie, alors A et B apparaîtront corrélés. C’est pour ça que le choix de la carte des « races » n’est pas important : toute division arbitraire mais géographiquement organisée arrivera à ce type de résultat. Je suis sur qu’on trouverait des différences de tolérance au lactose entre religions, entre groupes linguistiques, etc.

Deuxièmement, on échantillonne souvent très mal la diversité humaine. Donc si je ne mesure la tolérance au lactose que dans une petite partie de l’Afrique, je peux tomber sur une région avec forte tolérance, ou forte intolérance, au lactose. Et c’est là où ça devient raciste, c’est à quelle région ou groupe humain allez-vous généraliser votre résultat. Si vous êtes d’origine européenne, vous êtes probablement sensible à la différence entre régions et pays, peut-être même savez-vous que les finnois ne sont pas scandinaves. Mais il est probable que vous ayez une idée assez vague de la diversité africaine, et qu’il soit tentant de labelliser un résultat d’une région africaine en « Afrique ». C’est compliqué dans le cas des africains-américains par le fait que les traites négrières ont préférentiellement pris les gens de certaines régions (et même ethnies) pour les emmener de force en Amérique (excellente visualisation ici) ; donc les africains-américains ne portent pas la diversité génétique africaine.

Pourquoi est-ce important ? D’un point de vue pratique, la recherche et la pratique médicales américaines sont très organisées autour de ces catégories, et cela peut mener à mal estimer les risques pour des groupes en fait très hétérogènes, même si dans le cas du lactose ce n’est pas très grave probablement. Mais la recherche médicale américaine étant très influente (en gros ils sont les meilleurs, on peut être plus nuancés mais ce n’est pas le lieu), ces catégories se retrouvent reprises par plein d’études où elles ne sont pas pertinentes. (Entre parenthèses, les races sociologiquement définies sont pertinentes aux aspects sociologiques de la pratique médicale, à savoir qui a accès aux soins, à l’instruction, à l’alimentation, etc. Donc bébé, eau du bain, pas jeter.)

Et d’un point de vue plus fondamental, on retrouve régulièrement des arguments du type « les noirs courent plus vite, c’est bien la preuve » (voir ce billet de Curieux2 savoir), ou plus subtils comme les différences de tolérance au lactose, qui utilisent la corrélation entre des différences génétiques géographiquement structurées, et les « races » traditionnellement définies, pour soutenir finalement le bon gros racisme à l’ancienne. Qui n’est pas parti bien loin d’après l’actualité. 🙁

En conclusion, ce n’est pas parce qu’en groupant les humains en classes grossières qu’on trouve des différences entre ces paquets, que les paquets sont « vrais » ni même utiles. Quand vous pensez diversité humaine, pensez gradients sur une carte, c’est plus joli et plus vrai que des noms dans un tableau.

(Juste après que j’ai publié ce billet, je vois un billet intéressant sur le blog du statisticien Nate Silver, connu pour ses prédictions concernant les élections américaines : In An Election Defined By Race, How Do We Define Race?)