En mars 2017, un homme de 73 ans cloué au lit dans une maison de retraite de l'Oregon a reçu la visite des forces de l'ordre, qui l'ont contraint à fournir son ADN. Il n'avait commis aucun crime, mais les enquêteurs avaient découvert une partie de son patrimoine génétique dans une base de données lors d'une enquête sur des meurtres en série. Quelques mois plus tard, en utilisant les mêmes méthodes, la police finissait par arrêter Joseph DeAngelo, suspecté d'être le "Golden State Killer" recherché pour au moins 12 meurtres et une cinquantaine de viols commis dans les années 1970 et 1980.

L'ADN qui a servi pour ces recherches ne provenait pas d'une liste de délinquants, de suspects ou d'agresseurs sexuels, mais simplement d'une base de données généalogique à laquelle participent volontairement des milliers de personnes dans le monde. De telles bases, qui vous proposent de vous aider à retrouver vos ancêtres avec l'aide de votre patrimoine génétique, ont fleuri sur le marché en ligne.

Leur principe est simple : un kit de collecte d'ADN qui, une fois analysé fournit les données génétiques qui peuvent ensuite être comparées à celles disponibles dans la base du service, et permettent ainsi de retrouver ceux qui partagent des caractéristiques communes : les membres de la famille, plus ou moins éloignés.

J’ai fait analyser mon ADN et on m’a découvert un demi-frère

60% des Américains d'origine européenne déjà fichés ?

Que l'on fournisse volontairement des données aussi privées que son ADN n'a rien d'étonnant, au vu du nombre colossal d'informations personnelles que nous délivrons chaque jour joyeusement à Facebook, Google et les autres. La différence est pourtant de taille : vous n'allez pas retrouver toutes vos données intimes sur les réseaux sociaux si vous n'y êtes pas inscrits, alors que pour les bases "d'ADN généalogique" et autres sites proposant de tester votre patrimoine génétique, vous êtes peut-être fichés sans le savoir... à cause de votre famille. Et les données enregistrées sont loin d'être aussi en sécurité que l'on pourrait légitimement l'espérer.

C'est une étude menée par des chercheurs de l'université de Columbia (Etats-Unis), de l'université hébraïque de Jérusalem (Israël) et (paradoxalement ?) de la société de tests ADN à but généalogique MyHeritage qui fait un point inquiétant sur l'état des lieux en la matière. Dans un article publié ce jeudi soir dans la revue "Science", ces scientifiques, emmenés par le Dr Yaniv Erlich, ont estimé le nombre de personnes qui peuvent être identifiées par ces bases ADN privées.

Selon cette étude, jusqu'en avril 2018, plus de 15 millions de personnes se sont soumises à un test génétique proposé par un organisme commercial, et 7 millions de kits de tests ont été vendus rien qu'en 2017. Résultat : en comparant les gènes d'un citoyen américain d'origine européenne avec l'ADN de ces bases de données privées on aurait 60% de chances de retrouver l'un de ses cousins au 3e degré ou plus proche, donc de pouvoir remonter jusqu'à lui via sa famille et d'autres éléments comme son âge approximatif ou la zone de résidence. Et ce n'est qu'un début, les chercheurs affirment :

"Cette technique pourrait impliquer presque tous les Américains d'origine européenne dans un futur proche."

Pourquoi restreindre ces chiffres aux familles originaires d'Europe ? Parce que pour l'instant, ils constituent une grande majorité des clients de ces services. Environ 75% des 1,28 million de profils individuels étudiés par l'équipe du Dr Erlich ont des gènes provenant principalement d'Europe du Nord. Mais rien ne dit que cela ne pourrait pas changer dans l'avenir. Et si l'étude s'est limitée aux Etats-Unis, la généalogie par ADN pourrait fort bien gagner du terrain dans d'autres pays, dont ceux de l'Union européenne...

Pourquoi c'est un problème

"Ces derniers mois, les forces de l'ordre ont commencé à exploiter les services de génomique marchands pour localiser des suspects en trouvant leurs lointains parents génétiques", expliquent les auteurs de l'étude. "La plupart de ces enquêtes concernaient des affaires non résolues dans lesquelles des décennies d'investigation n'avaient pas réussi à identifier l'auteur. Cependant, l'un de ces cas concernait un crime d'avril 2018, ce qui suggère que quelques services ont incorporé les recherches à longue portée d'ADN familial dans leurs enquêtes en cours."

On pourrait penser que donner accès à de telles bases de données aux forces de l'ordre n'est qu'un moyen normal d'accroître la sécurité publique et de résoudre des enquêtes criminelles. Il y a cependant un équilibre à trouver entre la lutte contre la criminalité et le respect de la vie privée, et ce débat est loin d'être clos comme l'a récemment démontré le bras de fer qui a opposé Apple et le FBI, ce dernier souhaitant obtenir un accès au contenu crypté d'un iPhone. "Alors que les responsables politiques et le grand public peuvent être favorables à de telles méthodes de police scientifique pour résoudre des crimes, elles dépendent de bases de données et de services qui sont ouvertes à tous", avertissent les auteurs, qui citent les nombreuses données anonymisées à vocation de recherche scientifique qui sont accessibles librement. "Par conséquent, la même technique pourrait aussi être exploitée à des fins néfastes."

Une anonyme retrouvée via l'ADN de parents éloignés

Pour mieux démontrer leur point de vue, le professeur Erlich et ses collègues ont extrait le génome d'une femme anonyme ayant participé à des recherches dans une université de l'Utah. Ils ont ensuite comparé cet ADN anonyme avec les données disponibles sur des bases généalogiques commerciales. "En à peu près une heure de travail, nous avons identifié un couple d'ancêtres à partir de données généalogiques accessibles au public," expliquent-ils.

Ils ont ensuite recherché les descendants de ce couple ancestral susceptibles de correspondre aux données démographiques associées à la femme anonyme dans les bases de données publiques, ce qui leur a donné une approximation de son année de naissance. Au bout d'une journée consacrée à passer au peigne fin les quelques centaines de descendants du couple initial, ils ont fini par retrouver la propriétaire du génome "anonyme".

Conclusion logique :

"Ces recherches démontrent que des techniques similaires pour identifier de l'ADN anonyme peuvent être exploitées pour d'autres usages que le maintien de l'ordre public."

Pour le Dr. Erlich, "les bases de données génétiques généalogiques se comportent comme un système GPS pour ADN anonyme. Les arbres généalogiques constituent un système de coordonnées dans lequel l'ADN de chaque individu de ces bases de données est comme une balise qui illumine des centaines de ses parents qui ne sont pas dans la base. Par conséquent, même si un individu spécifique n'est pas dans ces bases, un de ses parents pourrait y être, ce qui suffit à l'identifier."