Ein Maschinenlern-Programm von britischen und belgischen Forschern kann berechnen, wie einfach es ist, Personen anhand eines anonymisierten Datensatzes zu identifizieren. Das schreibt Technology Review online in "Trotz Anonymisierung leicht zu finden". Bürger der USA und Großbritanniens können ihre Wahrscheinlichkeit, gefunden zu werden, selbst überprüfen, indem sie eine Postleitzahl sowie Geschlecht und Geburtsdatum angeben.

Im Durchschnitt kann man in den USA mit diesen drei Daten in 81 Prozent der Fälle korrekt in einer sogenannten anonymisierten Datenbank gefunden werden. Angesichts von 15 demografischen Merkmalen einer in Massachusetts lebenden Person besteht eine 99,98-prozentige Wahrscheinlichkeit, dass man diese Person in einer beliebigen anonymisierten Datenbank findet. "Während sich die Informationen häufen, sinken die Chancen, dass es sich nicht um Sie handelt, sehr schnell", sagt Yves-Alexandre de Montjoye vom Imperial College London, der die Studie mit Kollegen von der belgischen Université catholique de Louvain durchgeführt hat.

Dies ist nicht die erste Studie, die zeigt, wie einfach es ist, Personen aus anonymisierten Datenbanken aufzuspüren. Ein Artikel aus dem Jahr 2007 hat beleuchtet, dass wenige Filmbewertungen bei Netflix reichen, um eine Person so leicht zu identifizieren wie etwa durch ihre Sozialversicherungsnummer. Die neue Studie zeigt jedoch, wie weit die gegenwärtigen Anonymisierungspraktiken hinter unserer Fähigkeit zurückgeblieben sind, diese zu brechen.

Mehr dazu in Technology Review online in:

(vsz)