Von Simon Hurtz

Vor zwei Jahren zog der belgische Informatik-Dozent Yves-Alexandre de Montjoye von Boston nach London, suchte einen neuen Arzt und bekam dort in der Praxis ein Formular in die Hand gedrückt. Er sollte einwilligen, dass seine Gesundheitsdaten an Forschungseinrichtungen und Unternehmen weitergegeben werden dürfen; selbstverständlich anonymisiert. An einen Satz erinnert sich de Montjoye noch heute: Manche glaubten, stand dort, dass einzelne Patienten mit diesen Daten identifiziert werden könnten.

Was sein Arzt noch im Konjunktiv äußerte, hat de Montjoye nun selbst in den Indikativ gesetzt. Gemeinsam mit zwei belgischen Kollegen untersuchte er, ob angeblich anonyme Datensätze in Wahrheit doch Rückschlüsse zulassen. "Unsere Ergebnisse legen nahe, dass selbst stark anonymisierte Stichproben den Standards von Datenschutzgesetzen nicht genügen", schreiben die Forscher in der Fachzeitschrift Nature.

Ihre Studie zeigt, dass in acht von zehn Fällen Geschlecht, Geburtsdatum und Postleitzahl reichen, um Menschen zweifelsfrei zu identifizieren; schon weiß man, dass es sich um Barbara Miller oder John Smith aus So-und-so handelt. Und mit lediglich 15 Angaben können die Wissenschaftler die Identität eines US-Amerikaners mit einer Wahrscheinlichkeit von 99,98 Prozent bestimmen.

Unternehmen vermarkten teils Datensätze, die jeweils Hunderte Merkmale von Millionen Menschen enthalten. Der Datenhandel ist meistens legal, weil ein Großteil der Daten nicht als personenbezogen gilt. Regelwerke wie die EU-Datenschutzgrundverordnung greifen deshalb nicht.

Im Netz schwirren Daten von Milliarden Menschen umher

Bereits Mitte der 1990er-Jahre zeigte der damalige Gouverneur von Massachusetts, William Weld, unfreiwillig, dass anonyme Daten oft eine Illusion sind. Sein Bundesstaat veröffentlichte eine Datenbank, die Patientendaten von Mitarbeitern des öffentlichen Dienstes enthielt. Weld versicherte, dass niemand sich fürchten müsse. Alle personenbezogenen Merkmale wie Name, Adresse und Sozialversicherungsnummer seien entfernt worden.

Kurz darauf fand er seine eigene Patientenakte im Briefkasten: Latanya Sweeney, damals Informatik-Studentin, heute Harvard-Professorin, konnte Weld im Datensatz identifizieren und zeigen, dass er zu viel versprochen hatte. Und 2006 veröffentlichte AOL Suchanfragen von 650 000 Nutzern; 2007 gab Netflix Video-Empfehlungen von 500 000 Nutzern frei; 2016 veröffentliche Australiens Regierung Gesundheitsdaten von 2,9 Millionen Menschen. Angeblich waren die Daten komplett anonym. In allen Fällen gelang es Forschern, die Informationen mit konkreten Personen zu verknüpfen.

Zudem lassen sich ahnungslose Nutzer von Apps und Browser-Erweiterungen überwachen, ohne es zu merken. Kriminelle erbeuten riesige Datensätze. Im Netz werden Daten von Milliarden Nutzern gehandelt, legal und illegal. Das kann der Einzelne kaum verhindern, das könnten allenfalls strengere Gesetze und bessere Anonymisierungsverfahren gewährleisten. Aber vielleicht können Forscher wie de Montjoye Menschen davon abhalten, den Datenschatz freiwillig zu vergrößern. Es kann schon reichen, einen Haken nicht zu setzen oder ein Formular nicht zu unterschreiben.