Algorithmen zum maschinellen Lernen lassen sich im Prinzip auf jeden Datensatz trainieren. Wo Menschen keine Muster erkennen, raten KIs dann normalerweise nur rein zufällig. Hin und wieder lernen sie aber auch für Menschen unsichtbare Muster. So gelang es Michal Kosinski und Yilun Wang von der Stanford University, laut einer Studie die dem The Economist zufolge bald im Journal of Personality and Social Psychology veröffentlicht wird, per maschinellem Lernen aus Bildern von Datingplattformen zu erkennen, ob die abgebildete Person homosexuell ist.

Menschen sind dieser Aufgabe normalerweise nicht gewachsen und raten die sexuelle Orientierung von Männern nur in 61% der Fälle richtig, die von Frauen sogar nur in 54%, haben die Forscher ermittelt. Die KI habe schwule Männer dagegen in 81% der Fälle richtig erkannt, sah sie fünf Bilder statt nur einem sogar mit 91%. Lesbische Frauen erkannte sie nicht ganz so sicher mit 71% bei einem und 83% bei fünf Bildern. Der Zeitung zufolge sind sich die Forscher aber bewusst, dass die Portraits von Datingseiten besonders verräterisch bezüglich der sexuellen Orientierung sein könnten. In anderen Datensätzen habe die KI durchaus auch einige Fehler produziert.

Keine innovative Technik nötig

Um aber besser als Menschen zu raten, mussten die Forscher nicht einmal auf Deep Learning zurückgreifen. Es reichte wohl mit einer Software namens VGG-Face einen Feature-Vektor für die Gesichter zu berechnen (eine Art Fingerabdruck für Gesichter) und den mit logistischer Regression zu klassifizieren. Der Algorithmus sah sich während des Trainings 35.326 Bilder von 14.776 Personen an und lernte auf kleinste Unterschiede zu achten, die Menschen üblicherweise entgehen.

Die sexuelle Orientierung gehört in Deutschland zu den persönlichen Daten, die laut Gesetz besonders geschützt werden müssen. Dass eine KI mit hoher Wahrscheinlichkeit aus üblicherweise öffentlich zugänglichen Bildern diese äußerst private Information herausfiltern kann, stellt den Datenschutz zum Teil infrage. In Zukunft wird es nämlich nicht mehr reichen, die Verbreitung dieser Information zu reglementieren.

Die Technik hinter der Studie könnte in Ländern, in denen Homosexualität strafbar ist, zum Problem werden. Die Forscher haben bewusst keine Angaben zur Quelle ihres Datensatzes gemacht, um einfache Kopien des Systems zu verhindern. Ein Nachbau würde bei einem so einfachen System aber nicht schwerfallen, da die meisten Datingplattformen entsprechend zugeordnete Bilder enthalten. (pmk)