Zum wiederholten Mal wird seit zwei Tagen die Firma Cambridge Analytica durch meine Timeline getrieben, in Form einer durchaus spannend aufbereiteten Story, garniert mit einem Whistleblower, Facebook-Datenlöchern, Steve Bannon und den unvermeidlichen Russen. Die ausführlichsten Quellen dazu sind die beiden Qualitätsmedien Guardian und New York Times.

Cambridge Analytica (CA) sollte eigentlich allen ein Begriff sein, Ende 2016 wurde behauptet, die Firma sei der entscheidende Faktor sowohl für den Brexit, als auch für die Wahl Trumps zum amerikanischen Präsidenten gewesen. Der die Diskussion auslösende Artikel hier ist inzwischen hinter einer Paywall verschwunden, dafür ist die Einordnung des Ganzen als PR-Gig eines möchtegern-einflussreichen Unternehmens von Eva Wolfangel auf Spektrum weiterhin frei zugänglich.

Umso erstaunlicher ist nun, wie es CA doch wieder geschafft hat, so viel Aufmerksamkeit zu generieren. Nun mag genau dies ein gewichtiger Teil des Geschäftsmodells solcher Firmen sein, aber es ist schon bemerkenswert, wie es eine Daten/Algorithmen-Klitsche wie CA zum wiederholten Male es in alle Gazetten schafft. Hauptzutat für diesen Aufmerksamkeits-Cocktail war jetzt ein Whistleblower. Ein durchaus sympathischer junger Mann, Christopher Wylie, der sich mit Nasenring, pinken Haaren und Armeeshirt ablichten lässt, behauptet „I made Steve Bannon’s psychological warfare tool“ und lässt sich vom Guardian zu seiner Zeit bei CA interviewen. Dabei bezichtigt er u. a. seinen ehemaligen Chef, Alexander Nix, der Lüge, was die Herkunft der von CA verwalteten Daten angeht. Ansonsten erzählt er die beeindruckende Geschichte eines jungen Nerds, der mehr zufällig als gewollt in Abläufe verwickelt wurde, die ihn zusammen mit Robert Mercer, Steve Bannon und nicht näher benannten Russen im Hintergrund sowohl die Brexit-Abstimmung als auch die amerikanische Präsidentenwahl entscheidend beeinflussen ließen.

Meine Filterblase reagierte dieses Mal etwas abgeklärter als im Dezember 2016, als die Geschichte „Big Data und böse Umtriebe haben uns Trump beschert“ mir ohne Not massenhaft von besorgten Bewohner|innen meiner Timeline untergejubelt wurde. Trotzdem stieß ich auf eine Reihe von Falschaussagen, so dass ich versucht war, der Sache noch einmal auf den Grund zu gehen. Hier mein Ergebnis:

Die Daten

CA-CEO Christopher Alexander Nix behauptet in diesem YouTube-Video (ein als wissenschaftlicher Vortrag getarntes CA-Commercial) „We [CA] have 4 or 5000 Data Points on every adult of the united states.“ Woher er die Daten hat, sagt er nicht. Wiley (der Whistleblower mit dem schlechten Gewissen) bestätigt dagegen die Hypothese, dass die Daten von CA größtenteils von Facebook stammen und von einem Wissenschaftler mit dem Namen Aleksandr Kogan („Dr Kogan – who later changed his name to Dr Spectre, but has subsequently changed it back to Dr Kogan.„) gesammelt worden sein sollen.

Grundlage für diese Datensammelei und die darauf basierende Auswertung ist eine Studie von Youyou, Kosinski und Stillwell mit dem Titel „Private traits and attributes are predictable from digital records of human behavior“ aus dem Jahr 2013, die bei PNAS erschienen ist. Kosinski und Stillwell hatten bereits 2011 eine Facebook-Persönlichkeitsmerkmal-Studie veröffentlicht, die mir allerdings so wenig gefallen hat, dass ich sogar darüber bloggen musste. Wie auch immer, die beiden scheinen inzwischen so etwas wie Facebook-Datennutzungs-Experten zu sein, siehe auch die dritte referenzierte Studie unten. Kosinski wurde offenbar von CA angesprochen, ob er die für seine Studie erhobenen Daten verkaufen würde, was er (wissenschaftlich redlich) verweigerte. Dafür fand sich dann der oben erwähnte Kogan, der die Datenerhebung replizierte und diese dann für einen ordentlichen Betrag (ich las etwas von 800.000 US$) an CA verhökerte. CA-Chef Nix leugnet das nicht, bezeichnet aber das, was er von Kogan bekam, in einer Befragung durch einen Untersuchungsausschuss des britischen Unterhauses als „fruchtlos“. Die CA zur Verfügung stehenden Daten (s.o., Datenpunkte für jeden US-Bürger) würden nicht von Facebook stammen. Wiley widerspricht dem und enthüllt auch, worum es sich bei den Daten handelt:

Wie Kosinski und sein Team ließ Kogan zehntausende Versuchspersonen über Amazons Mechanical Turk einen Fragebogen ausfüllen, über den sich die fünf Hauptdimensionen der Persönlichkeitsstruktur (Big Five oder OCEAN-Modell) ermitteln lassen sollen. Die Versuchspersonen sollten außerdem ihr Facebook-Profil für eine eigens entwickelte Analyse-App freigeben, damit die ihr Facebook-Verhalten (v.a. die Likes) mit dem eingegebenen Persönlichkeitsmerkmalen korreliert werden konnte. Problematisch hier war, dass nicht nur das Facebook-Verhalten der Versuchspersonen (die dafür ja ihr Einverständnis gegeben hatten) protokolliert wurde, sondern auch das ihrer Facebook-Freundschaften. Bis zum Frühjahr 2016 2014 war das offenbar ohne weiteres möglich, danach wurde die Facebook-API geändert. Insgesamt sollen so Informationen zu etwa 5 50 Millionen Profilen zusammengekommen sein. Facebook ging (nach einer Stellungnahme zu urteilen , die ich gerade nicht finde ) Danke Constanze, siehe Kommentar) davon aus, dass die Daten rein wissenschaftlich verwendet, nicht weitergegeben und nach der Studie wieder gelöscht werden. Kogan hat es offenbar aber genau umgekehrt gemacht. Was natürlich extrem unredlich ist.

Die Methode

Was aber macht man mit den Daten? CA in Person von Nix behauptet (im Video, das ich oben schon verlinkt habe), mit den gespeicherten Datenpunkten jede Bevölkerungsgruppe in quasi beliebiger Auflösung adressieren zu können. Das funktioniere deshalb, weil CA eine „psychographics platform“ umgesetzt haben will, mit deren Hilfe man ermitteln kann, über welche psychologischen Spielchen man welche Wechselwähler in welchen Gebieten der USA erreichen kann. Wenn Nix das erzählt, sieht das so aus, als hätte es Hand und Fuß. Aber wenn es ein solches System geben würde, fußte es doch bestimmt auf wissenschaftlichen Erkenntnissen?

Tatsächlich findet sich auch hierfür eine Studie auf PNAS, an der auch wieder die beiden Hauptverdächtigen Kosinski und Stillwell beteiligt waren. Philipp Hummel fasst sie – wiederum auf Spektrum – sehr schön zusammen: Ja, man kann Zielpersonen über ihr Like-Verhalten auf Facebook identifizieren und wenn man ihnen Werbung serviert, die man auf ihr Persönlichkeitsprofil hin optimiert (Schutzversprechen für Ängstliche, Abenteuer für Wagemutige etc.), neigen sie dazu, diese öfter zu klicken. Das ist einerseits wenig überraschend, andererseits sagt eine der Autor|inn|en (Sandra Matz) selbst, dass bisher nur ein sehr grobes Design eingesetzt werden konnte, vor allem, weil die Adressierung in Facebook relativ schwierig ist. Diskriminierung zwischen Gruppen funktioniert dort nämlich nur über einzelne Likes (jedenfalls für Außenstehende, also nicht für Facebook selbst). Das heißt, Versuchspersonen wurde aufgrund eines einzigen Likes eine Werbung entweder angezeigt oder nicht. Dass trotzdem ein Effekt gemessen werden konnte, spreche für dessen Stärke.

Das Fazit

Demnach sollte das, was CA von sich behauptet, also tatsächlich funktionieren, jedenfalls wenn man die richtigen Daten und darüber hinaus die Möglichkeit hat, Personen, zu denen diese Daten gehören, zu adressieren. Facebook verfügt tatsächlich über beides (jedenfalls, wenn es um seine Nutzer|innen geht). Nach Wiley hat CA zumindest einen Ausschnitt inzwischen allerdings etwas veralteter Daten (grob: Das Like-Verhalten von ca. 5 50 Millionen US-Amerikanern). Nix behauptet, viel mehr Daten zu haben, die außerdem nicht von Facebook, sondern aus anderen Quellen stammen. Beides kann ich nicht wirklich glauben. Darüber hinaus sehe ich momentan keine Möglichkeit, wie CA die Leute, deren Wahlverhalten sie beeinflusst haben wollen, adressiert haben. Über Facebook scheint das nicht gelaufen zu sein (siehe oben, Methoden) – für eMail-Bomben und Flugzettel scheint mir das zur Verfügung stehende Datenmaterial nicht ausgereicht zu haben.

Nun haben sich die Briten tatsächlich für den Brexit und die US-Amerikaner für Trump entschieden, was beides im Vorfeld als eher unwahrscheinlich galt. Hat Cambridge Analytica also doch Magie eingesetzt und den Willen der Wähler|innen (auf wissenschaftlich nicht nachvollziehbare Weise) beeinflusst, auf Geheiß von Bannon, den Mercers und irgendwelchen Russen? Es ist natürlich eine tolle Story und wir tendieren dazu, das Unerklärbare dunklen Mächten und Verschwörer|inne|n in die Schuhe zu schieben. Tatsächlich ist die Rolle von Facebook, nicht nur aufgrund des Datenleaks, in dieser Sache keine gute. Die Verbreitung von Falschmeldungen, das Einkochen der immer gleichen Suppe in Filterblasen und geschlossenen Gruppen, die Mächtigkeit dreckschleudernder Bots (nicht nur) auf dieser Plattform sind zu einer finsteren Bedrohung einer offenen Gesellschaft und demokratischer Strukturen geworden. CA behauptet, in diesem Umfeld mit einem Präzisionsgewehr individuell Wähler|innen beeinflusst zu haben. Ich halte das für unwahrscheinlich und behaupte, eine Schrotflinte voll Fake-News-Gülle aus dem FoxNews / Breitbart / Infowars-Stall hat ausgereicht. Und dabei war CA nur einer von mehreren Schützen.

Das ist insofern verwerflich, als dass es die politische Stimmung, vor allem aber die Kultur in unseren westlichen Gesellschaften verändert, indem bewusst auch Falschmeldungen lanciert werden. Man kann sich auch darüber aufregen, dass ein Player wie Russland bis in höchste Regierungskreise offenbar aktiv in diesem Mechanismus beteiligt ist. Dass eine Kriegsführung mithilfe von Falschinformationen aber westlichen Geheimdiensten völlig fremd war oder ist, das braucht mir niemand ernsthaft zu erklären. Zweck heiligt keine Mittel, vor allem nicht die, die irgendwann gegen einen selbst eingesetzt werden. Was CA angeht, so gebührt der Firma der Dank, dass sie die Öffentlichkeit über Möglichkeiten der individuell passgenauen Beeinflussung großer Bevölkerungsgruppen aufgeklärt haben. Dass CA tatsächlich imstande ist, diese Möglichkeiten auch umzusetzen, das wage ich zu bezweifeln. Ganz im Gegensatz allerdings zu Facebook, Google, Amazon oder auch den amerikanischen Geheimdiensten. Insofern sollten wir wachsam bleiben.

Nachtrag 20.3..2018 – 8:23 – In Britannien kümmert sich offenbar Channel 4 um die Aufarbeitung der Causa CA. Während im ersten Teil noch der Whistleblower ausführlich zu den bösen Umtrieben von CA Stellung nehmen darf, die wir schon in der NYT und dem Guardian lesen durften, gibt es im zweiten Teil ein lustiges versteckte-Kamera-Stück zu bestaunen: Channel 4 hat CA offenbar als Politiker aus Sri Lanka getarnte Kunden untergeschoben, um die Firma aus der Reserve zu locken. Anfangs gibt es nur das schon bekannte Geklingel um die magischen Datenanalysefähigkeiten. Dann aber schwadroniert Nix himself (vor versteckter Kamera!) darüber, dass man versteckte Kameras einsetzen könnte, etwa um politische Gegner der Korruption zu überführen. Zur Not könne man ja auch Sexarbeiterinnen einsetzen, ukrainische vielleicht. Dass jemand, der vorschlägt, Fallen zu stellen, selbst in einer sitzt, ist natürlich herrlich Meta. Darüber hinaus zeigt der Ausschnitt aber zweierlei: Erstens: es scheint nicht so schwer zu sein, CA, die ja eigentlich alles durchleuchten könnten – Kunden, die gar keine sind, unterzuschieben. Zweitens: Wenn man Zutrauen zu den eigenen Fähigkeiten bezüglich der Datenanalyse hätte, würde man wohl kaum mit schlechten Agententricks arbeiten wollen.