Aktuelle Forschung zeigt, dass mit Hilfe maschinellen Lernens Vorhersagemethoden entwickelt werden können, um aus Facebook-Nachrichten, „Likes“ und „Status-Updates“ berechnen zu können, welche der Nutzer zu Drogen-, Tabak- oder Alkoholmissbrauch neigen. Dafür wurden elf Millionen Facebook-Accounts herangezogen und deren Verhaltensmuster analysiert.

Wer sich an Alkohol, Tabak oder Drogen vergnügt oder sie missbraucht, zeigt bestimmte Verhaltensmuster, die über das Facebook-Profil und die Nutzungsgewohnheiten der Plattform abgelesen werden können. Daraus können mit hoher Genauigkeit Vorhersagen für andere Facebook-Nutzer errechnet werden, die den Missbrauch von solchen Substanzen anzeigen. Das ist ein Ergebnis einer Untersuchung von Wissenschaftlern des Addiction Recovery Research Centers in Roanoke, Virginia. Dazu nutzten die Forscher Verfahren des maschinellen Lernens und werteten damit große Mengen textueller Daten aus und bezogen auch die „Likes“ und die „Status-Updates“ ein. Damit konnte ein Erkennungssystem entwickelt werden, um Menschen aus der Menge der Facebook-Nutzer zu fischen, die mit hoher Wahrscheinlichkeit Drogen zu sich nehmen und zum Missbrauch neigen.

Die neue Studie bestätigt Ergebnisse früherer Forschung aus dem Jahr 2012, die bereits zeigen konnte, dass der Konsum von Alkohol, Tabak und Drogen aus der Analyse von Facebook-„Likes“ vorhergesagt werden kann. Die Menge der von den Forschern aktuell hinzugezogenen Daten erlaubt statistisch aussagekräftige Ergebnisse, da die ausgewerteten Datenmengen früherer Studien übertroffen werden: Alle „Likes“ von insgesamt elf Millionen Facebook-Nutzern und zusätzlich 22 Millionen „Status-Updates“ von 150.000 Facebook-Nutzern wurden verwendet.

Verhaltensstörungen erkennen

Den Forschern ging es um Menschen, die zu einer substance use disorder (SUD, psychische oder Verhaltensstörung bei Drogennutzung) neigen. Solche Personen können bei Konsum von Alkohol, Sedativa, Hypnotika, Tabak und weiteren Substanzen nicht nur eine Drogenabhängigkeit entwickeln, sondern auch Verhaltensstörungen. Ziel war es vorrangig, im Wege des maschinellen Lernens eine Vorhersagemethode zu finden, um aus ihren Facebook-Nachrichten diejenigen berechnen zu können, die an einer solchen SUD leiden. Dabei konnten im Umkehrschluss aber auch Erkenntnisse gewonnen werden, wie sich Alkohol oder andere Drogen auf das Nutzungsverhalten bei Facebook auswirken.

Vielversprechende Plattform für Drogenforschung?

Die wesentlichen ihrer Ziele erreichten die Wissenschaftler: Sie wollten algorithmische Lernmethoden finden, um den großen Datensatz der Facebook-Nutzer inklusive der „Likes“ und „Status-Updates“ zu analysieren, die aber nicht zeitgleich menschlich überwacht werden. Die Informationen, die der Software eingespeist wurden, sind dabei nicht gleichartig, müssen daher zum maschinellen Lernen kombiniert ausgewertet werden. Darauf basierend sollten SUD-Vorhersagemodelle entwickelt werden, deren Resultate für eine nachfolgende menschliche Analyse nutzbar sind.

Das war erfolgreich: Für alle untersuchten SUD-Arten konnten jeweils über achtzig Prozent Vorhersagegenauigkeit erreicht werden. Die besten der entwickelten maschinellen Lernmethoden konnten mit einer Genauigkeit von 86 Prozent Tabaknutzung vorhersagen. Für Drogenkonsum konnte eine Treffgenauigkeit von 84 Prozent erreicht werden, für Alkohol 81 Prozent. Gegenüber früheren Studien konnte damit die Erkennungsrate übertroffen werden.

Die Forscher ziehen daher das Fazit:

We believe social media is a promising platform for both studying SUD-related human behaviors as well as engaging the public for substance abuse prevention and screening. (Soziale Medien sind unserer Auffassung nach eine vielversprechende Plattform, um menschliche Verhaltensweisen im Zusammenhang mit SUD [Anm. Redaktion = psychische oder Verhaltensstörung bei Drogennutzung] zu studieren sowie um die Öffentlichkeit über den Missbrauch von Substanzen zu informieren, diesen sichtbar zu machen und Prävention zu leisten.)

Wie findet die Software Betäubungsmittelnutzer?

Wenn man das Vorgehen inhaltlich betrachtet, bekommt man einen ganz guten Eindruck, wie ein Algorithmus Zusammenhänge rechnerisch konstruiert und über große Datenmengen hinweg zu Aussagen mit hoher Genauigkeit bringen kann. Die Forscher haben dafür Schlüsselbegriffe genutzt, die aus Vergleichsgruppen von Menschen mit Verhaltensstörungen aufgrund von Missbrauch von Drogen, Alkohol oder Tabak stammen und zu den jeweiligen Störungen mathematische Korrelationen aufweisen.

Dazu gehören eine Reihe von Schimpfwörtern wie „fuck“ und „shit“, Bezüge zum Körper- oder emotionalen Zustand wie „hate“, „kill“, „blood“ und „pain“ sowie Wörter mit sexuellem Bezug wie „horny“ und „sex“. Zusätzlich wurden kulturelle Präferenzen hinzugezogen, etwa Musik, Filme oder Unterhaltungsaktivitäten. Ein Film wie „V for Vendetta“ ist beispielsweise positiv korreliert zu Alkoholkonsum, wohingegen etwa eine Vorliebe zu Trickfilmen negativ korreliert ist, also die Wahrscheinlichkeit gering ist, dass der entsprechende Facebook-Nutzer zu der Substanz greift.

Die Forschung ist der Prävention von Drogen gewidmet, jedoch braucht man wenig Phantasie dazu, sich ganz andere Interessierte an diesen Vorhersagetechniken vorzustellen: Wenn etwa ein Werbetreibender aus der bloßen Beobachtung des Facebook-Verhaltens mit hoher Wahrscheinlichkeit weiß, einen starken Tabaknutzer vor der Flinte zu haben, kann er die angebotene Werbung entsprechend ändern. Und beispielsweise zu wissen, wem man billigen Fusel anbieten kann, weil er zu krankhaftem Alkoholmissbrauch neigt, könnte so manchen Anbieter auch interessieren – wenn er die ethischen Bedenken ignoriert. Angesichts der hohen Quote an Menschen, denen wegen Betäubungsmittelvergehen hinterhergestiegen wird, ist vielleicht auch die Identifizierung von potentiellen Straftätern ein Feld für staatliche Bedarfsträger oder für Geheimdienste und ihre Kompromatkoffer.