Viele Farblaserdrucker hinterlassen auf fast jedem Ausdruck vereinzelte gelbe Punkte, die mit bloßem Auge kaum zu erkennen sind und in kodierter Form Informationen preisgeben, etwa Datum und Uhrzeit des Ausdrucks oder die Seriennummer des Druckers. Nun ist es zwei Forschern der TU Dresden gelungen, die Kodierung der gelben Punkte automatisch zu dechiffrieren und unschädlich zu machen.

Diverse Tracking-Muster aufgespürt

Timo Richter und Stephan Escher von der Professur Datenschutz und Datensicherheit haben in einem Experiment 1.286 Ausdrucke von 141 Druckern 18 verschiedener Hersteller untersucht, die solche Tracking-Punkte aufwiesen. Darunter befinden sich Modelle von Epson, Brother, Dell, HP, Xerox, IBM, Canon, Kyocera, Konica Minolta, Lexmark, Ricoh und Samsung.

Neben den bereits bekannten Kodierungsmustern fanden die Forscher diverse weitere, die zwischen 48 und 98 Bits umfassen. Einige Druckerhersteller verwenden mehrere Muster, Epson beispielsweise vier Stück. Außerdem gelang es Richter und Escher, die Muster ohne den bislang erforderlichen manuellen Bildabgleich mit Algorithmen automatisch digital aufzuspüren und größtenteils zu entschlüsseln, welche Informationen im Ausdruck enthalten sind.

Die gelben Punkte mit der Kodierung von Seriennummer und anderen Daten sind links hervorgehoben. Per Algorithmus lassen sie sich weitgehend entfernen (rechts). (Bild: Association for Computing Machinery / TU Dresden)

Kodierung aushebeln mit zusätzlichen Punkten

In einem Artikel legen die Autoren detailliert dar, wie sie die unterschiedlichen Trackingmuster entschlüsselt und welche Methoden zum Anonymisieren von Dokumenten sie untersucht haben: Die Tracking-Punkte lassen sich einerseits entfernen, andererseits lassen sich auch sämtliche möglichen Stellen der Matrix mit Punkten füllen. Ein dritter – und bei einer späteren Analyse womöglich unverdächtiger – Ansatz ist jedoch, einige Punkte hinzuzufügen und so die Information in der Matrix zu maskieren und unbrauchbar zu machen.

Die Forscher setzen ihre Erkenntnisse auch praktisch um und stellen zum Untersuchen und Verschleiern eigener Dokumente ihr Toolkit DEDA auf GitHub zur Verfügung – eine Sammlung von Python-Skripten, die unter der GPL-v3-Lizenz stehen. Damit lassen sich die Tracking-Punkte auf eingescannten Ausdrucken extrahieren, analysieren und anonymisieren.

Das Tracking-Muster eines Ausdrucks in anderen Farben hervorgehoben (links). Füllt man sämtliche Punkte des Rasters aus (rechts), ist die Kodierung gelöscht. Weniger auffällig ist jedoch das Einfügen einiger zusätzlicher Punkte, was die verborgene Information ebenfalls unbrauchbar macht (mitte). (Bild: Association for Computing Machinery / TU Dresden)

Unauffällige Druckpunkte als Falle für Whistleblower

US-Medien hatten erstmals 2004 über diese auch als Machine Identification Code bekannte Markierung berichtet. Die Electronic Frontier Foundation (EFF) hatte 2005 dazu aufgerufen, ihr solche Ausdrucke zu schicken und beim Dokumentieren zu helfen. Kurz darauf teilte die EFF mit, ein Code-Muster entschlüsselt zu haben. Angeblich soll der amerikanische Secret Service einige Druckerhersteller zur Implementierung der gelben Farbpunktmarkierung verpflichtet haben – mutmaßlich als Mittel gegen das Verbreiten von Falschgeld und anderen Fälschungen.

Eine individuelle Druckerkodierung war womöglich 2017 einer Whistleblowerin zum Verhängnis geworden: Sie hatte vertrauliche Dokumente der NSA zu einer möglichen russischen Beeinflussung der US-Präsidentschaftswahl an ein Magazin weitergegeben, das diese wiederum zur Verifikation der NSA vorlegte. Kurz nach der Veröffentlichung wurde die Informatin (die Mitarbeiterin eines NSA-Dienstleisters war) verhaftet und legte ein Geständnis ab. (tiw)