Wie kann die Wissenschaft Betrug durch Plagiate verhindern? Die händische Analyse von Doktorarbeiten, die die Plattform „VroniPlag Wiki“ etwa im Fall der Politikerin Franziska Giffey durchführt, kostet viel Zeit. So viel Zeit haben Doktorväter nicht. Sie müssen sich auf die Ehrlichkeit ihrer Studenten und bislang nur bedingt taugliche Software verlassen. Denn bisher konnten Plagiaterkennungssysteme recht leicht ausgehebelt werden, wenn Plagiatoren etwas Aufwand in eine Paraphrasierung oder die Übersetzung eines Textes investierten.

In naher Zukunft werden aber auch solche „verschleierten“ Übernahmen elektronisch auffindbar sein. Durch den Einsatz von Künstlicher Intelligenz können dann verschiedene Ähnlichkeitsmerkmale wie Texte, Abbildungen, Quellenverweise, Tabellen, mathematische Ausdrücke und Schreibstil kombiniert betrachtet und gewichtet werden. Im Grunde lassen sich dadurch alle jemals veröffentlichten Doktorarbeiten in kurzer Zeit überprüfen. Da Wissenschaftsbetrug nicht verjährt, könnte es zu Hunderten, wenn nicht Tausenden von Aberkennungsverfahren an deutschen Hochschulen kommen. Das Plagiatserkennungssystem HyPlag, das Forscher unter der Federführung von Norman Meuschke und Bela Gipp an den Universitäten Wuppertal und Konstanz entwickelt haben, ist ein solches Instrument.

Ein digitaler Fingerabdruck in der Blockchain

Die Software eignet sich auch zur Überprüfung von Drittmittelanträgen. In solchen Anträgen auf Forschungsförderung finden sich oft Plagiate. Bisher nur schwer nachweisen lässt sich auch Ghostwriting, also das Verfassen eines Textes durch Dritte oder bezahlte Agenturen. Hier sind Erkennungsansätze machtlos, da sie darauf basieren, einen Text mit möglichen Quelldokumenten zu vergleichen. Es gibt aber nun Ansätze, wie man verdächtige Änderungen im Schreibstil innerhalb eines Dokumentes oder zwischen Dokumenten zu erkennen vermag. So lassen sich Indizien dafür gewinnen, ob einzelne Absätze aus einer anderen Quelle stammen. Zudem lässt sich das zu prüfende Dokument mit früheren Dokumenten eines Autors vergleichen.

Das Team um Meuschke und Gipp hat einen Ansatz entwickelt, der mittels Künstlicher Intelligenz Texte, die mittels Paraphrasing Tools „geschrieben“ wurden, besser identifizieren soll als menschliche Experten. Allerdings besteht bei allen Ansätzen, die den Text nicht mit einer externen Quelle vergleichen, das Nachweisproblem. Selbst wenn man Indizien für Unregelmäßigkeiten findet, sind diese noch gerichtsfest zu belegen. Technisch lässt sich hier aber bei der Erstellung einer Arbeit ansetzen. Mittels blockchain-basiertem „Trusted Timestamping“ wird schon heute an vielen deutschen Hochschulen der Entstehungsprozess von Arbeiten dokumentiert.

Dazu wird mit Hilfe eines Zeitstempels ein Dokument, aus dem eine Veröffentlichung werden soll, regelmäßig in der Blockchain abgelegt und dort, in all seinen Fassungen, dauerhaft und manipulationssicher archiviert. Auf diese Weise lässt sich die Entstehung eines Fachartikels über Monate hinweg dokumentieren, von der Eingabe der Rohdaten eines Experiments bis zur Freigabe der finalen Veröffentlichung. Gipp hat das Verfahren entwickelt und bietet mit seinem Unternehmen OriginStamp.org diesen für Wissenschaftler und Hochschulen kostenfreien Zeitstempeldienst an, der anonym und vertraulich genutzt werden kann: In der Blockchain kann man die Daten nicht lesen, dort wird nur ein digitaler Fingerabdruck davon gespeichert. Allerdings können die Daten für Dritte freigegeben und so die Entstehungsgeschichte einer Forschungsleistung lückenlos dargelegt werden.

Mehr zum Thema 1/

Zu den Forschern, die das Verfahren schon nutzen, gehört der Konstanzer Chemiker Michael Kovermann. Bei seinen Arbeiten über die Charakterisierung der Struktur, Dynamik und Funktion von Proteinen kommen biochemische, molekularbiologische und biophysikalische Methoden zum Einsatz. „Der Dokumentation der Ergebnisse kommt eine Schlüsselrolle zu. Das Speichern der experimentellen Daten auf Festplatten und handschriftliche Notizen in einem Laborbuch sind von essentieller Bedeutung, um die Ergebnisse zu veröffentlichen“, sagt Kovermann. „Durch den Einsatz von Trusted Timestamping kann zum einen belegt werden, wer wann und wo welche Ergebnisse erhalten hat. Dies spielt bei kompetitiven Projekten eine wichtige Rolle, da man als Nummer zwei die Ergebnisse nicht so hoch – bezüglich des impact factors – im Vergleich zu Pionierarbeiten veröffentlichen kann. Des Weiteren sind Reproduzierbarkeit und Transparenz des wissenschaftlichen Arbeitens wichtig. Daten dürfen nicht poliert, weggelassen oder geschönt werden.“ Mit Trusted Timestamping sei dieser Anspruch realisierbar und könne objektiv überprüft und umgesetzt werden. Gipp zählt nach eigenen Angaben immer mehr Nutzer seiner frei zugänglichen Anwendung.