Im vorab online veröffentlichten Epidemiologischen Bulletin 17 "Schätzung der aktuellen Entwicklung der SARS-CoV-2-Epidemie in Deutschland – Nowcasting" vom 9. April 2020 geben Wissenschaftler des Robert Koch-Instituts den politisch Verantwortlichen eine Hilfestellung für die Frage, wie sich die aktuelle Fallsituation aus statistischer Sicht darstellt und wie sich die verschiedenen Maßnahmen vom 9., 16. und 23. März ausgewirkt haben könnten. Denn die bisherigen Zahlen waren ja mehr verwirrend als erhellend.

Was bringen die Ausgangsbeschränkungen?

Die Vorabversion der Studie zeigte so beispielsweise, dass die Kontaktsperrmaßnahme vom 23. März offenbar so gut wie gar keine Auswirkungen auf den Verlauf der Fallzahlen gehabt hat. Im aktuellen Update, das in dem heutigen Situationsbericht veröffentlicht werden wird und das heise online vorab zur Verfügung steht, sieht man nur einen mäßigen Effekt auf die Fallzahlen. Auch das Max-Planck-Institut für Dynamik und Selbstorganisation hat auf Basis der Meldezahlen eine Modellrechnung durchgeführt und misst der Kontaktbeschänkung aber größere Auswirkungen zu.

Das Problem mit den vom RKI täglich bekannt gegebenen Fallzahlen sind die vielen Verzugszeiten, die diese so weit durcheinanderwirbeln, dass sie für die aktuelle Situation nur eine sehr beschränkte Aussagekraft haben. Man muss mehrere Tage warten, bis sich mit genügend Nachmeldungen die Zahlen stabilisiert haben. Aussagen, die sich nur auf die aktuell bekanntgegebene RKI-Fallzahl beziehen, wie die vom RKI in der Risiko-Bewertung "Die Zahl der Fälle in Deutschland steigt weiter an" sind dann eher als Makulatur zu bezeichnen.

Aber das gilt nicht nur für die RKI-Fallzahlen, sondern auch für die aktuelleren Zahlen der Johns Hopkins University, der Berliner Morgenpost oder der Zeit. Denn es gibt eben nicht nur den hier schon mehrfach problematisierten Meldeverzug beim mitunter langen Weg aus den 412 lokalen Gesundheitsämtern über die zuständige Landesbehörde bis hin zu dem Robert Koch-Institut. Hinzu addieren sich dann noch die Verzugszeiten bei der Diagnose und bei der Testung in den Laboren. Auch dort wird an den Wochenenden weniger gearbeitet und zudem leiden die Labore verstärkt unter dem Mangel an PCR-Kits. Zigtausend Proben blieben so ein, zwei Tage liegen.

Die mittleren Gesamtverzugszeiten sind zudem nicht konstant, sie stiegen laut Studie im Verlauf des März von etwa sechs auf neun Tage und verkürzten sich dann Anfang April auf 8 Tage.

Schwierige Meldelage

Zahlreiche Werte werden von den Gesundheitsämtern nachgemeldet, im RKI-Dashboard oder im RKI-Tagesbericht sieht man seit einiger Zeit, wie sich die veröffentlichte Fallzahl in Nachmeldungen aufteilt, Nachmeldungen die zum Teil sogar mehr als 3 Wochen zurückreichen. Für die tatsächlichen Zahlen am aktuellen Veröffentlichungstag bleibt dann gerade Mal ein Bruchteil über. Für halbwegs realistische Werte für einen gegebenen Tag muss man also wenigstens drei oder vier weitere Tage abwarten. Und wegen der deutlich erkennbaren Einbrüche am Wochenende ergibt es deutlich mehr Sinn, Zahlen über An- oder Abstieg über einen ganzen Zeitraum von einer Woche zu mitteln. Und jetzt zu Ostern mit drei Feiertagen sind Bewertungen auf Basis der gemeldeten Fallzahlen noch fraglicher als sonst.

Mit den nachgemeldeten Daten und über 7 Tage gemittelt fallen die Wochenendschwankungen weitgehend heraus und es ergibt sich ein klareres Bild von dem Verlauf der Neuinfektionen, das solche Meldungen, die auf Basis punktueller Meldedaten geäußert werden, wie "die Zahlen haben sich wieder erhöht" , konterkariert. (Bild: Andreas Stiller)

Die Zahlen, die man vom RKI über die Datenbank Survstat für die einzelnen Bundesländer für alle meldepflichtigen Infektionskrankheiten (und auch von Covid-19) abrufen kann, sind genau solche nach Kalenderwochen aufgelistete Wochenwerte, die aber meist erst später, bei Covid-19 mit eins, zwei Wochen Abstand verfügbar sind.

An die aktuellen Werte aller Datensätze samt Nachmeldungen mit Informationen über Alter, Geschlecht, Meldetermin und so weiter kommt man über den Corona-Hub von www.npgeo.de heran. Für die Nachmeldungen gibt es allerdings etwas merkwürdige Tags, unter denen neue Daten, mit denen von gestern verglichen werden. Da hätte man doch lieber einen Veröffentlichungstermin im Datensatz gehabt.

Imputation und Nowcast

In der im Bulletin 17 veröffentlichten Studie gehen die Autoren aber einen großen Schritt weiter und haben mit statistischen Methoden sämtliche Verzugszeiten gegengerechnet und zwar nicht bezogen auf einen irgendwie gearteten Meldetermin, sondern auf den Erkrankungstermin. Dieser ist nur in rund 61 Prozent der Meldungen von den Gesundheitsämtern aufgeführt. Für den Rest haben die Wissenschaftler mit plausiblen "Missing-Data"-Methoden (unter anderem mit Vergleich zu anderen in der gleichen Altersklasse, gleichem Geschlecht und so weiter) einen virtuellen Erkrankungszeitpunkt bestimmt, also auch dann, wenn die Erkrankten gar keine Symptome aufgewiesen haben. Mit den Nachmeldungen kann man das dann für weiter zurückliegende Erkrankungstermine relativ genau nachträglich abschätzen, die Statistiker nennen diese Technik, fehlende Daten durch eine Art Interpolation nachzutragen, "Imputation".

Noch interessanter dürfte es sein, wenn man die Falldaten für die gerade erst frisch Erkrankten hinreichend genau prognostizieren kann. Und weil es sich dabei nicht um ein "Forecast" für irgendwann in der Zukunft, sondern quasi für jetzt handelt – nur eben mit später eintrudelnden Nachmeldungen – haben sie das "Nowcast" getauft.

Ganz bis zum Jetzt kommt man dabei aber nicht, mindestens drei Tage zurück muss man schon gehen, sonst wird die Berechnung instabil. Je weiter man zurückgeht, um so mehr Datenmaterial hat man und um so kleiner wird die Ungenauigkeit im 95%-Prädiktionsintervall.

Geschätzte Entwicklung der Anzahl von neuen SARS-CoV-2-Fällen in Deutschland (Nowcast) aufgrund teilweise imputiertem Datum des Erkrankungsbeginns und adjustiert für Diagnose- und Meldeverzug mit 95 %-Prädiktionsintervallen (95 %-PI). Die gestrichelten vertikalen Linien kennzeichnen den Start bestimmter Maßnahmen am 9. März, 16. März und 23. März, s. Tab. 1 (S. 15). Dargestellt bis zum 7. April (Bild: Robert Koch-Institut, Epid. Bull. 17/2020, Update 12.4.2020)

Das am 9. April veröffentlichte Ergebnis berücksichtigt Erkrankungstermine bis hin zum 4. April. Man sieht den starken Einfluss der Schulschließung am 16. März jedoch so gut wie keinen Einfluss durch die Kontaktsperre am 23. März. Das vielleicht noch mal als Hinweis an die Experten der Leopoldina-Akademie, die als ersten Lockerungsschritt eingeschränkte Schulöffnungen vorschlagen. Vielleicht sollte man doch lieber möglichst bald mit der ohnehin verfassungsrechtlich bedenklichen und bei Einhaltung von Hygiene und Abstandsregeln möglicherweise wirkungslosen Kontaktsperre anfangen und wie in Österreich zumindest kleinere Läden wieder öffnen.

Aber auch in dieser Studie sind noch nicht alle Imponderabilien berücksichtigt, darauf wies im Telefongespräch Mitautor Matthias an der Heiden hin. Insbesondere fehlt noch der Einfluss der Anzahl der Testungen. Denn je mehr man testet, umso mehr Fälle wird man feststellen. Selbst wenn die Zahl der realen Neuinfektionen konstant bleibt, wird man bei mehr Tests eine Steigerung feststellen.

R-Abschätzung

Schätzung der effektiven Reproduktionszahl R für eine angenommene Generationszeit von 4 Tagen. Die gestrichelten vertikalen Linien kennzeichnen den Start der in Tab. 1 (S. 15) genannten Maßnahmen am 9. März, 16. März und 23. März 2020 (Bild: Robert Koch-Institut, Epid. Bull. 17/2020 Update 13.4.2020)

Aus den per Imputation und Nowcasting ermittelten Daten können die Autoren auch eine Abschätzung der wichtigen effektiven Reproduktionszahl R ableiten. Hier zeigen sich deutlich die Effekte der Maßnahmen vom 9. März (Verbot von Großveranstaltungen, verstärkte Hygiene wie Händewaschen, und das ein paar Tage später stark propagierte und offenbar gut eingehaltene "Wir bleiben zuhause") sowie die Schul- und Kindergartenschließung am 16. März. Immer mit ein paar Tagen Verspätung wegen der Inkubationszeit. Danach kam R so gegen den 21. März auf unter 1.0. Auch in dieser Darstellung ist keinerlei Einfluss der Kontaktsperre am 23. März auf R zu erkennen. In der Vorabversion stieg der R-Wert sogar wieder etwas an. Im aktuellen Update mit neueren Zahlen bleibt er knapp unter 1,0.

Schlussfolgerung

Mit dem Bezug auf einen wichtigen Event im Verlauf der Covid-19-Krankheit, nämlich auf den Erkrankungstermin und nicht auf mehr oder weniger zufällige Meldetermine stellt die Studie eine wichtige Neuerung in den Datenangaben des Robert-Koch-Instituts dar, die aus meiner Sicht eine weitaus bessere Basis für Analysen und Ableitungen ist, als die üblichen Fallzahlen. Verzugsartefakte und Wochenenden sind hier herausgerechnet. Unter anderem kann man daraus viel deutlicher die Wirkung von Maßnahmen ablesen.

Und so erwähnte RKI-Präsident Wieler den Nowcast auch in der heutigen Pressekonferenz als wichtige neue Datenquelle. Dieser Begriff Nowcast steht dabei allerdings stellvertretend für die ganze auf den Erkrankungstermin normierte Kurve. Bleibt also zu hoffen, dass das RKI genau diese Verlaufskurve samt Nowcast täglich updatet und so wie heute in den Situationsberichten aufnimmt und die Risiko-Bewertung nicht mehr aufgrund fragwürdiger Tagesfallzahlen vornimmt. (as)