COVID-19 Coronavirus Disease Spread Analysis in German Regions and the World

In early 2020 the SARS-CoV-2 virus (colloquially known as the coronavirus) spread across the globe and caused a pandemic of COVID-19 disease. This page presents a collection of daily updated charts and analysis of disease spread in German regions and the world. The focus lies on displaying the data of the past and deriving trends for the near future. In order to compare data of different regions, data is scaled by the regions' population. Charts are updated daily in the morning (UTC). Raw data and plot scripts are available in my GitHub repository.

Data sources

Feel free to drop me a message if you find a typo, bug or bigger issue. I am happy for inspirations for further analyses as well.

Stay safe, Torben

Table of Contents / Inhaltsverzeichnis

Further good information sources

Germany / Deutschland

Landkreise

Karte: Animation der Ausbreitung in den Landkreisen

Grafik anklicken um zur Animation zu gelangen.

Back to top

Anzahl der Landkreise mit Neu-Infektionen in der letzten Woche

In der folgenden Grafik ist als Zeitverlauf die Anzahl der deutschen Land- und Stadtkreise aufgetragen, die COVID-19 Neu-Infektionen in der letzten Woche vermeldet haben.

generated via Gnuplot plot-de-districts, raw data can be found in de-districts-zero_cases_last_week.tsv

Back to top

Landkreistabelle mit Intensivstationsauslastung

Es gibt nun auch eine konfigurierbare E-Mail Benachrichtigung für Landkreisdaten.

Ein Klick auf eine Zeile fügt diesen Landkreis in die interaktive Landkreis-Grafik hinzu.

06.05.2020: In Deutschland wurde als Richtwert für die Verschärfung von Maßnahmen der Grenzwert von 500 Neuinfektionen pro 1.000.000 Einwohnern in sieben Tagen in einem Stadt-/Landkreis festgelegt. Daher habe ich die Landkreistabelle nun nach diesem Wert in der Spalte "Infizierte pro Millionen Einwohner pro Woche" sortiert.

generated via Tabulator, raw data can be found here

Back to top

Interaktiver Landkreis Vergleich

Landkreise und Städte in obiger Tabelle auswählen. Mit dem Button über der Legende kann in die Daten hinein gezoomt werden.

y-Achse: x-Achse:

generated via eCharts, raw data can be found here

Back to top

Konfigurierbare Landkreis E-Mail Benachrichtigung

(Screenshot anklicken um zur Anmeldung zu gelangen)

Back to top

Bundesländer

Interaktiver Bundesland Vergeich

y-Achse: x-Achse:

generated via eCharts, raw data can be found in de-states

Back to top

Verdopplungszeit der Neu-Infektionen

22.08.2020 Bis heute hatte ich gedacht und gehofft, dass das Thema "exponentielles Wachstum der Fallzahlen" vom Tisch ist. Leider sprechen die jüngsten Zahlen eine andere Sprache. Daher habe ich heute eine neue Auswertung erstellt, die den Trend (Zunahme und Abfall) quantifiziert. Ich habe dazu die Verdopplungszeit bzw. Halbwertszeit der Neu-Infektionen berechnet. Verdopplungszeit ist die Zeit in der sich ein Wert verdoppelt hat, Halbwertszeit analog halbiert.

Zahlenbeispiel zur Verdeutlichung

Angenommen es sind heute 10 Neu-Infektionen und die Verdopplungszeit von 20 Tagen bleibt konstant, so ergibt sich in

20 Tagen → 20 Neu-Infektionen

40 Tagen → 40 Neu-Infektionen

60 Tagen → 80 Neu-Infektionen

80 Tagen → 160 Neu-Infektionen

...

Aus diesem Grund ist eine kurze Verdopplungszeit gefährlich und eine kurze Halbwertszeit gut.

In den folgenden Grafiken ist basierend auf den Neu-Infektionen pro Woche die dazugehörige Verdopplungszeit (rot) beziehungsweise Halbwertszeit (grün) dargestellt. Diese wurden ermittelt durch Regression über jeweils einen Zeitraum von 14 Tagen in die Vergangenheit, Details dazu siehe unten. Die Auswertung ist inspiriert von Konstantin Tavan's Darstellung.

Ergebnis: Im März betrug die Verdopplungszeit in Deutschland meist weniger als 5 Tage. Der Abschwung ab Anfang April war mit 10-15 Tagen Halbwertszeit deutlich langsamer als der Anstieg zuvor. Seit Ende Juli sind wir im Bereich einer Verdopplungszeit von 20 Tagen.

Nun der Vollständig halber eine kurze Erklärung zum mathematischen Hintergrund

Zur Ermittlung der Verdopplungszeit bzw. Halbwertszeit habe ich die Daten eines Intervalls mit einer exponentiellen Wachstumsfunktion "gefittet" (angenähert über eine Regressionsanalyse). Dabei werden vom Algorithmus 2 Parameter der Wachstumsfunktion so ermittelt, dass die Wachstumsfunktion zu einer optimalen Übereinstimmung mit den Daten skaliert wird. Aus den so ermittelten Werten der Parameter lassen sich dann Aussagen zum Wachstum treffen.

Exponentielle Wachstumsfunktion:

f(x) = N0 · exp(b · x)

mit N0: Skalierungsfaktor/Wert zum Zeitpunkt (x = 0 = heute)

und b: allgemeiner Parameter der das Wachstum beschreibt.

Um den Parameter b in eine besser verständlichere Verdopplungszeit T umzuskalieren, trifft man einfach folgenden Festlegung:

f(T) = 2 · f(x=0)

→ N0 · exp (b · T) = 2 · N0

→ b = ln (2) ÷ T

Analog lässt sich dies für eine Halbierung durchführen. Da aber ln(0,5) = -ln(2) ist, ist das Ergebnis fast identisch, nur das Vorzeichen der Halbwertszeit T ist negativ.

Anmerkung: Die Verdopplungszeit/Halbwertszeit T ist unabhängig vom Skalierungsfaktor N0. Daher ist es für die Bestimmung der Verdopplungszeit nicht notwendig die Daten auf die Bevölkerung zu skalieren.

Obige Routine habe ich nun für jeder Tag auf der x-Achse wiederholt um einen Zeitverlauf der Verdopplungszeit bzw. Halbwertszeit (bei Abnahme) zu bestimmen. Dabei verwende ich pro Tag das Intervall der y-Werte der Daten dieses Tages und der jeweils 13 vorangegangenen Tage. Als x-Werte verwende ich für jedes dieser Intervalle die Werte -13..0 (Tage). Der N0 Skalierungsfaktor wird mit dem y-Wert des aktuellen Tages initiiert (aber auch durch den Algorithmus optimiert).

Back to top

Bundesländer - Infektionen

Neu-Infizierte pro 7 Tage

Darstellungen des Zeitverlaufs an COVID-19 Erkrankungen in den deutschen Bundesländern. Die Zahlen habe ich skaliert auf die Bevölkerung der Bundesländer, damit man diese miteinander vergleichen kann. Da die täglichen Zahlen stark schwanken und Wochenenden einen deutlichen Effekt auf diese Schwankungen haben, habe ich in den Darstellungen 7-Tagesdifferenzen verwendet.

generated via Gnuplot plot-de-states-timeseries-joined, raw data can be found in de-state-XX.tsv

Gesamtzahl der Infizierten

generated via Gnuplot plot-de-states-timeseries-joined, raw data can be found in de-state-XX.tsv

Gesamtzahl Infizierte - Bar Chart

Die graue Linie zeigt den Wert für Gesamtdeutschland.

generated via Gnuplot plot-de.gp, raw data can be found in de-states-latest.tsv

Back to top

Bundesländer - Opfer

In den Darstellungen der Opferzahlen habe ich auf der rechten Seite Referenzwerte zu anderen Todesursachen angegeben, Quellen dazu siehe diese Tabelle unten. Hinweis: die Todeszahlen laufen den Infektionszahlen um ca. 3 Wochen hinterher. Im Median sterben Patienten 14 Tage nach den ersten Symptomen, die wiederrum etwa 3-5 Tage nach der Infektion auftreten.

Neu-Verstorbene pro 7 Tage

Gesamtzahl der Opfer

generated via Gnuplot plot-de-states-timeseries-joined, raw data can be found in de-state-XX.tsv

Back to top

Weitere Auswertungen

Wie hoch ist die Wahrscheinlichkeit dass beim Treffen mit Personen ein Infizierter dabei ist?

Hier eine kleine Exkursion in die Stochastik/Wahrscheinlichkeitsrechnung mit dem Ziel das Risiko einer Infektion beim Treffen von Personen abzuschätzen.

Annahme zur Abschätzung: die Zahl der Neu-Infektionen pro Woche entspricht der Zahl der aktuell infektiösen Personen. Wichtig ist die Dunkelziffer der unbemerkt infizierten Personen nicht außer Acht zu lassen, ein Faktor 4 auf die offiziellen Fallzahlen erscheint mir realistisch. Sind also in einer Region 25 Neu-Infektionen pro 100000 Einwohner gemeldet, so nehme ich an, dass 100 Personen pro 100000 Einwohner derzeit ansteckend sind. Aus der Tabelle unten kann man nun für verschiedene Gruppengrößen ablesen wie wahrscheinlich es ist, dass eine ansteckende Person dabei ist. Die Excel-Berechnung dazu, die auch einen "Taschenrechner" für die freie Eingabe von Werten enthält, ist unter der Tabelle verlinkt.

generated via Excel wahrscheinlichkeit-infizierten-treffen.xlsx



Veranstaltungsrisikoabschätzung

Basierend auf den Annahmen des letzten Abschnitts, hier ein "Taschenrechner" für die Risikoabschätzung von Veranstaltungen/Menschenansammlungen. Der Anspruch dieser groben Abschätzung ist nicht eine exakte Zahl sondern die Größenordnung der Wahrscheinlichkeit in Abhängigkeit von Infektionslage und Teilnehmerzahl zu liefern.

Eingangsgrößen Anzahl Personen in Veranstaltung Ort Neu-Infektionen in Region (letzte 7 Tage pro 100.000 Einwohner), Zahlen können auch der obigen Landkreistabelle entnommen werden Schätzung Faktor Dunkelziffer Geschätzte Gesamtzahl infektiöser Personen (inklusive Dunkelziffer) in Region (pro 100.000 Einwohner) Ergebnis Wahrscheinlichkeit dass eine aktuell infektiöse Person unter den Teilnehmern ist (Berechnungslogik siehe wahrscheinlichkeit-infizierten-treffen.xlsx)

Anmerkungen zu den Eingangsgrößen, Annahmen und Vereinfachungen für dieses grobe Modell:

Die Zahl der Neu-Infektionen pro Woche ist genähert durch die Zahl der aktuell infektiösen Personen. Dies wird unterstützt durch die Angabe des RKI einer durchschnittlichen Infektiositätsdauer von 8-9 Tage.

Dunkelziffer: das RKI schätzt einen Bereich von 4,5–11,1.

Verordnete Quarantäne ist nicht berücksichtigt. Diese ließe sich durch die Reduktion des Dunkelziffer-Faktors um bis zu 1 einrechnen (nur die infektiösen und dennoch herum laufenden Personen bilden eine Gefahr für ihre Umgebung). Allerdings erfahren viele Leute ihr Testergebnis erst wenn sie bereits infektiös sind.

Die infektiösen Personen werden gleichverteilt auf die gesamte Bevölkerung angenommen und nicht nach Altergruppen etc. unterschieden.

Anmerkung zum Ergebnis:

Die Wahrscheinlichkeit das es zu einer Ansteckung kommt, hängt von vielen weitern Faktoren wie Dauer, Umgebung, getroffenen Schutzmaßnahmen ab und lässt sich nur sehr schwiering als Wahrscheinlichkeit in % abschätzen. Über Ideen und Hinweise dazu bin ich dankbar, hier können Sie mich kontaktieren.

Back to top

Um wieviele Tage läuft die Opferzahl der Zahl der Infizierten hinterher?

In der folgenden Abbildung habe ich für Deutschland die Neu-Infizierten und die Neu-Verstorbenen aufgetragen. Die Kurve der Neu-Verstorbenen habe ich dann zeitlich verschoben um heraus zu finden, um wie viele Tage die Verstorbenen "nachlaufen". Anstatt von Tagessummen wurde die 7-Tage-Differenz verwendet um Wochenendeffekte auszuschließen.

Ergebnis vom 27.04.2020: 14 Tage passen ziemlich gut. Somit ist anzunehmen, dass die Opferzahlen noch mindestens 14 Tage lang abnehmen werden. Für die Zeit von Infektion bis positiv getestet vergehen vermutlich nochmal 7 Tage, so dass wohl 3 Wochen zwischen Beginn einer Maßnahme und Sichtbarkeit dieser in den Opferzahlen liegen wird. Für die beste Übereinstimmung der Kurven habe ich die rechte Achse der Verstorbenen auf 4.2% der linken Achse skaliert. Beides habe ich "nach Auge" gemacht und keine Optimierungsroutine verwendet.

Analog lässt sich aus dem Zeitverlauf der Infektionen eine Prognose für die Opferzahl für die nächsten 14 Tage erstellen, die direkt mit der Auslastung der Krankenhäuser korrelieren sollte. Hier exemplarisch für Deutschland, Bundesland Bayern und Stadt Erlangen. Skaliert jeweils pro Millionen Einwohner.

generated via Gnuplot plot-de-shift-deaths-to-match-cases.gp, raw data can be found in de-state-DE-total.tsv

Back to top

Wie hoch ist die Dunkelziffer der Infizierten im Vergleich zu den offiziellen Fallzahlen?

04.04.2020: In der letzten Woche habe ich immer mehr Stimmen gehört und gelesen, die den offiziellen Zahlen nicht trauen. Höhepunkt war, dass ein Dresdner Freund, der positiv auf COVID-19 getestet wurde, berichtete, dass von seinen Kontakten der letzten 2 Wochen (vor der Ausgangssperre) keiner einen Test bewilligt bekam. Dies ist vermutlich in der ausgereizten Testkapazität der Labore begründet. Daher habe ich mal versucht eine Abschätzung der Dunkelziffer (=Differenz zwischen der Gesamtzahl der Infizierten und den positiv getesteten Personen) zu treffen.

Folgende sehr vereinfachte grobe Annahmen (Inspiriert von diesem Artikel, Abschnitt "Washington State") habe ich getroffen:

Wer heute stirbt, hat sich vor 2 Wochen infiziert

Ein Infizierter stirbt mit einer Wahrscheinlichkeit von 1%

Die Verdopplungszeit der Opferzahl wird aus den Daten der letzten Woche ermittelt und für die Prognose in die Zukunft konstant gehalten

Damit lässt sich die Gesamtzahl der Infizierten vor 2 Wochen rückwärts berechnen aus 100x (Kehrwert von 1%) die Zahl der heute Verstorbenen. Diese Rechnung lässt such nun für jeden Tag X durchführen: Zahl der Toten am Tag X mal 100 zugeordnet zum Tag X-14. Daraus lässt sich auf die Gesamtzahl der heute infizierten Personen über eine Regressionsanalyse/Fit der Daten (mehr dazu unten) extrapolieren. Graphisch sieht dies wie folgt aus:

generated via Gnuplot plot-de-calc-deaths.gp, raw data can be found in de-state-DE-total.tsv

Anmerkung zu den Annahmen: Die Sterblichkeit ist vermutlich geringer als die angenommenen 1%. Es dauert wohl üblicherweise eher 3-4 Wochen von Infektion bis zum Tode, nicht wie von mir gerechnet nur 2 Wochen. Beide Effekte wirken sich vergrößernd auf die Dunkelziffer aus.

Update vom 18.04.2020: Spiegel Online zitiert in diesem Artikel Thomas Fenner mit der Schätzung, dass 1,9% der Deutschen Bevölkerung bereits von Covid-19 infiziert waren. Meine grobe Abschätzung lieferte an diesem Tag 1.5%, was überraschend dicht dran ist. (Am 04.05.2020 ist diese meine Abschätzung auf 1.1% gesunken. Ursache ist die starke Reduktion des exponentiellen Wachstums, durch die erfolgreichen Lockdown Maßnahmen in der Zwischenzeit.

Mein persönliches Fazit aus dieser sehr groben Abschätzung ist, dass die Dunkelziffer recht groß zu sein scheint und aufgrund der beschränkten Testkapazität in Zukunft wohl weiter zunehmen wird. Dies bewirkt in den Grafiken und Auswertungen eine stärkere Zunahme der berechneten Verdopplungszeit als es in der Realität der Fall sein sollte. Die wirkliche Verdopplungszeit ist daher vermutlich kürzer als von mir unten pro Bundesland ermittelt. Für meine internationalen Vergleiche habe ich mich ausschließlich auf die Opferzahlen gestützt, diese halte ich weiterhin für belastbar. Die folgenden Kapitel belasse ich trotzdem online, so kann jeder Leser selber entscheiden welche Schlüsse er aus den Daten zieht.

Nun folgen noch drei Beispiele die die Idee hinter meiner groben Abschätzung verdeutlichen sollen, da es berechtigte Kritik an der ersten Fassung dieses Abschnitts gab.

Beispiel 1: Eine Insel mit 1000 Einwohnern von denen bisher keiner infiziert war.

Wenn alle 1000 Einwohner am gleichen Tag, zB 1.1.2020 infiziert, sollten nach 14 Tagen (15.01.2020) unter den obigen Annahmen statistisch gemittelt 10 Personen verstorben sein. Werden auf dieser Insel keine Tests durchgeführt, so ist die Zahl der positiv getesteten Personen = 0 und die Dunkelziffer = Gesamtzahl = 1000. 14 Tage später (15.01.2020) sind nun 10 Menschen tot. Wendet man obiges einfaches Model auf die Zahl der 10 Verstorben an: Multiplikation der Anzahl mit dem Kehrwert von 1% und verschieben um 14 Tage in die Vergangenheit, so ergibt sich rückwärts die Gesamtzahl von 1000 Infizierten für den 01.01.2020. Die Zahl der bekannten Infizierten (Hellfeld) war die ganze Zeit = 0. Die Zahl der Verstorbenen ist bis zum 14.01. = 0, dann steigt sie auf 10 und bleibt bei diesem Wert, da die Pandemie auf der Insel vorbei ist.

Beispiel 2: Eine Insel mit 1000 Einwohnern von denen bisher keiner infiziert war, auf der aber getestet wird.

Ergebnis ist das gleiche, mit dem Unterschied, dass die Zahl der positiv getesteten Personen ungleich 0 ist, was aber nicht die Abschätzung einfließt.

Beispiel 3: Eine Insel mit 16000 Einwohnern von denen bisher keiner infiziert war.

Werden nun 1000 am 01.01.2020 infiziert, so werden am 15.01. immer noch 10 sterben. Am 15.01. lässt sich daher wie oben beschrieben auf die Gesamtzahl von 1000 am 01.01. schließen. Allerdings werden weiter Menschen infiziert. Nehmen wir z.B. exemplarisch eine Verdopplungszeit von 7 Tagen an, so ist am 8.01. eine Gesamtzahl von 2000 Personen infiziert, am 15.01. dann 4000. Somit ist die Gesamtzahl der Infizierten am 15.01. größer als 1000, was zur Folge hat, dass an den Folgetagen weitere Menschen sterben werden. Am 15.01. sind 4000 infiziert (Verstorbene mitgezählt) aber nur 10 verstorben. Würde man am 15.01. großangelegte Tests durchführen, so würde man im Idealfall alle 4000 infizierten Personen bestimmen und die Dunkelziffer wäre 0. Bestimmt man an diesem Tag die Sterblichkeit, so würde man am 15.01.2020 10 Tote auf 4000 Infizierte = 0.25% finden, was der Eingangsgröße/Annahme widerspricht. Wartet man allerdings weiteren 2 Verdopplungszeiten ab, so sind am 29.01. alle 16000 Einwohner infiziert. Wartet man nochmal 2 Wochen, bis die unglücklichen schweren Fälle verstorben sind, so findet man dann dass von den 16000 Einwohnern 160 verstorben sind, und die Sterblichkeit ist wie erwartet 1%. Dies verdeutlicht, dass die Sterblichkeit erst korrekt ermittelt werden kann, wenn das exponentielle Wachstum vorbei ist.

Untersuchung der exponentiellen Zunahme der Infektionen in Deutschland

Dieses Kapitel ist nicht mehr relevant, da wir glücklicherweise den Bereich der exponentiellen Zunahme der Neu-Infektionen verlassen haben. Daher habe ich es archiviert.

Countries Worldwide

Map: Countries's Casulties

Map deaths per million population, borrowed from Wikipedia. Data source: the json file provided by github.com/pomber/covid19 is based on data of Johns Hopkins University Center for Systems Science and Engineering (JHU CSSE)

Back to top

Country Table

Click on a row to add it to the country comparison chart below.

"Cases Doubling Time" is derived by an exponential fit of the "Cases Last Week" of the last 14 days.

generated via Tabulator, raw data can be found in countries-latest-all.tsv / countries-latest-all.json

Back to top

Country comparison chart

Usage hints

Browse and click in country table above to search and select or deselect interesting countries

Download your chart using the button top right

Share a link to your chart by copying the updated URL of this page

Nomenclature

Cases means positively tested on COVID-19 and reported to JHU. Note: I do not trust Cases data for international comparison too much, as it strongly depends on testing and reporting.

means positively tested on COVID-19 and reported to JHU. Note: I do not trust data for international comparison too much, as it strongly depends on testing and reporting. Deaths are much more reliable than Cases , I suppose. Deaths are furthermore stronger related to the hospital workload.

are much more reliable than , I suppose. are furthermore stronger related to the hospital workload. Per Million means scaled per million population. These series should be used when comparing countries.

means scaled per million population. These series should be used when comparing countries. New means change with respect to the previous day.

means change with respect to the previous day. Last Week means change with respect to 7 days in the past (=rolling week). It is therefore is smoother than the New series.

1. Select countries Africa Asia Europe North America South America Oceania 2. Select data y axis: x axis:

3. Chart

generated via eCharts, raw data can be found in country-XX.tsv / .json

Many thanks to Attila Andrási-Nagy for code review, cleanup and implementation of the first version of the select data logic!

Back to top

Doubling Time of New Infections

In the following the exponential growth of the new infections is analyzed. If an increase is found, I fitted the data with an exponential function to drive the new cases doubling time. As data I used the "Cases Last Week" series of the last 14 days. The resulting doubling time is the number of days it takes for a doubling of new cases, shorter is worse, of cause. Color coded is the value of "Cases Last Week Per Million" as additional information, red means high.

Back to top

Event Risk Calculator

Assuming an event/company/school with many people attending. What is the propability of a COVID-19 infectious person being there?

Input Number of people attending Cases-New in region (last 7 days per 100.000 population), numbers can be found at Country Table above. Estimated factor of unreported cases Estimated total amount of infectious people in population (last 7 days per 100.000 population) Output Probability for 1 or more infective people are attending

I have made the following simplifications for this rough model:

The number of new infections per week is approximated by the number of currently infectious people. This is supported by the German RKI, stating an average duration of infection of 8 -9 days .

Unreported numbers: For Germany the RKI expects a range of 4.5-11.1. The more tests are performed, the lower this number should be.

Quarantine is not taken into account. This could be accounted for by reducing the factor of unreported cases by up to 1 (only the infected and walking around are a threat to their surroundings). However, many people retrieve their test results when they are already infectious and are still around others.

The infectious people are assumed to be evenly distributed across the entire population and not differentiated according to age groups, etc.

Comment on the result: The likelihood that an infection will occur depends additionally on many other factors such as duration, environment and protective measures taken and is very difficult to estimate as a probability in %. I am grateful for ideas and hints, here you can contact me.

Back to top

Country Rankings

Cases

Ranking countries by total cases (series "Cases per Million Population") and color-coding their current new cases (series "Cases Last Week per Million Population").

Ranking countries by current new cases (series "Cases Last Week per Million Population") and color-coding their total cases (series "Cases per Million Population").

Back to top

Deaths

Ranking countries by total deaths (series "Deaths per Million Population") and color-coding their current new deaths (series "Deaths Last Week per Million Population").

Ranking countries by current new deaths (series "Deaths Last Week per Million Population") and color-coding their total deaths (series "Deaths per Million Population").

Back to top

Comparison of selected countries

Current situation

Deaths, absolute values.

generated via Gnuplot plot-countries.gp, raw data can be found in countries-latest-selected.tsv

Deaths, scaled by of the countries, to make them comparable.

generated via Gnuplot plot-countries.gp, raw data can be found in countries-latest-selected.tsv

See table below for reference data: deaths by other causes

Back to top

Timeseries

First using absolute values.

generated via Gnuplot plot-countries-deaths.gp, raw data can be found in countries-timeseries-XX.tsv

Now again re-scaled to the population of the countries, to make them comparable.

Now weekly new deaths per million population. I decided to use this delta of the last 7 days (rolling week) instead of daily new deaths values, since there are strong weekend and other effects present, leading to wrong conclusions.

generated via Gnuplot plot-countries-deaths.gp, raw data can be found in countries-timeseries-XX.tsv

See reference table for the numbers used.

Back to top

Reference data: deaths by other causes per year.

Back to top

Investigating the Calculated Case Mortality: Deaths per Reported Infections

Different countries put different effort in testing the population for COVID-19. Hence, some have rather high death toll despite a rather low reported cases. The ratio between the two will be called "calculated case mortality" in the following. The calculated case mortality is of cause highly related to the test effort: more testing results in more reported cases and hence a lower calculated mortality. If on the other hand the clinics are overrun, this will result in an increase in mortality, as the docs are unable to heal all patients. Countries that show a strongly exponentially increasing death toll (short doubling time) will have a lower calculated mortality than the true value. Here a plots of this value for different countries.

generated via Gnuplot plot-countries.gp, raw data can be found in countries-latest_selected.tsv

Findings

Many of the selected countries have a calculated case mortality of around 2%.

08.04.2020: In South Korea and Japan the exponential spread of the virus seems to be under control and they test quite a lot. Therefore, their calculated case mortality might be close to the true mortality in high-technology countries. South Korea today has a value of 1.9%, Japan of 2.2%.

08.04.2020: Most countries that show high calculated case mortality (probably due to too little testing) are the owes facing severe problems today (IT, FR, BE. ES). If this correlation is true, I expect UK, NL and SE to have severe problems soon.

Let us now compare the calculated case mortality to the deaths per capita

generated via Gnuplot plot-countries.gp, raw data can be found in countries-latest_selected.tsv

Findings

A low calculated case mortality seems to be related to low deaths per capita, so testing might safe lives, or it is a stronger medical system being related to higher testing capacity.

Time series, Doubling time calculation and forecast for selected countries

As in all countries the exponentially increase of the death toll is stopped, this chapter has been archived.