Al heb je niets met cijfers, in deze coronatijden heb je geen keuze. Elke dag weer hoor je over nieuwe gevallen, over flattening the curve, over exponentiële groei. Deze explainer zet de belangrijkste cijfers op een rij. Wat zeggen de statistiekjes, en wat niet?

Waar vind ik de laatste cijfers?

Voor een wereldwijd overzicht van cijfers over het coronavirus – zoals het aantal bevestigde gevallen – kun je het beste kijken naar data van de World Health Organization (WHO). Dat is de VN-organisatie die zich met wereldwijde gezondheid bezighoudt. Het is dé autoriteit op het gebied van dit soort cijfers.

Elke dag publiceert de WHO een situation report met de laatste stand van zaken rondom het coronavirus, waarin data van alle landen zijn verzameld en geaggregeerd. Hier vind je de ‘situation reports’ van de WHO. Omdat de situatie snel verandert, zullen we in dit artikel op De Correspondent geen actuele cijfers delen. Op de website Our World in Data – een soort data-Wikipedia, met fijne uitleg over de cijfers – vind je up-to-date visualisaties van de WHO-data. Bekijk hier de visualisaties van Our World in Data.

Goed om te weten: de data van de WHO lopen altijd een tikkie achter, omdat de organisatie de cijfers verzamelt van andere nationale gezondheidsorganisaties. Het scheelt nauwelijks, maar wil je echt de laatste stand van zaken in een bepaald land, ga dan naar de website van de nationale organisatie die verantwoordelijk is voor de publieke gezondheid in dat land. In Nederland is dat het Rijksinstituut voor Volksgezondheid en Milieu (RIVM). Bekijk hier de coronapagina van het RIVM.

Update 24 maart: Our World in Data gebruikt Lees waarom Our World in Data geen WHO-data meer gebruikt. intussen geen WHO-data meer, maar data van het European Center for Disease Control and Prevention (ECDC). Bekijk de ECDC-data. Het ECDC publiceert dagelijks een update van de situatie wereldwijd en in individuele landen.

De volgende vier cijfers zijn belangrijk:

Het aantal bevestigde gevallen

Het eerste cijfer is het aantal gevallen van coronabesmettingen. Om maar met de deur in huis te vallen: niemand weet hoe hoog dit getal is. Als media het over ‘aantal coronagevallen’ hebben, dan kun je ervan uitgaan dat ze slordig zijn.

We kennen namelijk alleen het aantal bevestigde gevallen. De WHO telt de gevallen waarvan een labtest heeft uitgewezen dat iemand het coronavirus heeft. Het RIVM heeft het in zijn communicatie dan ook over het ‘aantal positief geteste mensen’.

Er is genoeg reden om aan te nemen dat het aantal bevestigde gevallen lager ligt dan het daadwerkelijke aantal gevallen. Zo hoef je in Nederland met milde klachten de huisarts niet eens te bellen. Sommige mensen die besmet zijn hebben nauwelijks klachten. Maar ook bij ernstigere klachten word je niet standaard getest, om zo genoeg middelen en aandacht te hebben voor de kwetsbaarste gevallen.

Nog een kanttekening bij deze cijfers: mensen genezen ook weer. Als je 24 uur vrij bent van symptomen, word je als ‘genezen’ beschouwd. Maar zelfs mensen die positief getest zijn – en dus worden meegenomen in de ‘aantal bevestigde gevallen’ – worden vervolgens niet meer allemaal in de gaten gehouden. Zo bestaat er in Nederland geen meldingsplicht wanneer je genezen bent. Het kan dus gebeuren – en hoe langer het duurt, hoe meer dit zal voorkomen – dat een bevestigd geval in de boeken blijft staan terwijl diegene alweer beter is.

Het sterftepercentage

Het volgende belangrijke getal is het sterftepercentage. Vaak wordt dat gemeten door de case fatality rate (CFR).

Om die verhouding uit te rekenen wil je dus zowel het getal boven als onder de streep kennen. We zagen eerder al dat de noemer – het exacte aantal gevallen – onbekend is. Dat is al een eerste probleem.

Maar ook de teller – het aantal doden – is niet bekend. Weer kennen we hier enkel het aantal bevestigde doden. Er is, wederom, goede reden om aan te nemen dat dit verschilt van het aantal coronagerelateerde sterfgevallen.

Van veel patiënten is namelijk (nog) niet duidelijk of ze zullen genezen of overlijden. Dat komt door het feit dat er een tijd zit tussen de eerste symptomen en het overlijden. In China, waar het virus al langer huishoudt, wordt geschat dat die periode tussen de twee tot acht weken kan duren.

Op basis van Chinese data wordt op dit moment een grove schatting gemaakt van 2 procent. Met andere woorden, twee van de honderd mensen die corona krijgen, zou eraan overlijden. Maar ook in China spelen de problemen die eerder genoemd zijn, bijvoorbeeld dat lang niet alle gevallen zijn gemeld. Neem dit percentage dus echt met een korrel zout, het is te vroeg om een definitief getal te geven.

Bovendien kan het sterftepercentage verschillen per moment, plek en persoon, omdat het niet alleen afhangt van het virus maar ook van de context. Welke behandeling krijgt een patiënt? En, bijvoorbeeld, hoe oud is diegene?

De besmettelijkheid

Om te weten hoe snel het virus zich kan verspreiden, is het ‘basaal reproductiegetal’ belangrijk. Dit wordt in de virologie ook wel R0 – in het Engels R nought – genoemd: het gemiddelde aantal mensen dat door één ziek persoon besmet raakt. De R0 gaat uit van een populatie waar de ziekte voor het eerst komt en waar mensen nog niet immuun zijn, bijvoorbeeld door inenting met een vaccin.

R0 is een belangrijk getal, want als R0 groter is dan 1, dan zal het virus zich waarschijnlijk blijven verspreiden. Is het kleiner dan 1, dan is het te verwachten dat de ziekte uitdooft.

Ook dat cijfer, het zal geen verrassing zijn, is in het geval van corona onduidelijk. Er zijn allerlei schattingen gedaan, met verschillende methodes, die de R0 allemaal grofweg tussen de 2 en 3 vaststellen. De WHO is nog een tikje voorzichtiger, met een R0 tussen de 1,4 en 2,5.

Het is trouwens niet zo dat een grotere R0 ook per se erger is. Zoals wetenschapsjournalist Ed Yong in The Atlantic uitlegde: ‘De griep heeft een R0 rond de 1,3, maar infecteert elk jaar miljoenen mensen. SARS had een R0 tussen de 2 en 5 en infecteerde iets meer dan 8.000 mensen.’ Bij SARS werden namelijk maatregelen genomen om de besmetting te stoppen.

Het is vooral belangrijk om te weten dat de R0 groter is dan 1, maar precies hoeveel groter is niet zo belangrijk. Want de R0 is maar een gemiddelde. Stel dat er een ‘superverspreider’ is die 100 mensen besmet, tegenover 49 mensen die niemand besmetten, dan is de R0 gelijk aan 2. Dat is een heel ander scenario dan wanneer 50 mensen allemaal twee mensen besmetten.

Maar het belangrijkste is misschien wel: R0 is een hypothetisch getal. Wat uiteindelijk uitmaakt is de R, het ‘effectief reproductiegetal’. Dit is de daadwerkelijke besmetting. Door maatregelen te nemen – quarantaine, social distancing, handen wassen, elleboogniezen – kan dat getal omlaag worden gebracht. Idealiter komt R dan onder de 1.

De groei

Bij het coronavirus is het niet alleen van belang om te weten hoeveel gevallen er zijn, maar ook hoe snel dat getal groeit. Als het aantal dagelijks met meer dan 1 wordt vermenigvuldigd, dan spreken we van exponentiële groei. In een grafiek is het dus geen rechte lijn, maar een lijn die steeds steiler gaat lopen.

Alleen is dat niet altijd even goed te zien in de grafieken die je op dit moment langs ziet komen, omdat de y-as soms is aangepast. Ze volgen een logaritmische schaal, wat betekent dat de verticale as niet de normale opbouw volgt – 10, 20, 30, 40 – maar stappen maakt die telkens groter worden omdat ze vermenigvuldigd worden met een bepaalde factor.

Bijvoorbeeld, elke stap wordt vermenigvuldigd met tien: 10, 100, 1.000, 10.000. Zie je een gekke as, dan is goed om te onthouden: iets wat exponentieel groeit, ziet er in zo’n grafiek uit als een rechte lijn.

Een andere manier om naar exponentiële groei te kijken is de verdubbelingstijd – de periode dat het duurt voordat het aantal bevestigde gevallen verdubbeld is. Stel, er zijn vandaag honderd bevestigde gevallen en we weten dat elke twee dagen het aantal verdubbelt. Overmorgen hebben we dan te maken met tweehonderd gevallen. Weer twee dagen later met vierhonderd. Na tien dagen zitten we al op 3.200 gevallen. Dit is geheel hypothetisch, maar laat wel zien: een klein getal kan snel groot worden als het hard genoeg groeit.

Het is belangrijk om de groei per land te bekijken. Sommige landen hebben al langer met het coronavirus te maken – zoals China – en de groei hangt ook sterk af van de maatregelen die een land neemt. Op Our World in Data worden de verdubbelingstijden per land getoond. Bekijk hier de verdubbelingstijden per land.

Die variëren inderdaad sterk. Op moment van schrijven (16 maart) verdubbelen sommige landen dagelijks, terwijl een land als China nog maar elke 34 dagen verdubbelt. (NB: ook deze cijfers zijn weer gebaseerd op bevestigde getallen en dus onzeker.)

Het geval van China laat zien dat exponentiële groei niet eindeloos doorgaat. Op een gegeven moment vlakt de groei af. Dat gebeurt theoretisch sowieso, omdat naarmate meer mensen besmet raken, er minder mensen ‘over’ zijn om te besmetten. Maar zover hoeft het natuurlijk niet te komen als er maatregelen worden genomen.

Je moet dan eigenlijk ook niet spreken van exponentiële groei, maar van ‘logistische groei’. Een lijn die eerst een tijd exponentieel groeit, maar uiteindelijk afvlakt. Dit filmpje van 3Blue1Brown legt het in meer detail, en met hier en daar een formuletje, uit.

YouTube YouTubekanaal 3Blue1Brown over exponentiële en logistische groei

Wat nu?

De data mogen dan onzeker zijn, over één ding zijn de meeste experts het nu wel eens: om de uitbraak van dit virus te beheersen, moeten landen verregaande maatregelen nemen. Niet voor niets zijn intussen in Nederland scholen gesloten, werken zo veel mogelijk mensen thuis, wordt aangeraden anderhalve meter afstand te houden en zijn er nog meer maatregelen. Lees hier de maatregelen die Nederland heeft genomen tegen de verspreiding van het coronavirus.

De reden voor zulke maatregelen wordt treffend samengevat in een grafiek die intussen viral is gegaan met de hashtag #FlattenTheCurve. Hierop zie je twee curves van het aantal coronagevallen: een zonder extra maatregelen, een met maatregelen. De eerste curve heeft een flinke piek, de ander is vlakker.

De boodschap: als we maatregelen nemen, kunnen we de groei van het aantal coronagevallen temperen. Dit betekent dus niet per se dat er uiteindelijk minder gevallen zullen zijn, wel dat er minder gevallen tegelijkertijd zijn. Dat is essentieel, om ervoor te zorgen dat het zorgsysteem niet wordt overbelast.

Al hoop je natuurlijk ook dat het uiteindelijke aantal gevallen kan worden teruggedrongen - met andere woorden, dat het oppervlak onder de tweede curve kleiner is dan dat van de eerste (zoals hierboven het geval is).

Zoals je ziet staan er geen getallen bij de assen in deze grafiek. Dat kan ook niet, want het is een fictieve situatie. Maar het punt is concreet: laten we proberen het virus zo min mogelijk te verspreiden. The Washington Post laat in een prachtige simulatie zien waarom social distancing de verspreiding van de ziekte kan voorkomen. Bekijk hier de simulatie van The Washington Post.

Nog een paar laatste tips

Het zijn rare tijden, en dan is het prettig om je vast te kunnen houden aan duidelijke cijfers. Maar helaas zijn de cijfers rond het coronavirus nu eenmaal onzeker. Ook het wetenschappelijk onderzoek ernaar is constant in ontwikkeling. Accepteer dus dat er veel is dat we nog niet weten.

Op Twitter en andere plekken circuleren allerlei cijfers en grafiekjes over corona. Hoe goedbedoeld ze ook mogen zijn, soms komen ze van mensen die misschien goed zijn met software maar niet de inhoudelijke kennis hebben om goede voorspellingen te doen. Vertrouw dus niet blind op dat soort berichten en kijk vooral naar het oordeel van organisaties als het WHO en RIVM, en experts als epidemiologen en virologen. Lees deze verhelderende blogpost van statisticus Casper Albers met die boodschap.

Tot slot: het is natuurlijk belangrijk om de ontwikkelingen te volgen, maar het is echt niet nodig om de hele dag je NOS-feed te verversen. Dus Skype met je oma, maak een schoolrooster met je kinderen, leer programmeren – wat dan ook, als het maar even niet met corona te maken heeft.

O ja, en was je handen.

Ik heb dankbaar gebruik gemaakt van Our World in Data.

Deciphering the pandemic: Here’s what you need to know to understand the coronavirus numbers Read this article in English

Op de hoogte blijven van mijn artikelen? Als correspondent Ontcijferen onderzoek ik de getallenwereld. In mijn wekelijkse mail houd ik je op de hoogte van wat ik schrijf, hoor en lees. Een vast onderdeel: #NerdAlert, voor de getallenliefhebbers. Schrijf je in voor mijn nieuwsbrief

Verder lezen?

Tijden van crisis maken duidelijk waarom we betrouwbare instituties nodig hebben De overheid werd de afgelopen decennia geleid als een bedrijf, met managers. Maar bestuur in tijden van corona heeft iets anders nodig: kennis en stevige instituties. Wat bij justitie fout gaat, kan ook de gezondheidszorg ondermijnen. Politiek dagboek dat pleit voor herbezinning op het staatsbestel. Lees Marcs stuk hier terug