„Viděl jsem nejlepší mozky své generace počítat matematický model šíření koronaviru,“ napsal by dnes pravděpodobně básník Allen Ginsberg.

Jenže spočítat vývoj nákazy na víc než několik dní dopředu je nesmírně obtížné a ani nejlepší mozky na to nemusí stačit samy o sobě. Jak takový model vzniká, popisuje detailně web FiveThirtyEight, který proslul přesným modelováním výsledků amerických prezidentských voleb. Jeho model pracuje s třemi desítkami zdravotnických, demografických i socioekonomických ukazatelů.

„Všechny modely jsou špatně. Důležité je usilovat o to, aby byly méně nepřesné a užitečné v daném okamžiku,“ zní hlavní zpráva textu.

Otestovat si, jak který ukazatel ovlivňuje dynamiku šíření nákazy, si můžete v online simulátorech: jednodušší v češtině, komplexnější anglicky.

Oficiální model šíření nákazy, kterým se řídí česká vláda při návrhu opatření, sestavuje Ústav zdravotnických informací a statistiky (ÚZIS). Jeho výstupy každý týden prezentuje ředitel ústavu Ladislav Dušek na tiskové konferenci ministerstva zdravotnictví.

Dosud predikoval vývoj na několik týdnů dopředu, nyní se zaměřuje na dlouhodobý model. Jeho meze si ovšem – coby datový analytik – dobře uvědomuje.

„Máme sedm variant, kudy se může situace vyvíjet,“ popisuje Dušek vznikající dlouhodobý model na poslední tiskové konferenci. „To, kterou variantu dáme ven, závisí na dvou třech faktorech. Potřebujeme v rámci možností co nejpřesněji zjistit, jak velký podíl obyvatelstva se už s nemocí potkal v základních věkových kategoriích. Na základě tohoto údaje budeme schopní vybrat dvě, kterým už můžeme věřit.“

„Ty (dlouhodobé - pozn. red.) modely jsou v podstatě věštěním z křišťálové koule. Nechci se vytáčet, ale přišlo by mi až nefér to prezentovat,“ upozornil.

Dobrá zpráva je, že ústav s několika stovkami zaměstnanců, který od roku 2014 připravuje jednotný registr zdravotnických informací, má nejspíš velmi přesná vstupní data. V loňském rozhovoru pro iROZHLAS.cz mimochodem ředitel ÚZISu slíbil, že se zveřejňováním začne letos.

Špatná je, že přesnost dat ani modelu nelze ověřit. ÚZIS k nákaze zveřejňuje pouze základní data, která vyvolávají víc otázek než odpovědí. O modelu víme pouze to, co se objeví v prezentacích z tiskovek.

Na nejasnosti ohledně zveřejňovaných dat, bez kterých je nelze správně interpretovat, jsme se ÚZISu zeptali před týdnem. Zatím zůstávají bez odpovědi:

Jaké typy testů se u nás nyní používají a které z nich se do statistik dostanou?

Jaké je zpoždění od provedení testu k jeho zaznamenání na dashboardu?

Bude ve zveřejňovaných datech rozlišení na testy a testované osoby?

Jsou dostupná aktuální data o úmrtnosti na ostatní příčiny, aby bylo vidět, kolik si opatření proti nákaze vyžádá obětí z jiných příčin? ( V některých zemích se úmrtnost zvedla výrazněji , než kolik je oficiálních obětí koronaviru.)

atd.

Slovensko je transparentní, Česko tajnůstkářské

Na Slovensku to přitom jde. Inštitút zdravotnej politiky už v polovině března zveřejnil matematickou strukturu i parametry svého modelu. Upozorňuje, které ukazatele jsou nejvíc „na vodě“. Cituje studie, ze kterých vychází. Díky tomu je na Slovensku živá diskuse, zda je model poskládaný správně a vládní opatření nejsou podstřelená nebo přestřelená.

V Česku takové informace chybí a debata o modelu i následných opatřeních proto, mírně řečeno, nestojí na faktech. Vede se spíš po linii důvěry nebo nedůvěry v kompetence vlády.

Navzdory nedostupnosti přesných dat existují iniciativy, které sestavují vlastní modely šíření. Jedna z nich vznikla na platformě IDEA institutu CERGE-EI.

„Cílem iniciativy bylo a je vyhledávat akademické i občanské iniciativy, které vytváří nástroje k modelování a predikci současné epidemie COVID-19 v rámci České republiky,“ píše iniciativa na svém webu.

„Pro epidemiologické modely nutně potřebujeme data, abychom si nemuseli klíčové parametry dosazovat odhadem na základě zahraničních studií,“ upozorňuje ředitel platformy IDEA Daniel Münich.

„Je velkou slabostí státní administrativy, že systém sběru dat z terénního testování nebyl přípraven a funkční již dávno,“ pokračuje. „Stát na to měl čas přinejmenším od ledna, kdy bylo jasné, že to k nám dojde. Jsme za polovinou dubna a nikdo ani neví, jaká data o klinickém testování budou k dispozici, a kdy. Ve hře jsou stamiliardy, a dokonce možná stovky a tisíce lidských životů a vládu a zodpovědné ministry to doposud zajímalo jen okrajově. I proto stále střílíme jen naslepo na neviditelného nepřítele.“



Vyjmenovává také mezery ve zveřejněných datech. „Současná data o stavu českého testování nam neumožňují říct nic jiného, než že zatím nic nevíme. V reportovaných datech o denním měření neni nijak rozebráno, jaká byla metoda měření. Ta čísla mohou být kompletně zavádějící, zejména, pokud by se do celkové sumy zahrnovaly sérologické rychlotesty.“

„Dalším zcela zavádějícím faktorem je, že se do denního součtu testů zahrnují opakované testy na pozitivních pacientech. Do celkového počtu nemocných je pak nutno také zahrnout pacienty, jejichž onemocnění se prokázalo pouze později ve fázi rekonvalescence změřením protilátek a jimž v akutní nebo asymptomatické fázi bylo testováni RNA nedostupné nebo odmítnuto,“ pokračuje Münich.

„V datech je pak nutno mít možnost rozlišovat krajské a okresní lokace, demografické údaje o testovaných osobách, zpoždění mezi odebráním vzorku a uskutečněním testu.“

„Je zde spousta zásadních informací, které už jsme mohli dávno vědět a jako parametry do epidemiologických modelů dosadit, ale ani víc než měsíc po uvalení historicky unikátních restrikcí na život společnosti nebyl stát schopen a ochoten tato zcela zásadní data zprostředkovat,“ dodává.

Proč má stát zveřejnit data? „ Oficiální “ model nestačí

ÚZIS nechce data zveřejnit ze dvou důvodů. Jednak je to ochrana soukromí; například data o počtu pozitivně testovaných neukazuje s přesností na okresy, pouze na kraje. Rozlišení na okresy by podle ÚZISu znamenalo přílišný zásah do soukromí. Při typicky stovkách nakažených to nezní příliš uvěřitelně, navíc stejná data s rozlišením na okresy zveřejňují krajské hygienické stanice, každá ovšem v jiném formátu. V tomto ohledu tak úředníci analytikům pouze ztěžují práci. Argument ochranou soukromí je jinak samozřejmě relevantní, ale u každé datové sady musí být přiměřený.

Zadruhé, Dušek se bojí „poplašné zprávy“: pokud se data dostanou do ruky veřejnosti a hlavně novinářů, ti je nedokáží interpretovat. ÚZIS má v jeho očích monopol na interpretaci zdravotnických dat, nikdo jiný to nedokáže.

Do jisté míry má pravdu – pochopit, co se v daných datech děje, opravdu není záležitost jednoho odpoledne a zveřejnění by nutně vedlo ke spoustě nesprávných závěrů. Ale také k analýzám, které by ukázaly, jak přesný je model ÚZISu, v čem se mýlí, a která vládní opatření dávají smysl. Unáhlené závěry o šíření nákazy navíc vznikají tak jak tak – jen navíc na nejasných datech.

Poznámka „všechny modely jsou špatně“ amerických analytiků i Duškova věta o věštění z křišťálové koule ovšem upozorňují, že utajování dat nikam nevede: potřebujeme více modelů šíření koronaviru, ne méně. Nemusejí rovnou modelovat celospolečenský vývoj. Některé mohou pracovat v menším měřítku – například na úrovni obce – ale zase sledovat šíření nemoci ve větším detailu. V okamžiku, kdy se začínají projevovat jiné než lékařské dopady pandemie na společnost, roste také poptávka po modelech, které by dovedly propojit čistě zdravotnické dopady se širšími důsledky vládních opatření.

Jak upozorňují vědci napříč planetou, rozhodovat se podle jediného modelu nemusí být nejlepší nápad. Omyl v jediné proměnné – v případě epidemie hlavně počtu těch, kteří se nakazí od jednoho nemocného, tedy známého čísla R – může výsledky o řád změnit, vysvětluje Scientific American. Zejména v první fázi nákazy, kdy vědci stále tápou, je takové riziko vysoké.

„Pokud více modelů ukazuje stejný směrem, můžete spíše věřit tomu, že výsledky jsou realistické,“ zmiňuje web.

Opatrnost vůči mainstreamovým modelům zmiňují i další autoři. Matematik Wesley Pegden upozorňuje na jejich chyby a manipulace. „Zdraví společnosti spočívá na důvěře veřejnosti,“ upozorňuje.

To stejné zmiňuje Evropské středisko pro prevenci a kontrolu nemocí – tedy ústřední evropský orgán, který shromažďuje data o nemoci.

„V této fázi (v době nejpřísnějších opatření proti šíření nákazy, pozn. red.), víc než v jakékoli jiné, je nezbytně nutné často, veřejně a úplně komunikovat a vysvětlovat nejaktuálnější data, aby obyvatelstvo akceptovalo a dlouhodobě se řídilo zvolenými opatřeními pro zmírnění epidemie,“ píše ve své Strategii pro kontrolu covid-19.

A je tu i hlas českých vědců.

„V situaci, kdy je většina nástrojů, které jsou používány k predikci, postavena na exponenciálním SIR-modelu, který je ze své podstaty velice citlivý vůči svým výchozím parametrům, považujeme tento přístup (decentralizace tvorby modelů, pozn. red.) za výjimečně vhodný,“ tvrdí autoři zmiňované iniciativy při platfromě IDEA. „Pouze srovnání jednotlivých nezávisle vyvinutých modelů může sloužit jako kontrola robustnosti, pouze pohledy z různých perspektiv nám mohou zodpovědět otázku, zdali nahlížíme realitu správně.“

Model ÚZISu, pokud můžeme soudit z několika vystoupení Ladislava Duška na tiskové koferenci, působí poměrně robustně a dokáže slušně predikovat budoucí vývoj na dva až tři týdny dopředu. Obavy úřadu zveřejnit data jsou také do jisté míry pochopitelné. I to, že svou kapacitu směřuje primárně k vlastní analytice, vytvoření datové struktury chytré karantény a podobně.

Jenže zveřejňovat jen obecná data, která zalepí ústa veřejnosti – navíc polovičatě – a ta detailnější si schovávat s tím, že nikdo jiný by stejně model vytvořit neuměl, je něco jiného. Úřady by měly být rády za to, že se jim někdo chce koukat pod ruce: pokud má oficiální model trhlinu, je větší šance, že si toho někdo všimne včas. A pokud nemá, tím líp. Ostatní se mohou soustředit na efekt konkrétních opatření nebo na dopady epidemie, které zrovna nehoří. K tomu ale potřebují data.