Fauly s grafy: Jak maximum svislé osy grafu zkresluje vývoj šíření koronaviru

V posledních několika týdnech jsme neustále zásobováni velkým množstvím grafů, které nám v různých podobách nabízejí data o aktuální koronavirové nákaze. Především se jedná o počty testovaných, nakažených a bohužel také zemřelých. Avšak při „čtení” těchto grafů je třeba být na pozoru – i grafy mají svou psychologii a lze je využít nebo zneužít pro účelovou prezentaci dat.

Na následujícím grafu vidíte reálná data z ČR o kumulovaném počtu testovaných (zelená křivka), pozitivně testovaných (modrá křivka) a zemřelých (žlutá křivka) za jednotlivé dny (1–31) března 2020. Na první pohled to vypadá, že zatímco počet testovaných strmě roste, počet pozitivních roste pouze mírně a počet zemřelých je zanedbatelný. 

Trik je však v tom, že tento graf neukazuje, jakým tempem rostou všechny sledované ukazatele, ale to, jak roste počet pozitivních a zemřelých vzhledem k růstu počtu testovaných.

To je patrné, pokud zelenou křivku znázorňující počet testovaných z grafu odstraníme. Modrá křivka znázorňující počet pozitivně testovaných najednou strmě roste (o poznání více, než na předchozím grafu). Počet zemřelých (šedivá křivka) stále vypadá zanedbatelně. Jak už ale asi tušíte, vypadá zanedbatelně pouze vzhledem k růstu počtu pozitivně testovaných.

Na posledním grafu je pouze křivka zemřelých. Opět je vidět, že i přesto, že se tato křivka na předchozích grafech téměř „neodlepila” od nuly, na tomto grafu strmě stoupá.

Celý tento efekt je způsoben maximem svislé osy. V případě prvního grafu je maximum svislé osy 60 000, v případě druhého je maximum 3 500 a v případě třetího 25. Je zřejmé, že pokud jsou počty zemřelých v řádu desítek, pak jejich křivka bude „zplošťována” proměnnými, které jsou v řádu tisíců (pozitivně testovaní). Stejně tak proměnné v řádu tisíců budou zplošťovány proměnnými v řádu desetitisíců (testovaní). Nyní už si určitě dokážete typnout, jak by asi vypadal graf, který bude mít výrazně vyšší maximum svislé osy, než sledované proměnné.

Pokud se tedy například první graf dostane k rukám někoho, kdo není ve čtení grafu tak zkušený, může mít pocit, že zatímco počet testovaných se prudce zvyšuje, počet pozitivně testovaných roste velice mírně. Jak jsme si však ukázali, toto porovnání je zkresleno maximem svislé osy. 

Novináři a ostatní zdroje využívající tyto grafy by se proto měli snažit na tento efekt čtenáře upozornit nebo používat separátní grafy pro každou sledovanou křivku. Grafická interpretace dat, stejně jako samotný text článků a reportáží, by měla usilovat o co nejvyšší míru objektivity, přehlednosti a nezkreslenosti. Ukázku správně zpracovaných grafů můžete nalézt např. zde.

Zkreslení způsobené rozsahem svislé osy je pouze jedním z faulů, kterým by se měl každý při užívání grafů vyvarovat. Proto pro vás chystáme i další články, ve kterých vás upozorníme na další fauly a ukážeme co způsobují a jak jim předcházet.