Kapitola 01 O statistice bez čísel

K čemu máme statistiku? Statistika není evidence

Co je statistika? Když potlačíme nutkání začít zpívat nesmrtelné písně z pohádky „Princové jsou na draka“, je nejspíš pro většinu z nás statistika synonymem pro jakékoliv „číslo“. To by však bylo až příliš jednoduché.

O tom, co je statistika, bylo napsáno mnoho chytrých knih. Může se pod ní skrývat věda, činnost i samotné údaje. Nechme však teorii teorií. To, co bychom si měli zapamatovat, je, že se statistika zabývá hromadnými jevy. O co se jedná? Hromadný jev je něco, co se vyskytuje v mnoha různých případech a/nebo se to může opakovat, takže zkoumáním hromadného jevu bychom měli s určitou mírou jistoty dospět k poznání skutečnosti, pravidel, vztahů, souvislostí. Například když se jeden Honza ojediněle utká s drakem a vyhraje, ještě nemůžeme hovořit o statistice. Pokud se ale v lidské historii utká mnoho Honzů s mnoha draky (nebo jeden Honza s mnoha draky anebo jeden Honza s jedním drakem mnohokrát), už bychom mohli o statistice uvažovat. Pak můžeme skutečně dospět k závěru, že když se objeví Honza, nestvůra už neposnídá…

Po suchých číslech ani pes neštěkne…

Vedle toho je neméně důležité si uvědomit, že statistika není evidence. Statistické ukazatele bývají automaticky vnímány jako výsledek (nejlépe úplné) evidence, a naopak jakákoliv evidence (například vyplněný formulář) bývá považována za statistiku. Popravdě je těžké se ubránit takovémuto dojmu, vždyť se jedná o čísla, o něco změřeného, a tedy patrně přesného! A přesto je takový pohled mylný.

Evidence může být dobrým základem pro statistické ukazatele, ale je spíše jen ideálním případem (plošným sběrem dat), který v praxi nemusí být dosažitelný a často ani nezbytný. Záleží samozřejmě na jevu, který je sledován. Pokud se bude jednat o testování nového léku, jsou přesné a kompletní údaje o všech testovaných osobách nutné (a pro vědce obvykle dostupné). Nicméně když odhadujeme například míru nezaměstnanosti, míru inflace, spotřebu potravin, hrubý domácí produkt (HDP) nebo výdaje domácností, těžko můžeme očekávat úplnou evidenci. Představte si, že by statistici každý měsíc žádali od všech podniků a podnikatelů hlášení o výsledcích jejich činnosti. Nebo že by po každé domácnosti chtěli úplný seznam útraty a přesný výčet zkonzumovaných potravin. To by bylo jistě zcela neprosaditelné (a navíc velmi drahé)!

K čemu máme statistiku

Z tohoto důvodu je většina moderních statistik (obzvláště sociálních a ekonomických) založena na modelech, které vycházejí z výběrových šetření, určitých předpokladů a v čase stálých postupů (algoritmů). Výhodou modelů je nejen menší zatížení respondentů (podniků, domácností), ale také obvykle rychlejší dostupnost výsledků. Pokud však neopustíme představu evidence jako té „jediné přesné pravdy“, může se nám zdát, že jakýkoliv odhad prostřednictvím modelu znamená nepřesnost. Ano, u modelů se musí se statistickou chybou počítat. Uvědomme si ale, proč statistiku děláme. Není to proto, abychom věděli, kolik přesně čeho je (to je evidence). Děláme to hlavně proto, abychom s určitou mírou jistoty věděli, jestli je něčeho více, či méně než jindy (před rokem/měsícem) nebo jinde (v jiné zemi / v jiném kraji). A pokud jsou odhady prováděny stále stejným způsobem, pak mohou o trendech, změnách a souvislostech hromadných jevů velmi dobře vypovídat.

… přitom statistika je jedno velké dobrodružství…

Problém chápání statistiky jako evidence však nekončí jen u představy, jak jsou statistické ukazatele odhadovány. Úzce se dotýká i interpretace a prezentace výsledků. Statistické údaje bývají občas jen tak „do větru“ zmíněny v domnění, že informačně podpoří tvrzení autora. Třeba že se v roce 2015 narodilo 53 947 děvčat nebo že míra nezaměstnanosti byla 5,0 % nebo že průměrný obyvatel spotřeboval 8,0 kg hovězího za rok. Inu dobrá. Je to číslo! Samo o sobě však velkou informační hodnotu nemá (pokud ovšem nemají posluchači/čtenáři v hlavě Statistickou ročenku z jiného roku nebo z jiného státu, aby si to mohli porovnat). Ještě jednou připomeňme, že cílem statistiky je vysledovat trend, vývoj, rozdíly, změny. A informační hodnota každého číselného údaje roste, pokud tyto souvislosti odhaluje. Alespoň tou nejjednodušší metodou – srovnáním. Bez toho nemohou čísla vyprávět svůj příběh, který je za nimi skrytý. Budou působit jen jako evidence, nic víc.

Tereza Košťáková:
O složitém jednoduše