Statistika není evidence

VYDÁNÍ:
sdílejte na Facebooku sdílejte na Twitteru pošlete e-mailem sdílejte

Co je to statistika? Když potlačíme hluboce zakořeněné nutkání začít zpívat nesmrtelné písně z pohádky Princové jsou na draka, je asi pro většinu lidí „statistika“ pouze synonymem pro jakékoliv „číslo“. To by však bylo až příliš jednoduché.

Co je to statistika? Když potlačíme hluboce zakořeněné nutkání začít zpívat nesmrtelné písně z pohádky Princové jsou na draka, je asi pro většinu lidí „statistika“ pouze synonymem pro jakékoliv „číslo“. To by však bylo až příliš jednoduché.
O tom, co je statistika, bylo napsáno mnoho chytrých knih. Může se pod ní skrývat věda, činnost i samotné údaje. Nechme však teorii teorií. To, co bychom si skutečně měli zapamatovat, je, že se statistika zabývá hromadnými jevy.
Oč se jedná? Hromadný jev je něco, co se vyskytuje v mnoha případech a/nebo se může opakovat. Zkoumáním hromadného jevu bychom měli s určitou mírou (ne)jistoty dospět k poznání skutečnosti, pravidel, vztahů, souvislostí. Například, když se jeden Honza ojediněle utká s drakem a vyhraje, nemůžeme ještě hovořit o statistice. Pokud se ale v lidské historii utká mnoho Honzů s draky (nebo jeden Honza s mnoha draky nebo jeden Honza s jedním drakem mnohokrát), už bychom mohli o statistice uvažovat.
Stejně tak je důležité si uvědomit, že statistika není evidence. Když se nad tím zamyslíme, často vědomě i nevědomě zaměňujeme statistiku za evidenci (nejlépe úplnou). Jednak bývají statistické údaje vnímány jako výsledek evidence, a také jakákoliv evidence se považuje za statistiku (například vyplněný formulář). Popravdě je těžké se ubránit takovému dojmu, vždyť se jedná o čísla, o něco kvantifikovaného (takže změřeného) a tedy patrně přesného! A přesto je takový pohled mylný.
Je sice pravda, že evidence může být dobrým základem pro statistiku, ale je spíše jen prvním krokem (plošným sběrem dat), který však v praxi nemusí být dosažitelný a vlastně ani nezbytný. Záleží pochopitelně na jevu, který je sledován. Pokud se bude jednat o testování nového léku, jsou přesné a kompletní údaje o všech testovaných osobách nutné (a dostupné). Nicméně když odhadujeme například nezaměstnanost, míru inflace, spotřebu potravin, HDP nebo výdaje domácností, těžko můžeme spoléhat na úplnou evidenci. Představte si, že by statistici každý měsíc žádali od všech podniků a podnikatelů hlášení o výsledcích své činnosti. Nebo po každé domácnosti chtěli úplný seznam útraty a přesný výčet zkonzumovaných potravin. To by bylo jistě zcela neprosaditelné (a drahé)!
Z tohoto důvodu je většina moderních statistik (obzvláště sociálních a ekonomických) založena na modelech, které vycházejí z výběrových šetření, určitých předpokladů a v čase stálých postupů (algoritmů). Výhodou modelů je nejen menší zatížení respondentů (podniků, domácností), ale také obvykle rychlejší dostupnost výsledků. Pokud však neopustíme představu evidence jako té „jediné přesné pravdy“, může se nám zdát, že jakýkoliv odhad prostřednictvím modelu znamená nepřesnost. Uvědomme si ale, proč statistiku vůbec děláme. Není to proto, abychom věděli, kolik čeho je (to je evidence). Děláme to proto, abychom věděli, jestli je něčeho více či méně než jindy (před rokem/měsícem) nebo jinde (v jiné zemi/kraji). A pokud jsou odhady prováděny stále stejným způsobem, pak mohou o trendech, změnách a souvislostech (hromadných jevů) velmi dobře vypovídat samy.
Problém chápání statistiky jako evidence však nekončí jen u představy, jak jsou statistické ukazatele odhadovány. Úzce se dotýká i interpretace a prezentace výsledků. Statistické údaje bývají občas jen tak „do větru“ zmíněny v domnění, že informačně obohatí tvrzení autora. Třeba že v roce 2015 se narodilo 53 947 děvčat. Nebo že nezaměstnanost byla 5,0 % nebo že průměrný obyvatel spotřeboval 8,0 kg hovězího za rok. Inu dobrá. Je to číselný údaj. Ale nemá velkou informační hodnotu (pokud ovšem nemají posluchači/čtenáři v hlavě Statistickou ročenku z jiného roku nebo z jiného státu, aby si to mohli porovnat). Ještě jednou připomeňme, že cílem statistiky je vysledovat trend, vývoj, rozdíly, změny. A informační hodnota každého číselného údaje roste, pokud tyto souvislosti odhaluje. Alespoň tou nejjednodušší metodou: srovnáním. Bez toho nemohou čísla vyprávět svůj příběh, který je za nimi skrytý. Budou působit jen jako evidence, nic víc.

Autor: , vedoucí oddělení čtvrtletních odhadů
Zatím zde není žádný komentář.

Související články

 

Měřítko u sloupcových grafů

Ilustrační foto

Dobrý obrázek dokáže často vyjádřit více než obsáhlý popis. To platí jak o fotografii, tak o grafu. Vnímáme je totiž intuitivně a všímáme si jich dřív, než začneme (pokud vůbec) číst text.

Nezaměstnanost, 1 jev – 2 ukazatele

Ilustrační foto

Pokud chceme v České republice zkoumat nezaměstnanost, nabízí se nám dva základní ukazatele. Jsou jimi míra nezaměstnanosti a podíl nezaměstnaných osob. Oba ukazatele sledují tentýž jev, nezaměstnanost, a přesto je každý z nich jiný a poskytuje jiné výsledky. Jaké jsou mezi nimi rozdíly?

Adekvační problém v ekonomické či sociální statistice

Ilustrační foto

Adekvační problém je pojmem, který málokdo z nás slyšel, a přesto jsme okolo něj už kroužili v mnoha našich článcích. Oč se tedy jedná?

Meziroční, mezičtvrtletní a bazický index

Ilustrační foto

Indexy jsou základ, to vám potvrdí každý správný statistik. Jsou klíčovým nástrojem pro jakékoliv porovnávání v čase či prostoru. Zaměřme se na tři indexy, které uživatel často potkává: meziroční, mezičtvrtletní a bazický.

Rozptyl, směrodatná odchylka a variační koeficient

ilustrační foto

O tom, že průměrná mzda neznamená, že polovina lidí bere podprůměrnou mzdu a polovina nadprůměrnou, jsme hovořili již dříve.

Stejné ceny, stejné váhy

Ilustrační foto

Dosud jsme se věnovali tématům reálného růstu, řetězení, konceptu srovnatelných cen a jejich neaditivnosti.

Řetězení a srovnatelné ceny (referenčního roku)

Ilustrační foto

V minulém vydání časopisu Statistika&My jsme se věnovali rozdílu mezi reálným a nominálním vývojem. Spolu s ním souvisí i pojmy řetězení a srovnatelné ceny referenčního roku.

Stálé ceny a reálná změna

ilustrační foto

Vývoj ve stálých cenách, objemový index, vývoj očištěný o cenové změny a reálný růst/pokles. Čtyři termíny, stejný význam. Jde o snahu odfiltrovat ze změny nominální hodnoty ukazatele vliv cenového vývoje a dobrat se odpovědi na otázku, zda skutečně (reálně) bylo něčeho více nebo méně.

Jak se měří zahraniční obchod

Ilustrační foto

Česká republika je závislá na zahraničním obchodě se zbožím. Jak se zahraniční obchod měří nebo, chcete-li, odhaduje?

Posuzujme statistické ukazatele kriticky

ilustrativní foto

Někdy mají i ty nejjednodušší statistické ukazatele svůj pravý význam trochu skrytý. A ten nakonec může vést ke zcela jiným závěrům, než by na první pohled data naznačovala. ČSÚ uvádí pár typických příkladů, kdy je třeba zpozornět a věnovat číslům i druhou myšlenku.

Rozdíl mezi HPH a HDP

Ilustrační foto

Hrubý domácí produkt (HDP) je jedním z nejsledovanějších makroekonomických ukazatelů. Vedle něj je často zmiňována hrubá přidaná hodnota (HPH). Jaký je mezi nimi rozdíl a co mají společného?

Procentní bod a procento

Ilustrační foto

V analýzách a komentářích se tu a tam objevuje pojem „procentní bod“.

Jak funguje princip akrualizace

ilustrativní obrázek

V prvních dnech nového roku jsou vždy zveřejňovány informace o tom, jak si vedl státní rozpočet v uplynulém roce. Je vydána zpráva o pokladním plnění státního rozpočtu, tedy příjmy, výdaje a výsledné saldo rozpočtu za předchozí rok. Tyto velmi včasné údaje vypovídají o tom, kolik stát (státní rozpočet) vybral a zaplatil v období od 1. ledna do 31. prosince, ovšem bez ohledu na to, k jakému období se tyto platby vztahovaly.