Kapitola 02 Jak se vyhnout chybám

Posuzujme statistické ukazatele kriticky

Jakmile zapneme televizi, začteme se do novin nebo brouzdáme po internetu, ze všech stran začnou na nás vyskakovat čísla. To samo o sobě nemusí být špatné, ale záplava údajů klade vysoké nároky nejen na ty, kteří s daty přímo pracují, ale i na ty, kdo o nich jen čtou nebo o nich slyší.

Někdy totiž mají i ty nejjednodušší statistické ukazatele svůj pravý význam trochu skrytý. A ten nakonec může vést k úplně jiným závěrům, než by se na první pohled zdálo. Uveďme několik typických příkladů, kdy se vše zdá jasné, ale přesto bychom měli zpozornět a věnovat číslům i druhou myšlenku.

Začněme tvrzením, že podíl potravin (ve výdajích domácnosti) se snížil z 30 % na 10 %. Na první pohled by taková věta mohla rozpoutat úvahy o hladovění nebo alespoň o tom, že domácnost šetří a zkonzumuje méně. Ale pozor! Z vývoje samotného podílu potravin nic takového nevyplývá. Záleží přece i na vývoji ostatních položek. Celek je vždy 100 %. Jestliže podíl jedné položky roste, podíl druhé klesá. Pokud ostatní zboží tvořilo 70 %, na potraviny zbývá podíl 30 %. Jestliže bylo na potraviny vydáno 10 % výdajů, na ostatní položky připadne 90 %. Taková informace nám ale nic neříká o tom, jestli jsme toho snědli méně, nebo více.

Když něco dramaticky vzroste, nemusí to být drama…

Představme si, že naše parádivá rodina utrácí jen za potraviny a oblečení. Jeden rok utratila za potraviny 30 000 Kč a za oblečení 70 000 Kč (30 % potraviny, 70 % oblečení). Druhý rok jsme dostali v práci přidáno, a tak utrácíme více: za potraviny 40 000 Kč a za oblečení 360 000 Kč (10 % potraviny, 90 % oblečení). Takže přestože jsme za potraviny utráceli více, jejich podíl se propadl. Prostě jen výdaje za oblečení vzrostly rychleji než za potraviny. Proto jakmile slyšíme o tom, že nějaký podíl poklesl nebo vzrostl, vždy bychom se ještě měli ptát na vývoj samotné položky, než si uděláme názor a začneme hledat příčiny nebo nápravu.

Posuzujme statistické ukazatele kriticky

Jiným příkladem nebezpečí ukvapeného prvního dojmu může být tvrzení, že počet úrazů způsobených ulomením nohy od židle vzrostl z roku na rok o 300 %. Takový nárůst vede k úvaze, že kvalita židlí zásadně klesá a je třeba s tím něco dělat. Když ale zjistíme, že takový úraz byl vloni jeden a letos jsou čtyři, pak se celá situace dostává do trochu jiného světla. Proto když slyšíme o nějakém dramatickém růstu nebo poklesu, vždy bychom se měli zamyslet, jestli se náhodou nejedná o velmi řídký jev, který málokdy nastane. V takových případech je totiž lepší uvádět raději absolutní údaje, například že počet úrazů vzrostl z 1 na 4.

Jsou ale samozřejmě i případy, kdy nám celou pravdu nerozkryje ani vývoj v procentech, ani absolutní údaj. Řekněme například, že počet zkažených mandarinek vzrostl v obchodě ze 100 v listopadu na 600 v prosinci (tj. jejich počet vzrostl o 500 %). Oba údaje by mohly vést k závěru, že je třeba rychle změnit dodavatele. Nicméně bychom se ještě měli zeptat: A nezměnil se náhodou celkový počet mandarinek, které byly v jednotlivých měsících prodány? Pak by to totiž mohlo být celé jinak.

… ale některé věci se dějí.

Řekněme, že v listopadu se prodalo 1 000 man­darinek, zatímco v prosinci 10 000. Míra zkaženosti (tj. podíl zkažených mandarinek na celku) tak v listopadu činila 10 % (100 zkažených mandarinek z 1 000 všech prodaných mandarinek), zatímco v prosinci pouze 6 % (600 zkažených z 10 000 všech prodaných mandarinek). Takže obrázek je opravdu nakonec jiný! Počet zkažených mandarinek sice vzrostl, ale míra zkaženosti poklesla. Díky tomu, že jsme se neukvapili a neudělali si názor hned z prvního dojmu uvedených čísel, nakonec dodavatele asi nevyměníme a uděláme dobře.

Uvedli jsme jen podíl, růst v procentech a absolutní údaje. Nic složitého. A přesto i tyto jednoduché ukazatele mohou vést k mylným závěrům, pokud se nad nimi nezamyslíme. Ať už jsme tedy v roli čtenáře (posluchače), nebo autora tvrzení (uživatele dat), vždy musíme vypovídací schopnost ukazatelů posuzovat kriticky. Používejme čísla, ale přemýšlejme o nich. I když jsou kvalitní a správná, mohou na první pohled vést k závěrům, které správné nejsou.

Tereza Košťáková:
O složitém jednoduše