Trable s „koláči“

VYDÁNÍ: 07-08/2017
sdílejte na Facebooku sdílejte na Twitteru pošlete e-mailem sdílejte

Koláčové grafy jsou jedním z nejlepších způsobů, jak znázornit strukturu celku. „Koláče“ se používají jako dobrá pomůcka k vysvětlení polovin, třetin, čtvrtin…, podílů…, procent. Intuitivně každý chápe, že jeden celý koláč je jeden celek. Že představuje 100 % a lze ho rozdělit na různě velké dílky, z nichž lze sestavit zase jen jeden koláč (pokud někdo kousek nesní). Občas se však stává, že se při prezentaci údajů používají koláčové grafy nevhodně, nebo dokonce nesprávně. Uveďme tři příklady.

Začněme tím nejjednodušším, spíše jen nevhodným (nikoliv nesprávným) použitím koláčového grafu. Všimněme si v grafu 1, co se stane, když jsou si jednotlivé výseky (podíly) opticky příliš podobné. Jen těžko mezi nimi rozeznáme rozdíl. V takovém případě použití koláčového grafu postrádá smysl a je lepší zvolit sloupcový graf.
Druhým příkladem je vyloženě chybné použití koláčového grafu. Ty se sice používají k zobrazení podílů, ale pouze takových, které jsou součástí jednoho a téhož celku. Podívejme se na graf 2. Podkladem pro něj je podíl středoškolsky vzdělaných mužů (64 % ze všech 15letých a starších mužů) a podíl středoškolsky vzdělaných žen (57 % ze všech 15letých a starších žen). Nemáme tu jeden celek, který by mohl být zobrazen jako jeden koláč. Jsou tu dva koláče. Je zde 100 % mužů, z nichž 64 % má středoškolské vzdělání, a 100 % žen, z nichž 57 % má středoškolské vzdělání. Těch 64 % mužů a 57 % žen netvoří jeden koláč, nelze je do jednoho slepit. Pro tyto podíly je vhodný sloupcový graf, nikoliv koláčový. Už na první pohled jsme si chyby mohli všimnout: 57 % plus 64 % je přece 121 % (a to je víc než na jeden koláč).

Příklady špatného použití koláčového grafu

Příklady špatného použití koláčového grafu

Posledním příkladem je ukázka optického klamu, který vzniká, pokud se u koláčových grafů použije perspektiva. Trojrozměrné grafy sice mohou působit zajímavěji, ale zobrazované údaje se jimi zkreslují. Když se podíváme na graf 3, zdá se, že nejoblíbenějším předmětem je tělocvik a nejméně oblíbená je matematika. Výsek, který představuje tělocvik, je opticky výrazně větší než výsek zachycující matematiku. A přitom tomu tak není. Každý výsek, který je v tomto grafu zobrazen, představuje 20% podíl (20 % dětí uvedlo jako nejoblíbenější matematiku, stejně jako jiných 20 % uvedlo tělocvik, češtinu, kreslení nebo prvouku). Pokud bychom v grafu zrušili prostorový pohled, bylo by to na první pohled jasné. Uživatel by si na prostorové grafy měl vždy dávat pozor, protože představují potenciální prostor pro záměrnou i nezáměrnou manipulaci s daty.

Autor: , vedoucí oddělení čtvrtletních odhadů
Zatím zde není žádný komentář.

Související články

 

Očištění od kalendářních vlivů

Očištění od kalendářních vlivů

Mnoho ukazatelů ekonomické statistiky bývá očištěno od kalendářních vlivů a sezónnosti, případně od nestejného počtu pracovních dnů a sezónnosti.

Nespojujme nespojitelné

Nespojujme nespojitelné

Liniové grafy (jinak také spojnicové nebo čárové) jsou jedním z nejlepších způsobů, jak zobrazit trend vývoje časové řady zkoumaného ukazatele. Jejich využití je širší, nejen v časových řadách, ale v běžné hospodářské či sociální statistice se setkáváme s chybami hlavně u nich.

Měřítko u sloupcových grafů

Měřítko u sloupcových grafů

Dobrý obrázek dokáže často vyjádřit více než obsáhlý popis. To platí jak o fotografii, tak o grafu. Vnímáme je totiž intuitivně a všímáme si jich dřív, než začneme (pokud vůbec) číst text.

Zdánlivé slovíčkaření: odhady, predikce a měření

Zdánlivé slovíčkaření:  odhady, predikce a měření

K mylné interpretaci statistických ukazatelů nebo nepochopení jejich významu dochází mnohdy pouze vinou nevyjasněné terminologie. Znáte to, jeden mluví o voze a druhý o koze… A přitom by úplně stačilo nejprve si vyjasnit pojmy. Vezměme například „odhad“, „predikci“ a „měření“. Někdy se zaměňuje „odhad“ a „měření“, jindy zase „odhad“ a „predikce“. Není se co divit, že pak dochází ke zmatkům.

Nezaměstnanost, 1 jev – 2 ukazatele

Nezaměstnanost, 1 jev – 2 ukazatele

Pokud chceme v České republice zkoumat nezaměstnanost, nabízí se nám dva základní ukazatele. Jsou jimi míra nezaměstnanosti a podíl nezaměstnaných osob. Oba ukazatele sledují tentýž jev, nezaměstnanost, a přesto je každý z nich jiný a poskytuje jiné výsledky. Jaké jsou mezi nimi rozdíly?

Adekvační problém v ekonomické či sociální statistice

Adekvační problém v ekonomické  či sociální statistice

Adekvační problém je pojmem, který málokdo z nás slyšel, a přesto jsme okolo něj už kroužili v mnoha našich článcích. Oč se tedy jedná?

Meziroční, mezičtvrtletní a bazický index

Meziroční, mezičtvrtletní a bazický index

Indexy jsou základ, to vám potvrdí každý správný statistik. Jsou klíčovým nástrojem pro jakékoliv porovnávání v čase či prostoru. Zaměřme se na tři indexy, které uživatel často potkává: meziroční, mezičtvrtletní a bazický.

Rozptyl, směrodatná odchylka a variační koeficient

Rozptyl, směrodatná odchylka a variační koeficient

O tom, že průměrná mzda neznamená, že polovina lidí bere podprůměrnou mzdu a polovina nadprůměrnou, jsme hovořili již dříve.

Stejné ceny, stejné váhy

Stejné ceny, stejné váhy

Dosud jsme se věnovali tématům reálného růstu, řetězení, konceptu srovnatelných cen a jejich neaditivnosti.

Neaditivnost zřetězených cen

Při vysvětlování termínu neaditivnost časových řad se vraťme k příkladům z posledních dvou článků.

Řetězení a srovnatelné ceny (referenčního roku)

Řetězení a srovnatelné ceny  (referenčního roku)

V minulém vydání časopisu Statistika&My jsme se věnovali rozdílu mezi reálným a nominálním vývojem. Spolu s ním souvisí i pojmy řetězení a srovnatelné ceny referenčního roku.