Kapitola 02 Jak se vyhnout chybám

Nespojujme nespojitelné

Liniové grafy (jinak také spojnicové nebo čárové) jsou jedním z nejlepších způsobů zobrazení vývoje zkoumaného ukazatele v čase. Jejich využití je širší (nejen v časových řadách), ale v běžné hospodářské či sociální statistice se setkáváme s chybami hlavně u nich.

V principu by se spojnicové grafy měly používat (jak už sám jejich název napovídá) pro takové časové řady ukazatelů, kdy hodnota jednoho měření (v daném okamžiku) bezprostředně souvisí s druhou hodnotou (v následujícím okamžiku). Například průběžné měření teploty vzduchu vteřinu po vteřině nebo počet obyvatel na daném místě v každém okamžiku. Taková „bodová“ měření v určitém momentu (bodu) však nejsou v sociálních a ekonomických statistikách příliš častá, případně od jednoho měření (stavu) k druhému uplyne poměrně hodně času. Příkladem může být počet obyvatel ke konci každého měsíce nebo počet nezaměstnaných k určitému dni v měsíci. V těchto případech by sice byl nejvhodnější sloupcový graf, ale ani spojnicový není špatný.

Malé velké záludnosti.

V ekonomické statistice se obvykle setkáváme spíše s „intervalovým“ měřením/odhadem, například kolik se toho za určité období (interval) vyrobilo, spotřebovalo, zničilo. Pro tyto intervalové (tokové) ukazatele jsou opět vhodnější sloupcové grafy, ale řekněme, že lze přimhouřit oči a používat i liniové (jako v grafu 7).

Zcela jinou otázkou je ale používání spojnicových grafů k zobrazení tempa růstu/poklesu v čase (například u meziročních indexů). V takových situacích není spojnicový graf příliš vhodný, neboť časová řada temp růstu nebývá spojitá. Proč? Jednotlivá tempa růstu (po sobě jdoucích období) spolu totiž v podstatě nesouvisejí. Tato chyba je patrná z grafu 8. Sledujeme vývoj počtu hostů v ubytovacích zařízeních. Vezměme si například údaj za 2. čtvrtletí 2017: meziročně vzrostl počet hostů o 14 %. Jak toto číslo vzniklo? Přece porovnáním počtu hostů ve 2. čtvrtletí 2017 s počtem hostů ve 2. čtvrtletí 2016. Ale předchozí meziroční tempo růstu, tj. za 1. čtvrtletí 2017 (11 %), vychází z porovnání počtu hostů v 1. čtvrtletí 2017 a 1. čtvrtletí 2016. Neexistuje tedy přímá souvislost mezi údajem o meziročním růstu za 1. čtvrtletí 2017 a za 2. čtvrtletí 2017, neboť se vždy jedná o zcela jiné hosty za zcela jiná období. Proto by ani mezi hodnotami 11 % a 14 % neměla být zobrazena spojnice (čára spojující oba body). Vhodnější je používat sloupcový graf (graf 9).

Nespojujme nespojitelné

Velkou chybou je používat spojnicové grafy v případech, kdy se očividně nejedná o časovou řadu nebo když jsou ukazatele nespojité (diskrétní). Liniový graf nelze použít pro hodnoty, které nemají časovou ani věcnou souvislost. Podívejme se na graf 10. Zobrazuje hustotu obyvatelstva ve vybraných zemích. Jejich hodnoty jsou vzájemně propojeny linkou, přestože spolu nijak nesouvisejí. Těžko si představit, že by hustota obyvatelstva v Bulharsku souvisela s hustotou obyvatelstva v Česku. Liniový graf proto nelze použít! Pokud si nejste jistí, kdy liniový graf použít, existuje jednoduchá rada.

Pokud můžeme na horizontální ose x libovolně měnit pořadí, pak je spojnicový graf nevhodný. A to je přesně případ grafu 10. Státy na ose x můžeme seřadit podle abecedy nebo podle velikosti území anebo podle hustoty obyvatelstva či zcela jinak. Možností je mnoho a každá může mít své opodstatnění. S každým řazením ale vzniká jiná linie (křivka) a to by nás mělo varovat, že liniový graf je zcela nevhodný. Místo něj použijme grafy bodové (graf 11) nebo sloupcové (graf 12).

Tereza Košťáková:
O složitém jednoduše