Rozptyl, směrodatná odchylka a variační koeficient

VYDÁNÍ: 01/2017
sdílejte na Facebooku sdílejte na Twitteru pošlete e-mailem sdílejte

O tom, že průměrná mzda neznamená, že polovina lidí bere podprůměrnou mzdu a polovina nadprůměrnou, jsme hovořili již dříve.

O tom, že průměrná mzda neznamená, že polovina lidí bere podprůměrnou mzdu a polovina nadprůměrnou, jsme hovořili již dříve. Vysvětlili jsme si, že vedle průměru existují další ukazatele, které nabízejí jiné, doplňující informace, například medián. V dnešním článku se zaměříme na rozptyl, směrodatnou odchylku a variační koeficient.
Patrně nejčastějším vtipem znevažujícím průměr je: „Já sním celé kuře, ty žádné a v průměru jsme oba najedení.“ Terčem posměchu je tu jedna z hlavních slabin průměru, a to ztráta detailních informací o odlišnosti jednotek uvnitř zkoumané skupiny. To, že v průměru snědli dva lidé každý polovinu kuřete, nám neříká vůbec nic o tom, že jeden má stále hlad a druhý je přecpaný. Díky průměru máme pouze představu o průměrné úrovni, nikoliv však o variabilitě uvnitř souboru. Pokud by si v jiné dvojici jeden vybojoval alespoň čtvrtku kuřete a druhý snědl zbytek, průměr na jeden žaludek bude také půl kuřete, ale pocit hladu a nasycení už nebude tak nevyrovnaný. Ze samotného průměru, který je v obou případech stejný, však tento rozdíl nepoznáme. A právě z těchto důvodů statistika nabízí různé ukazatele variability.
Rozptyl je ve své podstatě průměrnou čtvercovou odchylkou od průměru. Zachycuje, jak moc jsou jednotky v souboru vzdálené (odchýlené) od průměru, a z praktických důvodů je hodnota těchto odchylek umocněna (abychom se zbavili záporných hodnot). V našem původním příkladu jeden člověk snědl celé kuře, druhý nic a v průměru každý půl. Jednotlivé odchylky od průměru jsou tedy –0,5 kuřete (žádné kuře minus půl kuřete) a +0,5 (jedno kuře minus půl kuřete). Rozptyl je pak vypočten jako průměr (druhých mocnin) těchto odchylek, tj. [(–0,5)² + (+0,5)²]/2 = 0,25. U druhé dvojice, v níž jeden strávník snědl alespoň čtvrtku kuřete, je rozptyl [(0,25 – 0,5)² + (0,75 – 0,5)²]/2 = 0,0625. Interpretace hodnoty rozptylu je nicméně trochu problematická a rozptyl těžko představitelný. V podstatě jej můžeme chápat spíše jako první krok na cestě k dalším ukazatelům variability.
Směrodatná odchylka je, jednoduše řečeno, průměrnou odchylkou od průměru. Jinými slovy, je druhou odmocninou z rozptylu. Díky této jednoduché operaci dostaneme ukazatel, který má na rozdíl od rozptylu již stejné jednotky jako původní hodnoty (zbavili jsme se čtvercové odchylky). V našem prvním příkladu hladovce a lakomce je směrodatná odchylka rovna √0,25 = 0,5. To znamená, že v průměru jsou oba strávníci odchýlení od průměru (tj. od půlky kuřete) o půlku kuřete. U druhého příkladu, kde se o kuře podělili lépe, je směrodatná odchylka √0,0625 = 0,25,
tedy v průměru jsou oba strávníci vzdáleni od průměru o čtvrtku kuřete. Variabilita je tedy v tomto případě menší než u první dvojice (0,5 vs. 0,25).
Posledním ze základních ukazatelů variability je variační koeficient, který vypovídá o relativním významu průměrné odchylky od průměru, tj. kolik procent průměru představuje směrodatná odchylka. Tento ukazatel je nejvhodnější pro porovnání variability ukazatelů a souborů jednotek různých úrovní, neboť jde o bezrozměrnou veličinu obvykle vyjádřenou v procentech. V našich jednoduchých příkladech to není až tak nutné, protože obě dvojice mají stejnou úroveň (jedno snědené kuře, v průměru půlka na osobu) a k porovnání variability tak stačí směrodatná odchylka. Kdyby však jedna dvojice snědla tři kuřata a druhá jen jedno, už by byl pro porovnání variability vhodnější variační koeficient. Pro úplnost si jej vypočtěme i v našich případech. U první dvojice je variační koeficient 100 % (0,5/0,5), zatímco u druhé dvojice představuje průměrná odchylka pouze 50 % průměru (0,25/0,5). I podle tohoto ukazatele tak je variabilita (tj. nerovnoměrnost porcí) u první dvojice vyšší než u druhé.
Směrodatnou odchylku ani ostatní ukazatele variability sice v oficiálních statistických výstupech často nenajdeme, nicméně je dobré o nich vědět. Když už pro nic jiného, tak proto, aby nám připomínaly, že samotný průměr není všeříkající a že i za stejným průměrem se mohou skrývat úplně jinak plné žaludky.

Autor: , vedoucí oddělení čtvrtletních odhadů
Zatím zde není žádný komentář.

Související články

 

Očištění od kalendářních vlivů

ilustrační foto

Mnoho ukazatelů ekonomické statistiky bývá očištěno od kalendářních vlivů a sezónnosti, případně od nestejného počtu pracovních dnů a sezónnosti.

Nespojujme nespojitelné

Ilustrační foto

Liniové grafy (jinak také spojnicové nebo čárové) jsou jedním z nejlepších způsobů, jak zobrazit trend vývoje časové řady zkoumaného ukazatele. Jejich využití je širší, nejen v časových řadách, ale v běžné hospodářské či sociální statistice se setkáváme s chybami hlavně u nich.

Trable s „koláči“

ilustrativní fotka

Koláčové grafy jsou jedním z nejlepších způsobů, jak znázornit strukturu celku. „Koláče“ se používají jako dobrá pomůcka k vysvětlení polovin, třetin, čtvrtin…, podílů…, procent. Intuitivně každý chápe, že jeden celý koláč je jeden celek. Že představuje 100 % a lze ho rozdělit na různě velké dílky, z nichž lze sestavit zase jen jeden koláč (pokud někdo kousek nesní). Občas se však stává, že se při prezentaci údajů používají koláčové grafy nevhodně, nebo dokonce nesprávně. Uveďme tři příklady.

Měřítko u sloupcových grafů

Ilustrační foto

Dobrý obrázek dokáže často vyjádřit více než obsáhlý popis. To platí jak o fotografii, tak o grafu. Vnímáme je totiž intuitivně a všímáme si jich dřív, než začneme (pokud vůbec) číst text.

Zdánlivé slovíčkaření: odhady, predikce a měření

ilustrativní fotka

K mylné interpretaci statistických ukazatelů nebo nepochopení jejich významu dochází mnohdy pouze vinou nevyjasněné terminologie. Znáte to, jeden mluví o voze a druhý o koze… A přitom by úplně stačilo nejprve si vyjasnit pojmy. Vezměme například „odhad“, „predikci“ a „měření“. Někdy se zaměňuje „odhad“ a „měření“, jindy zase „odhad“ a „predikce“. Není se co divit, že pak dochází ke zmatkům.

Nezaměstnanost, 1 jev – 2 ukazatele

Ilustrační foto

Pokud chceme v České republice zkoumat nezaměstnanost, nabízí se nám dva základní ukazatele. Jsou jimi míra nezaměstnanosti a podíl nezaměstnaných osob. Oba ukazatele sledují tentýž jev, nezaměstnanost, a přesto je každý z nich jiný a poskytuje jiné výsledky. Jaké jsou mezi nimi rozdíly?

Adekvační problém v ekonomické či sociální statistice

Ilustrační foto

Adekvační problém je pojmem, který málokdo z nás slyšel, a přesto jsme okolo něj už kroužili v mnoha našich článcích. Oč se tedy jedná?

Meziroční, mezičtvrtletní a bazický index

Ilustrační foto

Indexy jsou základ, to vám potvrdí každý správný statistik. Jsou klíčovým nástrojem pro jakékoliv porovnávání v čase či prostoru. Zaměřme se na tři indexy, které uživatel často potkává: meziroční, mezičtvrtletní a bazický.

Stejné ceny, stejné váhy

Ilustrační foto

Dosud jsme se věnovali tématům reálného růstu, řetězení, konceptu srovnatelných cen a jejich neaditivnosti.

Neaditivnost zřetězených cen

Při vysvětlování termínu neaditivnost časových řad se vraťme k příkladům z posledních dvou článků.

Řetězení a srovnatelné ceny (referenčního roku)

Ilustrační foto

V minulém vydání časopisu Statistika&My jsme se věnovali rozdílu mezi reálným a nominálním vývojem. Spolu s ním souvisí i pojmy řetězení a srovnatelné ceny referenčního roku.

Statistika není evidence

ilustrativní obrázek

Co je to statistika? Když potlačíme hluboce zakořeněné nutkání začít zpívat nesmrtelné písně z pohádky Princové jsou na draka, je asi pro většinu lidí „statistika“ pouze synonymem pro jakékoliv „číslo“. To by však bylo až příliš jednoduché.

Jak se měří zahraniční obchod

Ilustrační foto

Česká republika je závislá na zahraničním obchodě se zbožím. Jak se zahraniční obchod měří nebo, chcete-li, odhaduje?

Posuzujme statistické ukazatele kriticky

ilustrativní foto

Někdy mají i ty nejjednodušší statistické ukazatele svůj pravý význam trochu skrytý. A ten nakonec může vést ke zcela jiným závěrům, než by na první pohled data naznačovala. ČSÚ uvádí pár typických příkladů, kdy je třeba zpozornět a věnovat číslům i druhou myšlenku.

Rozdíl mezi HPH a HDP

Ilustrační foto

Hrubý domácí produkt (HDP) je jedním z nejsledovanějších makroekonomických ukazatelů. Vedle něj je často zmiňována hrubá přidaná hodnota (HPH). Jaký je mezi nimi rozdíl a co mají společného?

Jak se měří materiální deprivace

ilustrativní fotka

Životní úroveň domácností se hodnotí mimo jiné i jejími materiálními podmínkami. Evropská unie k tomu používá indikátor míry materiální deprivace, který vychází z výběrového šetření Životní podmínky (EU-SILC). V současné době jej reviduje.