Proč sezónně očišťovat?

Počasí nebo odlišný počet dnů pro dané období mohou ovlivňovat statistické výsledky i v takových oblastech, kde bychom to nikdy nečekali. Velkou roli při hodnocení vývoje proto hraje očištění časových řad o tyto faktory.

Čísla o průmyslové produkci v říjnu 2012 mohla uspokojit optimisty i pesimisty. Ti první se mohli nadchnout růstem o 4,1 % oproti říjnu 2011. Ti druzí však mohli zlomyslně podotknout, že šlo jen o důsledek vyššího počtu pracovních dní, bez nich by totiž průmyslová produkce poklesla o 3,3 %. A co na to rea­listé? Těm prostě jedno číslo či údaj nestačí, kombinují více pohledů.

Srovnávání se stejnou sezónou

Pokud jsou po sobě jdoucí údaje ovlivněné sezónností, nelze je smysluplně porovnávat. Hlavní příčinou sezónnosti je totiž střídání ročních období. Proto tak často vidíme srovnání se stejným obdobím předchozího roku, tedy se stejnou sezónou.
Druhou, složitější cestou, jsou statistické metody sezónního očišťování. Umožňují odstranit sezónní, ale i další různé rušivé vlivy, a zobrazit trend, který se v časové řadě ukrývá. Jeho hlavním cílem je umožnit nezkreslené porovnání dvou za sebou jdoucích období a v aktuálních údajích nalézt trend. Dalším cílem sezónního očišťování je také poskytnout srovnatelné údaje, pokud chceme porovnávat dvě časové řady s rozdílným vývojem sezónnosti během roku.
Statistici dokážou v časové řadě nalézt a odstranit další rušivý zdroj – kolísání počtu pracovních dní v období a pohyblivé svátky, jakými jsou u nás Velikonoce nebo v jiných zemích ramadán. Ty situaci komplikují, protože každý rok mohou připadnout do jiného měsíce nebo čtvrtletí.

výstupy ČSÚ V Publikacích

Trendcyklus – součet trendu a cyklické složky. Publikuje se společně, protože cyklická složka se statistickými metodami těžko odhaduje. Bývá to obvykle téměř hladká čára, používá se především pro grafickou prezentaci základních trendů vývoje časové řady. Někdy zde dochází k trvalým posunům úrovně, což jsou trvalé efekty outliers.
Sezónně očištěná řada – řada očištěná od sezónní složky včetně kalendářních vlivů, zahrnuje i nepravidelnou složku. Jedná se tedy o součet trendcyklu a iregulární složky (náhodné složky včetně jednorázových a přechodných efektů outliers. Proto není sezónně očištěná řada hladká. Je vhodná především pro porovnávání po sobě jdoucích období. Umožňuje srovnávat údaje za různá odvětví nebo země s rozdílným průběhem sezónnosti (např. zemědělskou produkci ve Francii a Austrálii).
Řada očištěná o vliv kalendářních efektů (vliv počtu pracovních dní) – řada očištěná pouze o vliv počtu pracovních dní včetně pohyblivých svátků a přestupného roku. Slouží především ke zhodnocení meziročního vývoje sledovaných statistických ukazatelů.

Dekompozice časové řady

Abychom mohli analyzovat tzv. krátkodobé (čtvrtletní/měsíční/týdenní/denní) časové řady, byla vymyšlena řada důmyslných statistických metod, které umožňují na základě definic zejména ze statistické teorie rozklad (dekompozici) časových řad na následující složky:
1) Trend – odráží dlouhodobou tendenci k růstu či poklesu.
2) Cyklická složka – fluktuace kolem trendu, střídají se fáze růstu a poklesu, perioda cyklu je delší než jeden rok a bývá různě dlouhá.
3) Sezónní složka – každoroční pravidelné pohyby způsobené střídáním ročních dob a institucionálními vlivy (např. školní rok, rozpočtový rok atd.).
Při výpočtu sezónně očištěné řady se také odstraňují kalendářní vlivy, které zahrnují rozdílné počty pracovních dní v jednotlivých měsících a čtvrtletích včetně vlivu přestupného roku a také dopady pohyblivých svátků. Státní svátky, dané pro pevně stanovený den jako je 28. říjen, mají vliv na počet pracovních dní v měsíci, protože pokud připadnou na všední den, počítají se jako neděle.
Při sezónním očišťování měsíčních či čtvrtletních statistických ukazatelů zejména v odvětví obchodu je také možné zohledňovat rozdílné počty jednotlivých dní v období, protože někdy prosté rozlišování na pracovní a víkendové dny nestačí. Například pátky a soboty jsou významnými nákupními dny.
4) Nepravidelná (iregulární) složka – náhodné pohyby v časové řadě, které nemají systematický charakter. Zahrnují také jednorázové a přechodné efekty odlehlých pozorování (tzv. outliers).

Očišťování časových řad

Pro naprostou většinu ekonomických ukazatelů je nezbytné provádět očišťování časových řad. Např. tržby a další sledované ukazatele v maloobchodě mají značnou závislost na ročním období. Nejnižší jsou pravidelně v prvním čtvrtletí. Druhý kvartál bývá mírně vyšší než třetí, letní. Nejvíce lidé utrácejí ve čtvrtém čtvrtletí. Rozdíl v tržbách prvních a posledních tří měsíců roku tak bývá zhruba čtvrtinový.
Podobné vlivy nalezneme i v tržních službách – překvapivě v oblasti nemovitostí (nejde jen o běžné nájmy placené každý měsíc, ale také pololetní nebo roční platby za nebytové prostory nebo o služby realitních kanceláří).
Ve 4. čtvrtletí jsou vyšší tržby, i když ne tak výrazně, v kultuře, zábavě a rekreaci. Do nákupů jiných služeb, např. informačních technologií, se často promítá model chování firem, které v průběhu roku více šetří a na konci naopak utrácejí zbytky svých rozpočtů.
Ceny za rekreaci, kulturu a náklady na bydlení, které jsou ovlivněné spotřebou energií, jsou také ovlivněny sezónností. Každoroční kolísání cen postihuje zejména zemědělské výrobky, především brambory a zeleninu.
Typickými příklady odvětví, které ovlivňuje sezónnost, jsou stavebnictví a energetika. V obou případech je důvodem vazba na počasí. Sezónní vlivy ovšem působí také opačným směrem. Zatímco index stavební produkce dosahuje nejnižších hodnot pravidelně v lednu, v případě indexu produkce výroby a rozvodu elektrické energie, plynu, tepla a klimatizovaného vzduchu jsou zimní měsíce naopak nejsilnějším obdobím v roce. V obou případech ale může být vliv počasí zrádný, protože dekompozice časové řady předpokládá periodické opakování se stále stejnou intenzitou. Nadprůměrně studená nebo naopak teplá zima má pak charakter náhodného vlivu a metoda sezónního očištění ji eliminovat nedokáže. Při hledání trendu je pak dobré brát v potaz i odchylky od dlouhodobého teplotního normálu.
I v odvětvích zpracovatelského průmyslu lze nalézt řadu příkladů sezónního chování. Letní měsíce jsou často obdobím celozávodních dovolených, které díky řetězci subdodavatelských vztahů dokážou zasáhnout i několik odvětví. Tento vliv, který prohlubují moderní přístupy typu just-in-time, je pozorovatelný například v automobilovém průmyslu.
V nápojovém průmyslu je však produkce v letních měsících vůbec nejsilnější, i když nedlouho poté nastupuje zvýšená výroba na předvánoční trh.

Dekompozice indexu průmyslové produkce D Výroba a rozvod  elektřiny, plynu, tepla  a klimatizovaného vzduchu

Dekompozice indexu průmyslové produkce D Výroba a rozvod  elektřiny, plynu, tepla  a klimatizovaného vzduchu

Informační hodnota „divných čísel“

Metody očišťování jsou velmi složité, i když si je můžeme velmi zjednodušeně představit jako opakované vyhlazování časové řady pomocí různých typů klouzavých průměrů a měsíčních či čtvrtletních průměrů.
Experti ČSÚ používají dvě standardní metody očišťování: TRAMO/SEATS a X-12-ARIMA. Moderní software dokáže dostatečně dlouhou řadu čísel přesně rozložit na několik složek. Nejenže odstraní vliv sezóny a nestejný počet pracovních dní a ostatních kalendářních efektů, vyhladí základní trendy a zobrazí např. ekonomický cyklus, ale také zkoumá, zda model podchycuje všechny relevantní jevy. Pokud od původní řady postupně odstraníme sezónnost, kalendářní efekty, trend, cyklickou složku, případně jiné systematické složky, zbudou tzv. rezidua. Model, jehož rezidua obsahují nějakou pravidelnost, je špatný, nepodchytil totiž nějaký významný efekt.
Přestože dopady sezónnosti bývají každý rok podobné, občas se vyskytne v řadě číslo, které tam jakoby nepatří. Nebo se řada posune na jinou úroveň. Statistici takovým jevům říkají odlehlé pozorování – outlier; nelze ho prostě ignorovat, neboť má svoji informační hodnotu. Vyvolávají ho většinou změny podmínek nebo neočekávané události, které stojí za vysvětlení. Pokud číslo propojíme s vysvětlením, dozvíme se o našem světě informaci, kterou bychom jinak zjistit nedokázali.
Divné číslo může vzniknout jako důsledek změny legislativy nebo metodiky zjišťování a má vliv na výsledek. Jeho dopad na časovou řadu může: 1) být zcela jednorázový, 2) doznívat po kratší dobu, 3) způsobit posunutí celé řady na jinou úroveň.
Posunutí na jinou úroveň se přiřazuje a projevuje v trendu. Vlivy jednorázové nebo postupně odeznívající po kratší dobu se přiřazují do náhodné složky. Takže jsou přítomné v sezónně očištěné řadě a v řadě očištěné o vliv kalendářních efektů, zatímco z trendcyklu jsou zcela eliminovány. To vysvětluje, proč sezónně očištěné řady nemusí být – v rozporu s obvyklou představou uživatelů – zcela hladké a mohou obsahovat i veliké zlomy.