Scanner data dávají úplnější obraz o pohybech cen

Změna ve způsobu získávání dat pro statistiku cen zavedením sběru tzv. scanner dat vyvolala řadu reakcí, popravdě převážně negativních a plných obav. Česká republika v tomto směru nevybočuje z celosvětového trendu, a to jak samotným využíváním dat z pokladních systémů pro statistiku, tak v reakcích veřejnosti na tuto změnu. Přitom efektivní sběr a úplnější obraz o cenových pohybech byl již aplikován v řadě zemí.

Myšlenka vzniku a využití čárového kódu se objevila již po druhé světové válce a byla patentována ve Spojených státech v roce 1952. Tam se také zhruba od 70. let začal nový vynález poprvé využívat pro automatizovaný sběr dat. V souvislosti s vývojem výpočetní techniky a jejím postupným komerčním využíváním v maloobchodě se tak čárový kód stal téměř neodmyslitelnou součástí drtivé většiny spotřebního zboží.
První pokusy o využití dat nahromaděných s jeho pomocí se datují do 90. let. Kontakty statistiků s maloobchodními řetězci za účelem získání dat ve velkém, aby se mohla stát potenciálním zdrojem pro výpočet inflace, byly navázány v Norsku v roce 1997 a v Nizozemsku v roce 1999. Obě země se pochopitelně zaměřily na oblast potravin, kde je na jednu stranu spotřebitelský koš poměrné stálý, a na druhou stranu zde probíhají rychlé cenové změny, které se klasickým sběrem cen nedají dostatečně spolehlivě podchytit.
Obě země postupovaly samostatně a trvalo poměrně dlouho, než myšlenka nalezla plné uplatnění v praxi. V Norsku mohlo dojít k úplnému nahrazení terénního sběru cen potravin a nealkoholických nápojů až po osmi letech, v roce 2005. Norové přitom sami přiznávali, že jednou z hlavních motivací byla náhrada tamní drahé pracovní síly…

Průkopníkem se stalo Nizozemsko

V Nizozemsku se sice výsledky začaly užívat již v roce 2002, paralelně ale nadále probíhal klasický sběr. Chyběla však jakákoliv metodická podpora, a bylo proto zapotřebí provádět analytický výzkum. Paradoxně se také ukázalo, že není zcela dobré příliš předběhnout dobu. Nedávno předtím podepsaná Maastrichtská smlouva (1992) totiž mimo jiné reagovala na tehdejší krizi Evropského měnového systému a vytyčila cestu ke vzniku eura jakožto budoucí jednotné evropské měny. To podnítilo projekt důsledné harmonizace výpočtu inflace koordinovaného v následujících letech Eurostatem tak, aby budoucí Evropská centrální banka mohla užívat jednotně počítanou statistiku k tehdy nově zaváděnému inflačnímu cílování plánované měny. V Evropské unii bylo tehdy Nizozemsko jedinou zemí, která používala scanner data. Nově vznikající metodické normy vyhovující všem ostatním státům se však často na nový zdroj dat příliš nehodily.

Následovaly ho Švýcarsko, Dánsko, Švédsko a Belgie

Další zemí, která se začala scanner daty zabývat, bylo v roce 2008 Švýcarsko. Tento stát má stejně jako Norsko velmi drahou pracovní sílu a zrovna tak není striktně omezován všemi normami EU, byť je často dodržuje. V souvislosti s rostoucí rolí maloobchodních řetězců v Evropě od počátku tisíciletí a s vývojem jejich informačních systémů se však možnosti využití dat z čárových kódů začaly přímo nabízet. V roce 2011 se jimi začali pro účely rutinního výpočtu spotřebitelské inflace zabývat statistici v Dánsku a o rok později ve Švédsku, které je však už dříve částečně užívalo k aktualizaci spotřebitelského koše. Následující rok se přidala Belgie. To už také drtivá většina ostatních evropských zemí začala zkoumat možnosti jejich využití. Například i Český statistický úřad získal údaje v roce 2013 od jednoho dnes již neexistujícího řetězce – umožnily mu tehdy zkvalitnit výběr položek potravin ve spotřebitelském koši.

Váhavý Eurostat změnil názor

Poté si význam scanner dat uvědomil Eurostat a svůj dosud váhavý přístup začal měnit. Klíčovým momentem na evropské úrovni byl časový souběh s nově revidovaným rámcovým nařízením EU o výpočtu indexu spotřebitelských cen. Většina evropských zemí pociťovala neochotu řetězců poskytovat dobrovolně data. Proto se povinnost řetězců předat scanner data statistikům dostala i do klíčového dokumentu. To by mělo výrazně usnadnit jejich získávání. V současné době se proto prakticky ve všech ostatních evropských zemích statistici zabývají možnostmi využití nového zdroje dat.
Co mají jednotlivé země společné a čím se liší? Základem je pravidelné získávání údajů o prodejích řetězců za položky na úrovni GTIN (Global Trade Item Number), v Evropě se ještě používá dřívější značení EAN (European Article Number). Samotná cena produktu nestačí, je pokud možno třeba získat i údaj o prodaném objemu a nějaký další charakterizující popis. Společným faktorem je také koncentrace na ceny potravin a nápojů, kde se tyto údaje dají využít nejefektivnějším způsobem. Rovněž je snaha pokrýt co největší časovou část daného měsíce.

Došlo i na jiné země

Snad ve všech ostatních aspektech se však praktiky zemí vzájemně liší. Je to dáno mnoha faktory. Například koncentrace prodeje potravin v Lucembursku do tří řetězců umožnila této zemi stát se od ledna 2018 další zemí, která scanner data oficiálně užívá. Naopak v jižních zemích bývá trh mnohem roztříštěnější, je třeba provést nějaký vhodný výběr. Některé větší země mají regionálně různé cenové hladiny (Itálie, Francie) a oficiální statistiky musejí i regionální aspekt respektovat (Itálie).
Ve Francii se například ukázala historická role silného státu, když byla uzákoněna nutnost všech větších prodejců poskytovat data na denní bázi. Taková zátěž je velká nejen pro respondenty, ale i pro samotného zpracovatele. Využije se prakticky jen malá část obrovského objemu informací a zpracování vyžaduje spe­ciální IT vybavení. Data by měla do oficiální francouzské inflace vstoupit od roku 2020. Opačným extrémem co do datového rozsahu je například malé Slovinsko, kde se z dat vlastně jen vybírají dříve ručně šetřené položky a elektronickými cenami se tak simuluje terénní sběr. Většinu věcí včetně vhodné adaptace softwarového nástroje pak prakticky zvládne jeden člověk.
Tím se dostáváme ke kapacitní náročnosti. Nizozemsko, které je technologicky i metodicky napřed, uvádí jen pro samotná scanner data ekvivalent deseti pracovníků ve statistice navíc. Záměrem je vyšší kvalita dat. Ta však, jak vidno, není zadarmo. Naopak v Dánsku stačí údajně jen dvě osoby. Zde ale asi nelze očekávat více než jen jednoduchý rutinní provoz na určitém neproblematickém datovém výběru.

Měsíční cenové indexy se stále řetězí

Společným faktorem jsou též podobné začátky, které simulují dosavadní metodiku, kdy je vybrána reprezentativní skupina položek a sleduje se její cenový vývoj. Tím, jak některé z nich mizejí z trhu, jsou ručně nahrazovány jinými, nově významnými položkami. S postupem času, kdy země má již několikaleté zkušenosti, se přechází na dynamický výběr. Cenový vývoj se měří vždy jen meziměsíčně, a to na všech položkách majících momentálně významné tržby. Jednotlivé meziměsíční cenové indexy se tak stále řetězí. Takový proces se dá automatizovat, využije se více dat a částečně mizí lidský dozor. Není to ale tak jednoduché. Nedávno se totiž prokázalo, že takový výpočet dlouhodobě zkresluje inflaci směrem dolů. Opravné způsoby (tzv. multilaterální metody) byly sice nalezeny, ty jsou však dost náročné nejenom na příslušné programové vybavení, ale i vůbec na pochopení, a to nejen pro běžného uživatele.
Kromě potravin a nápojů zatím nedošlo příliš k rozšíření využívání scanner dat do jiných skupin klasifikace COICOP. Obvykle se přidají položky, které se v převážně potravinových hypermarketech také prodávají – například kuchyňské potřeby, drobné domácí spotřebiče, drogerie a produkty pro osobní hygienu.
Užití scanner dat pro výpočet inflace je tedy ve vývoji jak metodickém, tak i co se týče užitých praktik. Rovněž celoevropskou jednotící metodiku bude třeba v následujících letech do jisté míry upravit. Je totiž docela možné, že nové zdroje dat sice přiblíží měření inflace více realitě, ale rovněž přinesou mnoho nových výzev pro další generaci statistiků.