Inovace ulehčují respondentům a zpřesňují statistiku

Proč je třeba inovovat i statistiku a co se za inovacemi v Českém statistickém úřadě skrývá, vysvětluje místopředseda ČSÚ Jaroslav Sixta.

Toto vydání Statistiky & My se věnuje inovacím. Co vlastně nutí ČSÚ, aby inovoval a dělal statistiku jinak?

Doba, která se vyvíjí a nabízí nové možnosti. Jsou například dostupnější výkonné moderní technologie, které můžeme využívat při zpracování a sběru dat. Mění se také nároky uživatelů a většinou ne směrem, že by se zjednodušovaly nebo klesaly. Naopak, lidé chtějí data přesnější a rychleji než v minulosti. Ke změnám nás tlačí i respondenti, od nichž pro naše statistiky získáváme údaje. Vyplňování formulářů je zatěžuje a my jsme nuceni přemýšlet, jak namísto dotazování získávat data z administrativních zdrojů.

Zefektivňovat naši práci musíme rovněž kvůli nákladům. Dnes vytváříme několikanásobně více statistických výstupů než před dvaceti lety, a zaměstnanců máme o třetinu méně. Kdybychom pracovali pořád stejně, nedalo by se to zvládnout. A v neposlední řadě po nás mnoho nových výstupů žádá Eurostat.

V rozhovoru před dvěma lety jste si stěžoval, že evropská statistika směřuje do oblasti tzv. měkkých dat, která patří spíše do oboru sociologie. Změnila na tom něco pandemie covidu-19 a energetická krize?

Spíš k horšímu. Evropa nás tlačí do sociologických průzkumů, o jejichž výsledcích jsem přesvědčen, že budou nevalné. Jádro statistiky se nemění, pořád se budeme ptát na příjmy, náklady, výdaje, ale bohužel v některých případech se budeme muset ptát i na pocity. Budeme také klást otázky týkající se citlivých oblastí, jako třeba péče o děti nebo domácí násilí. To jsou určitě důležité věci, ale nepatří statistickému úřadu. Zjišťovat by je měly neziskové organizace a odborníci – sociologové, nikoliv naše tazatelky.

Budeme se snažit pro tyto oblasti připravit domácnostem dotazníky online, aby mohly citlivé údaje vyplnit v klidu a v soukromí bez asistence tazatelky. Neočekávám však nějakou závratnou ochotu odpovídat.

V některých zemích se již pokoušejí šetření v domácnostech provádět kompletně online formou, ale moc se to neosvědčilo. Zatímco naše response přesahuje 60 procent, elektronická šetření často nedosahují ani poloviční hodnoty a není výjimkou ani response pod 15 procent. Elektronické šetření smysl má, ale jen tam, kde to respondenti uvítají, případně když se jedná o opakované dotazování.

doc. Ing. Jaroslav Sixta, Ph.D.

V ČSÚ pracuje od roku 2002. Začínal jako referent ve statistice národních účtů a zabýval se problematikou fixních aktiv. V letech 2014 až 2018 působil jako ředitel sekce makroekonomických statistik a významně přispěl k modernizaci statistiky zahraničního obchodu a implementaci machine learningových postupů v oblasti cenových statistik. Má řadu zkušeností z působení v zahraničí v oblasti implementace statistických postupů, vyučuje na VŠE v Praze a na Unicorn University. Je autorem řady vědeckých a odborných příspěvků. Místopředsedou ČSÚ je od roku 2018.

Pokusili jste se během našeho nedávného předsednictví v Radě pro statistiku přesvědčit Eurostat, aby od záměru zjišťovat sociologická data upustil?

Pokusili jsme se několikrát a pokoušíme se neustále. Zatím ale nejsme moc úspěšní.

Jsou zaměstnanci úřadu nějak motivováni, aby přicházeli s inovacemi a návrhy na zlepšení?

Největší motivací bývá to, že se lidé podílejí na zajímavém projektu, dělají práci, která je baví, rozšiřuje jejich znalosti a zvyšuje odbornost. Takovým úkolům jsou ochotní dávat daleko víc, než by dávat museli. Snažíme se samozřejmě kvalitní zaměstnance motivovat i finančně, ale vzhledem k tomu, že jsme státní instituce s tabulkovými platy, máme omezené možnosti. Velmi se nám však osvědčilo zavedení systému home office, kdy zaměstnanci mohou pracovat dva dny v týdnu z domova. To je benefit, který zaměstnanci vítají a rádi využívají a nám se vyplácí.

Můžete popsat nějaký modelový příklad, jak se inovace v ČSÚ zavádějí?

Dobrým příkladem jsou scanner data. Uvažovat jsme o nich začali okolo roku 2015. Navázali jsme spolupráci se Svazem obchodu a cestovního ruchu a požádali jsme jeho členy o poskytnutí dat. Prvními vlaštovkami se staly společnosti Coop a Ahold. Hlavním motivem nebylo ušetřit, ale zvýšit kvalitu dat. V minulosti zjišťovaly ceny zboží v obchodech naše tazatelky, které je opisovaly z cenovek z regálů. Jenže řada produktů se prodává hlavně v akcích, a pokud akce není, lidé je skoro nekupují. Tazatelky v prodejnách zjistily pouze aktuální ceny, ale nikoliv množství zboží, které se za tyto ceny prodalo. Ze scanner dat máme naprosto přesné údaje, za jakou průměrnou cenu v daném časovém období koupili zákazníci lahev piva, kilogram pracího prášku, litr mléka a podobně. Navíc, na rozdíl od tazatelek, které zjišťovaly ceny pouze vybraných produktů, protože všechno by kapacitně nezvládly, máme nyní také podchycený kompletně celý sortiment. Naše statistiky se díky tomu značně zpřesnily.

Pro úspěšné zavedení scanner dat ovšem nestačilo získat data z pokladních systémů maloobchodních řetězců. Všechny položky musíme zatřídit do statistických klasifikací, což znamená, že název nebo kód, pod nímž eviduje zboží obchodník, musíme převést na kódy, kterým rozumí program na statistické vyhodnocení dat. A protože se jedná o desítky tisíc položek, z nichž se navíc mnoho často mění, zapojili jsme do procesu machine learning. Stroj dokáže na základě logistické regrese sám rozpoznat, o které zboží se jedná a do jaké skupiny ho má zatřídit. Postupně se přitom učí a zdokonaluje.

Scanner data jsme nejprve přebírali od obchodních řetězců s převahou potravin, pak jsme přidali lékárny a drogerie, a nyní zahajujeme přebírání dat od hobby marketů.

Kromě toho, že jsme pomocí scanner dat výrazně zkvalitnili naše statistiky, pomohlo nám to i v personální oblasti. Protože tazatelky už nemusejí chodit do obchodů, mohly posílit tazatelskou síť pro šetření v domácnostech, která už byla na hraně kapacity.

Daří se ČSÚ získávat data i z informačních systémů jiných firem než obchodních řetězců?

Daří, ale bohužel to jde pomaleji, než bych si představoval. V rámci modernizace našeho statistického informačního systému se nyní například intenzivně připravujeme na napojení mzdové statistiky ve spolupráci s Ministerstvem práce a sociálních věcí. Ministerstvo už od firem nějaká mzdová data získává, a my se k němu přidáme. Postupně pak chceme rozšířit záběr i do ostatních segmentů, a napojit se přímo na firemní účetní systémy, minimálně u velkých podniků.

Jak chcete vyřešit problém, že firmy používají mnoho různých účetních programů?

Jako dobrý příklad chytrého řešení takové komplikace může sloužit naše spolupráce s Ministerstvem financí, které sbírá účetní data od samospráv, tedy krajů a obcí. Pro jednání o tom, jaká data a v jaké podobě se budou získávat, si ministerstvo pozvalo dodavatele účetních softwarů pro samosprávy a s nimi se dohodlo na potřebných úpravách jejich produktů a na požadované formě výstupů.

Podobně bychom chtěli postupovat i v případě podnikových účetních systémů, a dohodnout se v prvé řadě s dodavateli těchto systémů. Ve výsledku se firmám ušetří spousta práce, protože už nikdo nebude muset vyplňovat statistické výkazy, ale všechna data se zkopírují k nám automaticky na stisknutí tlačítka.

O kolik se za poslední roky podařilo snížit zátěž respondentů?

Zátěž v posledních letech velmi významně klesla, odhadujeme, že o více než 30 procent. V této oblasti děláme maximum možného. Zátěž klesla i přes to, že požadavky na poskytované statistické výstupy se radikálně zvýšily. Snižování zátěže respondentů je jenom jedna stránka věci. Ukazuje, o kolik se zkrátil čas, který zpravodajské jednotky musí věnovat vyplňování výkazů. Vůbec ale na něm není vidět, o kolik vzrostly požadavky na výstupy, které musíme poskytovat my.

Spolupracuje ČSÚ s vysokými školami a s vědci?

Ano, v minulosti jsme třeba s odborníky konzultovali, jakou cestou se vydat v případě strojového učení pro scanner data. Pomohly nám i vědecké programy Technologické agentury ČR, například s přípravou scriptů v jazyce R pro metodiku výběru pro sociální statistiky. Nyní chceme akademickou sféru oslovit s žádostí o pomoc při využívání satelitních snímků pro statistické účely.

S vysokými školami také spolupracujeme v oblasti vzdělávání. Naši zaměstnanci si doplňují znalosti na specializovaných kurzech na VŠE a my zase přijímáme pět až šest studentů různých vysokých škol ročně na stáže. Ze stážistů se mnohdy stávají i naši zaměstnanci.

Zmínil jste využití družicového snímkování ve statistice. K čemu by konkrétně mělo sloužit?

Satelitní snímky už využívají naši kolegové v Polsku. A my bychom se od nich rádi přiučili. Připravujeme tedy seminář na výměnu zkušeností. My Polákům vysvětlíme, jak pracujeme se scanner daty, a oni nás seznámí s využíváním satelitních snímků.

Předpokládám, že tyto postupy uplatníme nejprve ve statistice zemědělství a lesnictví pro ověřování výměr. Později bychom rádi zařadili i sledování osevních ploch jednotlivých plodin a pak třeba mohou satelitní snímky sloužit i v makroekonomické statistice, například při odhadování majetku v záplavových územích. Možností bude určitě mnoho, nejprve se ale budeme muset naučit rozpoznávat objekty a správně je zatřídit.

Kolik inovace v ČSÚ stojí a z čeho jsou financovány?

V naprosté většině řešíme inovační postupy z běžného rozpočtu. Každý rok se snažíme vyčlenit pro tyto účely potřebné peníze. Nyní začneme využívat Národní plán obnovy koordinovaný vládou. Pro malé projekty našeho typu v něm sice tolik prostředků není, ale rádi bychom připravili několik prototypových řešení, která bychom pak předali velkým softwarovým firmám, aby je implantovaly do svých produktů. Tím by se využívání těchto, původně námi vyvinutých nástrojů rozšířilo.

Čerpáme rovněž evropské granty, naposledy nám pomohly financovat vývoj programů pro nově zaváděné tablety v terénních šetřeních. A menším zdrojem financí je i program Beta Technologické agentury ČR.

Co byste označil za největší překážky inovací ve státní správě?

Jsou to stejné jako vždycky lidé. Ti, kteří jsou opravdu dobří, jsou obvykle vytížení na 150 procent a ti, kteří tak dokonalí nejsou, žádnou kvalitativní změnu neudělají.

Jaké výzvy z oblasti inovací čekají ČSÚ v nejbližších letech?

V prvé řadě je to modernizace našeho statistického informačního systému. V současné době připravujeme velkou rámcovou smlouvu pro potenciální dodavatele a na jaře bychom rádi vypsali veřejnou soutěž na jednotlivé komponenty. Nejdůležitější z nich bude modernizace našich výkazů, s jejichž pomocí získáváme vstupní data. Do budoucna chceme úplně zrušit výkazy ve formátu pdf, a plně je nahradit vyplňováním online. Naprostá většina dat by však měla být získávána prostřednictvím přímého napojení na podnikové informační systémy. To je cesta, kudy se chceme a musíme vydat.

Z dalších úkolů nás letos čeká dobudování veřejné databáze Datastat, v níž uživatelé budou moci vyhledávat statistické výstupy podle svých potřeb a vytvářet si vlastní sestavy. Brzy také představíme nový web úřadu.

Abychom to vše byli schopni dělat, musíme tady udržet kvalitní lidi. Takže další výzvou je motivace zaměstnanců, aby u nás chtěli pracovat a podávali nadstandardní výkony.

Rozhovor vyjde v únorrovém čísle časopisu Statistika&My.