Bez metadat se neobejde žádný statistický výkaz

    Pavla Trendová je ředitelkou sekce obecné metodiky a registrů. Zabývá se přípravou statistických zjišťování, centrálním zpracováním dat, včetně těch volebních, snižováním administrativní zátěže respondentů nebo zefektivněním výkonu státní statistické služby.

    Čtenáři časopisu Statistika&My vás znají jako autorku článků na téma Co bude ČSÚ zjišťovat v následujícím kalendářním roce. Je to jediná oblast, kterou máte v ČSÚ na starosti?

    Jediná není, ale je to oblast, která je pro mě velice zajímavá. Bez statistických zjišťování by tento Úřad mnoho statistických informací nevydal. Pro mě je to navíc srdeční záležitost z toho důvodu, že statistické zjišťování bylo jedním z velkých témat, kterými jsem se zabývala ještě v době, kdy jsem v ČSÚ působila na pozici ředitelky odboru obecné metodiky.

    Proč o zjišťování hovoříte jako o srdeční záležitosti? Laik by si mohl myslet, že sbírat data je nezáživné.

    Protože témata, která ČSÚ a další resorty zjišťují, jsou velmi pestrá a průběžně se mění. Proto také každý rok vyjednáváme jak s uživateli našich dat, tak s těmi, kdo statistická zjišťování navrhují. To znamená, že spolu komunikují jednotlivé útvary ČSÚ a některé další resorty, které mají pravomoc vykonávat státní statistickou službu a provádějí statistická zjišťování.

    Kolik těch resortů v současné době v ČR je?

    S postupem let se počet mění, pro rok 2018 je to šest resortů. Nesmím také zapomenout ještě na jednu skupinu, která ovlivňuje podobu statistických zjišťování, a tou jsou naši uživatelé z různých svazů či asociací. S některými z nich máme pravidelné kontakty, jiné oslovujeme pouze v případě nového statistického zjišťování anebo v situaci, kdy se statistické zjišťování nějak významně mění.

    Ing. Pavla TrendováIng. Pavla Trendová

    Vystudovala Vysokou školu ekonomickou v Praze, obor ekonomická statistika. Nejprve pracovala ve Výzkumném ústavu sociálně-ekonomických informací, poté přešla do ČSÚ. Od června 2015 zastává pozici ředitelky sekce obecné metodiky a registrů. Začínala tématem tvorby statistického metainformačního systému, pokračovala přípravou statistických zjišťování. Podílela se na přípravě, realizaci a implementaci evropského projektu Redesign statistického informačního systému. Přednáší na Specializovaném statistickém studiu, které pořádá ČSÚ ve spolupráci s Fakultou informatiky a statistiky Vysoké školy ekonomické v Praze, zkouší oborovou část úřednické zkoušky, tj. z oboru Státní statistická služba.

    Existuje stát, ve kterém by kromě národního statistického úřadu už žádný jiný subjekt státní statistickou službu nevykonával?

    Od kolegů ze zahraničí máme informace, že evropskou statistiku standardně vytváří národní statistický úřad plus ještě další instituce. Jejich počet může být významný, například v Německu je 31 dalších producentů oficiální statistiky. Naopak výjimkou je Nizozemsko. Za statistiku zodpovídá pouze statistický úřad. Průměrně jde o 10 institucí.

    Myšlenka expředsedy ČSÚ Edvarda Outraty vytvořit jeden orgán, který by sbíral veškerá data, se zatím neujala. Nepůsobí vám rozdrobenost státní statistické služby mezi různé resorty problémy?

    Myšlenka sběru statistických dat pouze Úřadem je logická, ale historicky nebyla podporována. Od doby, kdy vznikl zákon o státní statistické službě, tedy od roku 1995, je statistika postavena na dělbě práce Úřadu a resortů. Všechna zjišťování s resorty konzultujeme, domlouváme si rozdělení práce. Tak například ČSÚ zjišťuje v rámci zemědělské statistiky data podle určitého nařízení a Ministerstvo zemědělství může tu samou oblast sledovat také, ovšem úplně z jiného pohledu. Například Úřad zjišťuje plochu sklizně a sklizeň ovoce a Ministerstvo zemědělství sleduje nákup určitých druhů ovoce z tuzemska a ze zahraničí včetně jejich nákupních cen. Důvody zjišťování a míra podrobnosti dat jsou odlišné. Duplicity ve zjišťováních tak, jak je někteří respondenti mohou vnímat, neexistují.

    A veřejnost to chápe?

    V posledních letech jsme vedli obrovské diskuse o zefektivnění se všemi resorty, které statistiku vykonávají. Říkali jsme si, že některá zjišťování by se mohla převést pod gesci ČSÚ. Ale narazili jsme na to, že je v některých případech nutná hluboká věcná znalost oboru. Nedokážu si například představit, že bychom měli zjišťovat podrobná data o zdravotnictví. To by byla zátěž pro všechny zpracovatelky Českého statistického úřadu. V této souvislosti je nutné upozornit i na to, že resortní statistiky jsou postaveny zejména na resortních administrativních zdrojích dat, ne na statistických zjišťováních. Z tohoto důvodu pak není efektivní resortní statistická data sbírat, a jiná, „nestatistická“, ne. Aby ČSÚ byl jediným orgánem pro oficiální statistiku, znamenalo by to nastavit celý systém státní statistické služby od začátku – nově.

    Jak například reagují respondenti na dopis ČSÚ, že u nich proběhne statistické zjišťování, když podobné oznámení jim adresuje Ministerstvo průmyslu a obchodu? Dojde jim, že tyto dva subjekty nezjišťují totéž?

    Pokud nás kontaktuje respondent, tak si obecně stěžuje na to, že je státem zatěžován a že musí vyplňovat pro „statistiku“ všelijaká statistická zjišťování. A když se ho pak ptáme na seznam statistických zjišťování, zjistíme, že například pro ČSÚ dělá jedno či dvě, pak nějaké resortní zjišťování, ale podle úplně jiného zákona. Nebo ho oslovuje krajský či obecní úřad. Stát mu ukládá povinnost vyplňovat čísla, ale se státní statistickou službou to nemusí mít vůbec nic společného.

    Co bylo důvodem vzniku aplikace DANTE WEB?

    To se musím vrátit do 90. let. ČSÚ byl jedním z prvních orgánů státní správy, který měl elektronický sběr dat. Možná jsme byli dokonce i první v Evropě. V roce 1996 jsme už mohli nabízet našim respondentům tzv. EPV (Elektronické pořízení výkazů), což byl software, který si stáhli do počítače, v něm data vyplňovali a následně je odeslali do ČSÚ. Na tu dobu to bylo úžasné řešení, neboť již tehdy v něm existoval celý systém kontrol a mnoho respondentů ho využívalo. S nástupem počítačových virů rostl počet těch, kteří EPV začali odmítat a zase se vrátili k papíru. Když stát vytvořil informační systém datových schránek, začal ho ČSÚ aktivně využívat. Všichni podnikatelé totiž mají nejen povinnost si pro komunikaci s veřejnou správou tyto schránky zřizovat, ale také je využívat. Vymysleli jsme proto „chytrá pédéefka“, která jsme začali posílat do těchto datových schránek. Respondenti je mohli vyplnit a poslat zpět. Jelikož jsme cítili, že to není optimální řešení, vznikla aplikace DANTE WEB. Respondentům chceme dávat plný servis pro sběr dat. Z tohoto důvodu jsme zavedli i Oznámení o zpravodajské povinnosti vůči ČSÚ, kterým každoročně v lednu firmy informujeme o jejich povinnosti vyplnit konkrétní výkazy.

    Využíváte také administrativní data. Která konkrétně nejvíce?

    Data z daňových přiznání. Ta máme již od roku 2007. Česká republika patřila mezi první země, které začaly e-Government aktivně prosazovat. Dalším významným administrativním zdrojem dat jsou daňová přiznání k dani z přidané hodnoty. Výhodou těchto dvou zdrojů je to, že máme k dispozici individuální údaje, které dáváme do souvislosti s daty ze statistických zjišťování. Administrativních zdrojů máme více než sto a statistika je na nich do velké míry závislá.

    Jak reagují vaši respondenti na informaci, že využíváte administrativní zdroje?

    Velice dobře. Jedním z argumentů, proč nám nechtějí data poskytovat, je výrok: Vždyť stát už o nás informace má. Vždyť ty údaje už jsem dávno dal finančnímu úřadu, proč si to nepředáte? Tady vždy argumentujeme tím, že některé údaje potřebujeme ve větším detailu. Druhým důvodem bývá, že data jsou k dispozici později, než je třeba. Každé ministerstvo nebo obecně vlastník zdroje dat má určitou dobu na jejich kontrolu a zpracování, což nějaký čas trvá, a pak je může náš Úřad dostávat později, než potřebuje.

    Je důležité kromě znalosti makroekonomických čísel také vědět, jak k nim ČSÚ přišel?

    To je nezbytná součást statistiky. Bez metadat a znalosti použité metodiky je každé číslo o ničem. Když nevím, co číslo znamená, za které respondenty (statistickou populaci), za jaký čas a za jakých podmínek vzniklo, tak je to jen nic neříkající číslo. Proto každé šetření co nejvěrněji popisujeme. Z toho důvodu jsme vytvořili rozsáhlý metainformační systém, který obsahuje informace o informacích. Celý systém tvorby a diseminace statistických informací je na něm postaven. Bez metadat se neobejde žádný statistický výkaz.