Jaroslav Sixta: Snížení zátěže respondentů a zvýšení bezpečnosti

    To jsou hlavní důsledky využívání administrativních zdrojů dat, o kterém jsme hovořili s místopředsedou Českého statistického úřadu Jaroslavem Sixtou. Dotkli jsme se však i jiných témat.

    Jak se za uplynulý rok podařilo ČSÚ pokročit ve využívání administrativních zdrojů dat?

    Na využívání administrativních dat a rozšiřování jejich zdrojů se intenzivně zaměřujeme neustále. Z nejvýznamnějších úspěchů za minulý rok musím jmenovat implementaci dat o odpadovém hospodářství z Integrovaného systému plnění ohlašovacích povinností Ministerstva životního prostředí (ISPOP). Podařilo se nám také zajistit přebírání administrativních dat z devíti registrů pro Sčítání lidu, domů a bytů. Formuláře tak budou mít zhruba o polovinu otázek méně než v předchozím sčítání, velkou část informací si vyhledáme a doplníme z existujících zdrojů.

    Loni jsme se rovněž dohodli s Ministerstvem práce a sociálních věcí na využití administrativních dat z programu Antivirus pro statistiku práce a mezd. Jak vyplývá z názvu, jedná se o data spojená se situací kolem dopadů pandemie covidu-19.

    A jednáme i s dalšími subjekty, jejichž data bychom v budoucnu rádi používali pro statistické účely. Je to hlavní směr, jak snižovat administrativní zátěž firem.

    O některé zdroje dat ale ČSÚ přišel…

    Bohužel, občas některé administrativní zdroje přestanou existovat. Loni jsme takto naposled využili údaje z daňových přiznání k dani z nabytí nemovitosti. Tato daň byla zrušena a údaje už nebudou dále k dispozici. My tomu budeme muset přizpůsobit naši cenovou statistiku, některé výstupy už nebudeme schopni poskytovat.

    Můžete chybějící zdroj nějak nahradit?

    Zkoušíme to pomocí dat z katastru nemovitostí, ale ta nám neumožňují jít do takového detailu, jako to bylo možné na základě daňových přiznání.

    doc. Ing. Jaroslav Sixta, Ph.D.

    Profesně se zabývá oblastí makroekonomické statistiky a národního účetnictví. Spolupracoval na zavádění standardů národních účtů ESA1995 a ESA2010. Kromě působení v ČSÚ se také věnuje vědecké a pedagogické činnosti v oblasti ekonomické statistiky a národního účetnictví. Je autorem nebo spoluautorem dvou učebních textů a více než stovky vědeckých a odborných článků, konferenčních příspěvků a výzkumných studií.

    Zmínil jste implementaci dat o odpadech ze systému ISPOP, co tato novinka přinese?

    V prvé řadě to znamená radikální redukci výběrového souboru šetření k odpadům. Snižování administrativní zátěže probíhalo postupně, za rok 2019 to bylo oproti původnímu stavu 63 procent, pro rok 2020 mohla být provedena další redukce výběru, a tak kumulativní úspora zátěže respondentů činí již 85 procent. Zároveň jsme získali komplexní data za veškerou produkci odpadů, zatímco dosud jsme měli k dispozici pouze vzorek získaný na základě výběru. Můžeme také například lépe porovnávat produkci odpadů v regionech, protože do systému ISPOP se vkládají data za jednotlivé provozovny, kdežto v předchozím šetření jsme měli jen komplexní údaj za celou firmu. Jsem rád, že se nám letos podařilo údaje zpracovat, na duplicitu odpadových dat z ČSÚ a z Ministerstva životního prostředí nás upozorňovala řada nespokojených respondentů.

    Jak náročná byla příprava na využití systému ISPOP?

    Musíme si uvědomit, že naprostá většina administrativních systémů, včetně ISPOPu, slouží k něčemu jinému než ke statistickému účelu. Proto je nelze jednoduše napojit na naše systémy a přebírat z nich nijak neupravená data. Všechna data z těchto externích zdrojů je třeba nejprve důkladně zkontrolovat, tedy prověřit odlehlé hodnoty, které se výrazně liší od ostatních, odstranit řádové chyby a duplicity, zatřídit data podle mezinárodních statistických klasifikací, a teprve pak je můžeme využít. A samozřejmě musíme zajistit, aby metodika zpracování byla transparentní a využitelná kontinuálně a opakovaně tak, aby šetření nebyla zatížena nějakou další chybou, vychýlením či nepřesností, která by vytvářela nesrovnalost v časové řadě. Celé je to velmi náročný proces.

    Došlo vlivem využití nového zdroje dat k nějakému skokovému posunu ve výsledcích odpadových statistik?

    Bohužel ke skokové změně došlo, ale nikoli z důvodu využití administrativního zdroje dat. Současně s tím jsme totiž důsledně aplikovali novou definici podle aktuální směrnice o odpadech. Dříve jsme se drželi metodických pokynů ke společnému dobrovolně vyplňovanému dotazníku Eurostatu a OECD, které umožňovaly užší interpretaci. Takový postup ale už nebude od referenčního období 2021 možný. Vlivem toho narostlo vykazované množství komunálního odpadu vyprodukovaného u nás na osobu. Aby bylo možné čísla vzájemně porovnávat, přepočetli jsme výsledky za tři roky nazpátek. Od příštího roku už by měly všechny členské země EU počítat komunální odpady stejně, takže i mezinárodní srovnání bude přesnější.

    Jaké administrativní zdroje bude ČSÚ využívat při letošním Sčítání lidu, domů a bytů a jaká data z nich bude získávat?

    Již ve fázi územní přípravy jsme intenzivně využili existující administrativní zdroje dat o budovách a bytech – Registr územní identifikace, adres a nemovitostí a Informační systém katastru nemovitostí. Spolupracovali jsme též s Českou poštou jako naším partnerem pro terénní práce, která disponuje svou databází doručovacích míst. V samotném sčítání pak využijeme vybraná data z Registru obyvatel, Integrovaného informačního systému České správy sociálního zabezpečení, Jednotného informačního systému MPSV, Školské matriky a rejstříku škol MŠMT, Centrálního registru pojištěnců VZP a Automatizovaného daňového systému Generálního finančního ředitelství.

    Velký důraz je při sčítání kladen na online způsob vyplnění formulářů, což bude jistě bezpečné z epidemiologického hlediska. Jak je ale zajištěna bezpečnost a ochrana dat?

    Na bezpečnost klademe velký důraz a na jejím zajištění se podílí mnoho našich interních i externích odborníků. Ochrana dat při sčítání bude určitě adekvátní rozsahu a významu celého projektu.

    Můžete zaručit, že když se po rozhodném okamžiku lidé přihlásí do online sčítání, tak systém nezkolabuje, jako se to stalo například u registru vozidel nebo při registraci k očkování proti covidu-19?

    Této otázce jsme se při přípravě systému věnovali velmi zodpovědně. Je ale třeba si uvědomit, že vždycky půjde o kompromis mezi cenou, která je ještě únosná, a výpočetní kapacitou, kterou budeme potřebovat. Jsme samozřejmě připraveni na špičky v počtu najednou přihlášených lidí a máme nasmlouvané variabilní kapacity výpočetního výkonu. Na druhé straně při sčítání není nijak důležité být mezi prvními a zaregistrovat se co nejdříve. Nepředpokládáme proto, že by zájem hned po půlnoci z 26. na 27. března byl tak extrémní, jako když se lidé třeba chtěli registrovat k očkování. I naše komunikační kampaň bude rozprostřená v čase tak, aby motivovala lidi sečíst se v průběhu celého vymezeného období, nikoliv pouze v jediný krátký okamžik. Pro to, aby systém nezkolaboval, tedy děláme maximum, ale stoprocentně zajistit, že bude fungovat stále bez jediného problému, nemůžeme. Já věřím, že těch problémů bude minimum a že nebudou závažné, popřípadě budou časově velmi omezené. Nevzpomínám si, že bych v poslední době viděl větší IT projekt v České republice, jehož start by byl naprosto bez problémů.

    Projeví se online sběr dat nějak významně i na čase, který bude ČSÚ potřebovat ke zpracování výsledků sčítání? Budou tentokrát výsledky zveřejněny dříve, než tomu bývalo v minulosti?

    Doufám, že ano. První výsledky budeme mít na konci letošního roku, ale hodně záleží na tom, kolik lidí se elektronicky sečte. Na rozdíl od minulosti, kdy byly nejdříve zveřejňovány předběžné výsledky, budeme tentokrát rovnou publikovat definitivní údaje.

    Chystá ČSÚ nějaké novinky i ve formě prezentace výsledků?

    Výstupy budou uživatelsky mnohem přívětivější. Chceme je nabídnout v podobě naší modernizované veřejné databáze, kde si uživatel bude moci vybrat z předdefinovaných datových sad a sestavit si výstup podle vlastních požadavků. Výstupy budou jak tabulkové, tak i v podobě grafů, vše bude přehledné a jednoduché na ovládání a orientaci ve zobrazovaných datech. Rádi bychom také zpřístupnili mapové výstupy.

    Jak průběh sčítání ovlivní protipandemická opatření?

    Největší změny proti původním plánům se týkají osobních kontaktů sčítaných osob se sčítacím komisařem. Ty budou maximálně omezeny. V současné době ještě jednáme s našimi partnery a domlouváme se na detailech, jak sečíst lidi v některých specifických místech. Jen těžko si můžeme představit, že bychom třeba osobně sčítali pacienty v nemocnicích na covidových odděleních nebo v léčebnách dlouhodobě nemocných. Pro takové případy musíme nalézt vhodné náhradní postupy.

    Při standardním sčítání budeme klást maximální důraz na online sběr dat. Chceme, aby sečtenost online byla co nejvyšší. Souhrnně mohu říct, že v žádném případě neohrozíme ani respondenty ani naše zaměstnance.

    Ukázala pandemie covidu-19 nutnost dovybavit ČSÚ nějakými technologiemi či zařízeními, které by umožnily lepší a bezproblémové fungování i během nouzového stavu?

    Byli jsme zvyklí, že notebooky, mobilní zařízení a vzdálený přístup používají hlavně ředitelé nebo vedoucí oddělení. A najednou jsme stáli před situací, kdy bylo třeba těmito zařízeními rychle vybavit i mnoho dalších pracovníků. To samozřejmě vyžaduje nějaký čas. Jednak ne všechno bylo na trhu okamžitě dostupné, jednak jsme museli dodržet předepsané postupy pro veřejné zakázky, výběrová řízení a podobně. Abychom vše urychlili, půjčovali jsme zaměstnancům na home office pevné stanice, zabezpečovali jsme jim bezpečné vzdálené připojení a školili je ve využívání nástrojů pro komunikaci a sdílení dat na dálku.

    Tento proces stále probíhá, nicméně mohu konstatovat, že chod úřadu se podařilo udržet bez zásadních výpadků. Domnívám se, že jsme se s novou situací vypořádali dobře a samotného mě překvapilo, jak rychle jsme to zvládli. Bylo to asi i tím, že statistici jsou zvyklí pracovat s čísly a s počítačem, a tak pro ně přechod na nové platformy nebyl takový problém.

    V současné době nám v dalším nasazování moderních nástrojů nejvíc brání těžkopádná byrokratická pravidla pro státní správu, jejichž smysl mi dalece uniká. Obecně jsou byrokratizace a neflexibilita hlavním problémem statní správy a bohužel je situace rok od roku horší. Některé věci se z tohoto důvodu posouvají kupředu mnohem pomaleji, než bychom chtěli.

    Ovlivnila pandemie nějak významně ochotu respondentů poskytovat ČSÚ požadované údaje?

    Ano, na získávání dat se covid-19 projevil dost zásadně. Řada podniků požádala o odložení zpravodajské povinnosti a my jsme se jim snažili vycházet vstříc. Nakonec se ale přes všechny obtíže podařilo data pořídit.

    Výraznější dopad měla pandemie na naše šetření v domácnostech. V nejkritičtějším období na jaře jsme zrušili návštěvy tazatelů v domácnostech, pak byly návštěvy obnoveny a nyní jsme opět ve stejné situaci. U domácností, které už s námi spolupracují déle, takový problém není. Tazatelé se s nimi domluví na předání dat prostřednictvím e-mailu, telefonu nebo jiných platforem, horší je to však v případě domácností, které bychom chtěli pro šetření teprve získat. Tam osobní návštěva hraje zásadní roli. Ale bezpečnost je pro nás priorita číslo jedna, takže i když je to velmi komplikované, oslovujeme domácnosti tak, aby nedošlo k fyzickému kontaktu s tazatelem.

    Jak se vlivem pandemie změnila poptávka po informacích produkovaných úřadem?

    Poptávka po informacích narostla. My jsme také zareagovali a začali jsme zveřejňovat informace, které jsme dříve nepublikovali. Například týdenní počty zemřelých, o které je značný zájem. Další novinkou jsou komentáře k rychlým informacím o vývoji nejdůležitějších socioekonomických ukazatelů. Snažíme se v nich doplnit čísla vysvětlením, co se za nimi skrývá, jaké jsou trendy a co by nebylo dobré opomenout. Chceme, aby lidé, kteří na základě našich dat dělají důležitá rozhodnutí, měli i v krizové situaci co nejlepší přehled.

    Chystá ČSÚ letos nějakou výraznou novinku?

    V současné době připravujeme mobilní aplikaci ČSÚ. Uživatelé by jejím prostřednictvím měli mít přístup k nejnovějším ekonomickým datům, ale také k dalším informacím z úřadu nebo třeba i k obsahu časopisu Statistika & My. Zatím jsme ve fázi vývoje a testování a já věřím, že až budeme dělat rozhovor za rok, tak už bude aplikace dostupná.

    Bude mít ČSÚ mobilní aplikace i pro vyplňování formulářů ze strany respondentů?

    Taková aplikace je již funkční pro letošní sčítání. Lidé se budou moci sečíst prostřednictvím mobilního telefonu nebo tabletu.

    Vývoj dalších aplikací třeba pro oblast firemních dat ale neplánujeme. V tomto případě se chceme vydat jinou cestou a postupně se napojit na administrativní a účetní systémy firem, z nichž bychom získávali data automaticky třeba po každé měsíční účetní závěrce. Zaměstnanci ve firmách by pak už nemuseli ručně vyplňovat žádné výkazy.

    Připravujeme na to náš statistický informační systém SIS 5.0 a věřím, že se nám podaří získat potřebné finance z národního programu Digitální Česko, který by měl tyto aktivity zastřešovat.

    Máte zjištěno, zda budou firmy ochotné propojit své interní systémy se systémem ČSÚ?

    Řešili jsme to s různými profesními svazy. Někde jednání ještě nezačala, někde jsme teprve na začátku, ale třeba se Svazem obchodu a cestovního ruchu už máme uzavřenou dohodu o využívání scanner dat z pokladen obchodních řetězců. Nám tato data slouží zejména pro stanovení inflace. Velkým vzorem pro nás je Česká národní banka, která automatizovaně přebírá od komerčních bank granulární data. Byl bych rád, kdyby se nám v případě podniků podařilo k tomuto vzoru co nejvíce přiblížit.