Administrativní data hrají při sčítání stále větší roli

„Ochota lidí účastnit se statistických šetření klesá všeobecně všude na světě,“ tvrdí ředitel odboru statistik obyvatelstva ČSÚ Robert Šanda.

Je už projekt Sčítání 2021 uzavřen, nebo je třeba ještě něco dokončit?

Všechna data jsou už zpracovaná, teď je jenom postupně publikujeme. Tahle práce v podstatě nikdy nekončí, protože i když zveřejníme vše, co jsme plánovali, vždycky se objeví požadavek na nějakou další analýzu nebo nové vyhodnocení dat.

Jak velký kolektiv v ČSÚ na sčítání pracoval?

Počet přímo zapojených pracovníků se měnil podle fáze, ve které se sčítání nacházelo. Nejvíce, řádově stovky lidí, se podílely na územní přípravě, kdy se přímo v terénu ověřovaly některé údaje o domech. Při vlastním sčítání to pak byly desítky osob a zpracování výsledků se věnovalo méně než deset odborníků. Do těchto počtů ale nezahrnuji podpůrné týmy, které měly na starosti třeba komunikaci, právní služby a podobně.

Mgr. Robert Šanda

Vystudoval geografii a kartografii na Masarykově univerzitě v Brně. Do ČSÚ nastoupil v roce 2004 do oddělení sociálně demografických analýz. Od roku 2006 se zabývá problematikou sčítání lidu, především otázkou využití registrů ve sčítání. Tomuto tématu se věnuje i v odborné publikační činnosti. Od roku 2017 je ředitelem odboru statistiky obyvatelstva.

Je i sčítání ovlivněno skutečností, že lidé jsou stále méně ochotni účastnit se statistických šetření a odpovídat na dotazy o svém soukromí?

Ano. Platí to všeobecně a i v cenzech je znát, že klesá ochota vyplňovat formuláře a poskytovat státu informace. Děje se to na celém světě.

Dá se tomu nějak zamezit?

Většinou se využívá kombinace několika nástrojů. Jednak je to informační kampaň, která lidem vysvětlí, proč je sčítání potřeba a co jeho výsledky společnosti přinášejí. Dalším důležitým opatřením je snižování zátěže respondentů. Formulář by měl být snadno přístupný a jeho vyplnění jednoduché, aby člověk nemusel přemýšlet, co jednotlivé dotazy znamenají, nebo aby nemusel odpovědi složitě vyhledávat v různých zdrojích. Naše poslední sčítání už jednoduché bylo, lidé mohli vyplnit formulář třeba cestou domů z práce v MHD prostřednictvím mobilu. I přesto jsme pokles účasti na sčítání zaznamenali. Je evidentní, že je třeba pokračovat v práci na získávání dat z administrativních zdrojů. Jenom na tradiční způsob vyplňování formulářů se do budoucna určitě nedá spoléhat. Bez administrativních dat nebude možné získat informace v potřebné kvalitě.

O které zdroje administrativních dat by bylo vhodné sčítání ještě doplnit?

Nemáme například úplné údaje o dojížďce, tedy to, kde, v které obci člověk pracuje nebo chodí do školy. Konkrétní místo se totiž v řadě případů nekryje se sídlem zaměstnavatele či školy a podle adresy zaměstnavatele ho tedy nelze přiřadit.

Zásadním problémem je ale neexistence administrativních dat o bytovém fondu. Z administrativních dat nemůžeme konstruovat ani složení domácností, protože adresy bydliště jsou u nás vedené do úrovně domu, nikoliv bytu. Takže v bytovém domě jsou všichni lidé evidovaní na jedné adrese a do jednotlivých domácností je nedokážeme rozdělit. Složení a charakteristiky domácností jsou přitom jedním ze základních témat sčítání.

A další komplikace způsobuje skutečnost, že u části populace je rozdíl mezi trvalým a obvyklým bydlištěm.

Rýsuje se nějaká možnost, jak nedostatek administrativních dat o bytovém fondu vyřešit?

Ano. Ve spolupráci s Českým úřadem zeměměřickým a katastrálním a několika dalšími institucemi jsme založili mezirezortní skupinu a hledáme cesty, jak požadované informace získat. Jejich potřeba se projevuje nejenom v souvislosti se sčítáním, uvítala by je i mnohá ministerstva a řada dalších institucí. V rámci mezirezortní skupiny už na řešení pracujeme.

Takže příští sčítání už bude využívat data o bytech?

Věřím, že ano. Je to ale úkol na dlouhou dobu, velmi náročný časově i organizačně. Vyžaduje spolupráci více rezortů, legislativní úpravy a vlastní naplnění vzniklého zdroje daty. Příprava na příští sčítání tedy může přispět k doplnění a verifikaci dat pro naplnění administrativního zdroje o bytech.

Sčítání v roce 2021 ale už využívalo data z registru škol…

Data vedená Ministerstvem školství, mládeže a tělovýchovy jsme využili, a protože v zákoně o sčítání je ustanovení, že pro příští cenzus můžeme uchovávat informace o dosaženém vzdělání v neanonymizované podobě, můžeme využít i data ze sčítacích formulářů. Pokud si tedy někdo úroveň vzdělání zvýší, my budeme moci tento údaj na základě dat Ministerstva školství aktualizovat. V rámci průběžně demografické statistiky pak chceme data o úrovni vzdělání nabídnout i v roční periodicitě.

Čím se výsledky posledního sčítání nejvíce liší od výsledků těch předchozích?

Do výstupů se podstatně promítla právě skutečnost, že jsme mnohem více než v minulosti využívali administrativní zdroje dat a elektronické formuláře s přednastavenými možnostmi odpovědí. Díky tomu se nám u řady charakteristik podařilo značně snížit míru „nezjištěnosti“. Dobře vidět je to třeba u dojížďky, kde jsme byli schopni dotáhnout výsledky do výrazně větší úplnosti než při předchozím cenzu.

Pokud jde o konkrétní rozdíly způsobené vývojem společnosti, jedná se o jevy, které jsme očekávali, nebo byly patrné už z jiných statistik. Zmenšuje se velikost domácností, populace stárne, snižuje se počet lidí žijících v manželství, úroveň vzdělání roste, zejména u žen…

Které fáze z celého sčítání byste označil za nejnáročnější?

To se těžko posuzuje, protože se jednalo o velmi rozsáhlý projekt, jehož jednotlivé části byly mnohdy tak odlišné, že je ani nelze porovnat. Náročné bylo všechno. Upozornit bych však chtěl na skutečnost, kterou lidé mimo úřad patrně ani nepostřehli, ale pro samotný průběh sčítání byla zásadní. Ve srovnání s minulým cenzem jsme se rozhodli zpracovat data téměř výhradně vlastními silami a mimo dvou externích datových analytiků nespoléhat se na externí dodavatele. To kladlo značné nároky na zpracovatelský tým, který tvořilo méně než deset osob. Bylo to však dobré rozhodnutí, protože jsme měli všechno pod kontrolou, všechny procesy jsme byli schopni zopakovat a dokázali jsme vysvětlit každý detail z průběhu zpracování dat. Zároveň to vedlo k citelné úspoře finančních prostředků.

Kdy vám v průběhu sčítání bylo nejvíce úzko?

Velké napětí samozřejmě panovalo těsně před zahájením terénního sběru dat a první dny těsně po něm. To se celý stroj najednou rozjede a vy se musíte spolehnout na to, že je vše dobře vymyšleno a zajištěno a že se neobjeví něco, s čím jste nepočítal. Ale tým, který na sčítání pracoval, byl opravdu velmi kvalitní, takže až na malé zakolísání na úplném začátku způsobené výpadkem online aplikace proběhl terén velmi dobře.

Určité napětí jsem pocítil také v době, kdy jsme začali rozpracovávat schéma, jak bude probíhat zpracování dat a co je pro něj potřeba všechno udělat. Uvědomovali jsme si, že jsme do svých rukou převzali obrovský úkol, který v předchozím sčítání řešil rozsáhlý tým, v němž byla zapojena řada externích dodavatelů. Jak už jsem ale řekl, spolehnutí se na odbornou kvalitu a nasazení vlastních lidí se vyplatilo.

V rámci projektu sčítání byla vyvinuta řada nástrojů a postupů, které budou v ČSÚ sloužit i v budoucnu. Můžete ty nejdůležitější čtenářům přiblížit?

To nejpodstatnější je, že sčítání iniciovalo založení cenzového informačního systému (CENZIS), který je možné využít i pro další statistiky. CENZIS nám umožňuje pracovat s daty registru obyvatel a navazujících systémů. Díky tomu budeme moci postupně redukovat tradiční způsob sběru dat o demografických událostech – o narození, stěhování, sňatcích, úmrtí. V této chvíli jsme ve fázi vývoje postupů a plně využívat CENZIS bychom chtěli do dvou let. Během té doby musíme nastavit a důkladně otestovat nové procesy, kterými nahradíme ty stávající, aby bylo možné plynule navázat.

Dosud se aktuální stav populace počítá tak, že se vyjde ze stavu zjištěného při posledním sčítání a přičtou se počty narozených a přistěhování, k nimž v mezičase došlo, a odečtou se úmrtí a vystěhování. Do bilance vstupují pouze souhrnná čísla a konkrétní změnu není možné přiřadit konkrétní osobě. CENZIS nám umožní pracovat s jednotlivými záznamy, takže výsledky budou přesnější, podrobnější a doufám, že také dříve dostupné.

Pocítí tuto změnu i matriční úřady, od nichž ČSÚ v současnosti získává data?

Výrazně se sníží objem výkazů, které jejich pracovníci vyplňují. Povinnost poskytovat ČSÚ data ale nezmizí úplně, protože některé údaje v administrativních zdrojích, z nichž čerpá CENZIS, nejsou obsaženy.

Jak hodnotíte nové publikační nástroje ČSÚ, které jsou nebo brzy budou pro zobrazování dat ze sčítání k dispozici?

Plně funkční je už Geoportál, který se mi moc líbí a dostávám na něj pozitivní reakce od odborné i laické veřejnosti. Geoportál získal také prestižní mezinárodní ocenění „Special Achievement in GIS“, udělované společností ESRI na základě vyhodnocení projektů z celého světa. To je důkaz, že se opravdu povedl. Zaznamenal jsem samozřejmě také nějaké náměty na další vylepšení od geografických specialistů, ale to je dobře, pomůže nám to neusnout na vavřínech a stále se zdokonalovat.

Teď netrpělivě čekáme a těšíme se na zprovoznění nového portálu DataStat, který by měl nahradit veřejnou databázi ČSÚ. Pro uživatele bude mnohem přívětivější a já věřím, že i on se setká s kladnou odezvou.

V současné době již zahajujete přípravu sčítání 2031. Co o něm už nyní můžete prozradit?

V tuto chvíli se domlouváme na hlavních směrech, kudy se sčítání bude ubírat. Určitě by mělo být ještě jednodušší pro respondenty. Koncept maximálního snižování zátěže respondenta a co největšího využití administrativních zdrojů dat zůstane zachován. Debatu jistě povedeme o tom, zda a případně jak upravit obsah sčítání.

Dále také patrně dojde k úplnému zrušení papírových formulářů. V okruhu celé Evropské unie jsme jednou z mála zemí, které možnost sečíst se na papír ještě udržovaly. Mělo to své výhody, údaje jsme získali i od lidí, kteří se nechtěli nebo nemohli sečíst online a v době covidové pandemie by nebylo možné k nim poslat tazatele. Ale na druhé straně je následné zpracování papírových formulářů velmi náročné a vyžaduje spoustu času. Kdybychom měli jen elektronickou verzi, zpracování výsledků by se hodně zjednodušilo a urychlilo. Znamenalo by to ale zajistit asistenci těm, kteří k online formulářům nemají přístup. To chceme určitě řešit například ve spolupráci s obcemi. Jde opět o širší problém týkající se obecně asistence občanům s využíváním digitálních služeb.

Kam se mohou obracet zájemci o informace ze sčítání, které nenajdou na našem webu nebo v publikacích?

V prvé řadě vždycky na informační servis ČSÚ. Jeho zaměstnanci uživatele navedou, pokud už informace publikována je, nebo pomůžou připravit nějaké jednodušší sestavy. V případě, že se jedná o nějaký velmi specifický požadavek, spojí se s námi a naši odborníci navrhnou další postup.

Zkrácený rozhovor vyšel v zářijovém čísle časopisu Statistika&My.