Život sčítacího formuláře v deseti krocích

Listinné sčítací formuláře poté, co opustily zdi tiskárny, absolvují dlouhou a náročnou cestu, na jejímž konci stojí kompletní znehodnocení v podobě skartace.

1. Tisk

Pro letošní sčítání bylo vytisknuto celkem 3,8 milionu listinných formulářů, proces výroby trval téměř 6 měsíců.

2. Roznos

Deset tisíc sčítacích komisařů rozneslo ve dvou kolech formuláře do domácností po celé České republice.

3. Vyplnění

Podoba a rozmístění polí pro zápis údajů, druh papíru, použité barvy a technologie tisku byly voleny tak, aby bylo možné formulář bez problémů vyplnit (např. bez rozpíjení a rozmazávání zápisů) a později naskenovat.

4. Sběr a digitalizace

Vyplněné formuláře putovaly prostřednictvím pošty a kontaktních míst na pracoviště digitalizace. Tam velkokapacitní skenery rozpoznávají údaje, které obyvatelé do formulářů zapsali. V případě, že stroj nedokáže některé znaky přečíst, z formuláře je do elektronické podoby ručně přepíšou pracovníci digitalizace. Ti však již nemají k dispozici celý formulář, ale pouze jeho výřez se špatně čitelným zápisem.

5. Kódování

Během automatizovaného procesu se identifikuje význam odpovědí a různě formulované odpovědi se převádějí do standardizované podoby. Shodný kód dostanou např. národnost „moravská“, „Moravan“, nebo „Moravák“. I v této fázi pomáhají strojům s luštěním některých nejasných zápisů speciálně proškolení lidé.

6. Konsolidace

Pokud se ve formuláři například neshoduje pořadí členů domácnosti s pořadím údajů o jednotlivých osobách, je třeba je sjednotit. Vyplněné údaje jsou poté propojeny se záznamy v registru obyvatel a dalších administrativních zdrojích.

7. Deduplikace a prioritizace

Z propojení s registry v předchozím kroku mimo jiné vyplyne, které osoby ve formulářích chybějí (ty se z registrů doplní), a naopak které osoby či domácnosti jsou sečteny vícekrát. Duplicitní záznamy se musejí odstranit tak, aby zůstaly zachovány aktuální údaje a byly smazány ty chybné.

8. Vytvoření domácností

Ze získaných údajů je třeba sestavit posloupnost osoba- domácnost-byt. Zároveň se opravují nelogické vztahy jako třeba rodiče mladší než děti.

9. Anonymizace a statistické zpracování

Údaje se přenesou do jiné databáze, avšak už bez rodných čísel, jmen, příjmení, typů a čísel občanských průkazů nebo ID datových schránek tak, že už nebude možné spojit je s konkrétní osobou. Data z původní databáze budou vymazána. Anonymizovaná data se dále statisticky zpracovávají a vytvářejí se souhrnné údaje za sídla, obce, kraje či celou republiku.

10. Skartace

Formuláře budou mechanicky znehodnoceny. Ze vzniklé papírové drti už není možné získat jakékoli údaje.

Článek si můžete přečíst také v časopisu Statistika&My.

Více informací na www.czso.cz

Sčítání lidu, domů a bytů