Dokumentace datové sady (DS)
(aktualizováno ke dni 16. 2. 2021)
Název DS:
Datová sada obsahuje časovou řadu se statistickými údaji o počtu zemřelých v České republice od roku 2011 podle týdnů a vybraných věkových skupin.
Metodické poznámky
Český statistický úřad pravidelně zveřejňuje ve čtvrtletní periodicitě měsíční úhrny zemřelých a to 73. den po skončení referenčního období. Od května roku 2020, v reakci na výskyt onemocnění Covid-19, se ČSÚ rozhodl rozšířit a uspíšit předběžné výstupy a průběžně, před standardně stanovenými čtvrtletními termíny, zpřístupňovat údaje o počtu zemřelých v jednotlivých kalendářních týdnech. Data označená příznakem „P“ jako předběžná jsou aktualizována v týdenním cyklu, přičemž zveřejněné údaje pokrývají ty týdny, kde je počet zpracovaných statistických hlášení úmrtí vyhodnocen jako dostatečně úplný pro publikování předběžných počtů zemřelých. Výsledné načasování zveřejnění jednotlivých týdnů je tak výsledkem vybalancování potřeby dostatečné úplnosti údajů a snahy o co nejvčasnější zveřejnění předběžných výsledků. Údaje označené jako předběžné jsou vedeny jako předběžné až do skončení zpracování roku. Odhad úplnosti: poslední zveřejněný týden (T) 97–98 %, týden (T–1) 98–99 %, týden (T–2) a starší 99–99,5 %.
Všechny údaje v datové sadě jsou uvedeny v osobách.
Poznámky k agregacím
Úhrn údajů za věkové skupiny odpovídá údaji za věkové skupiny celkem.
Třídění dat do týdnů vychází z normy ISO 8601. První týden v roce je ten, který obsahuje první čtvrtek v roce. Znamená to, že úhrny za týdny v kalendářním roce se nerovnají ročnímu počtu zemřelých, neboť první a poslední týden může být složen ze dnů ve dvou kalendářních letech.
Datovou sadu představuje CSV soubor, jednotlivé položky (tvořící sloupce) jsou zprava i zleva ohraničeny znakem ", oddělovačem položek je čárka.
Každý statistický údaj tvoří jeden řádek souboru, zjištěná hodnota je ve sloupci hodnota.
Statistický údaj je definován z hlediska věcného (statistická proměnná=ukazatel, věk), časového (referenční období, jednotlivé týdny) a územního (území).
VYZNAM |
POZNAMKA |
|
idhod |
unikátní identifikátor údaje Veřejné databáze ČSÚ |
využije se v případě dotazu ke konkrétnímu údaji |
hodnota |
zjištěná hodnota |
v numerickém formátu |
stapro_kod |
kód statistické proměnné |
V této DS pouze kód 5393 pro Počet zemřelých osob s trvalým nebo dlouhodobým pobytem |
vek_cis |
číselník pro věkovou skupinu |
Využit číselník 7700. Pokud není vyplněn, jedná se o úhrn za všechny věkové skupiny |
vek_kod |
kód položky číselníku pro věkovou skupinu |
|
vuzemi_cis |
kód číselníku pro referenční území |
číselník odpovídá typologii území, pro údaj za stát použit číselník 97 |
vuzemi_kod |
kód položky číselníku pro referenční území |
pro údaj za Českou republiku kód 19 |
rok |
rok referenčního období ve formátu RRRR |
Rok pro referenční týden dle normy ISO |
tyden |
Pořadové číslo referenčního týdne |
Dle normy ISO |
roktyden |
Referenční rok a týden dle normy ISO |
Formát RRRR-Wxx |
casref_od |
datum odpovídající prvnímu dni (pondělí) referenčního týdne |
ve formátu RRRR-MM-DD |
casref_do |
datum odpovídající poslednímu dni (neděle) referenčního týdne |
ve formátu RRRR-MM-DD |
vek_text |
text pro věkovou skupinu |
|
priznak |
doplňující příznak údaje |
P = předběžný údaj |
Pro identifikaci (definování) každého statistického údaje se využívá Statistický metainformační systém ČSÚ (SMS), a to subsystém SMS-UKAZ (statistické proměnné) a SMS-KLAS (statistické číselníky a klasifikace).
V datové sadě jsou použity:
Seznam statistických proměnných - https://vdb.czso.cz/pll/eweb/stapro.csv
stapro_kod |
TEXT |
5393 |
Počet zemřelých osob s trvalým nebo dlouhodobým pobytem |
Věkové skupiny – využit obecný intervalový číselník, kód číselníku ČSÚ 7700
http://apl.czso.cz/iSMS/cisexp.jsp?kodcis=7700&typdat=0&cisjaz=203&format=0
V datové sadě použity tyto kódy:
Číselník |
Kód |
Interval |
7700 |
400000610015000 |
0-14 |
7700 |
410015610040000 |
15-39 |
7700 |
410040610065000 |
40-64 |
7700 |
410065610075000 |
65-74 |
7700 |
410075610085000 |
75-84 |
7700 |
410085799999000 |
85 a více |
Časové vymezení
Datová sada obsahuje týdenní údaje od roku 2011.