Databáze KROK – otevřená data - dokumentace

 

Databáze KROK – otevřená data

Databáze KROK obsahuje agregovaná statistická data za Českou republiku, regiony soudržnosti, kraje, okresy a správní obvody obcí s rozšířenou působností. Údaje jsou seskupeny do samostatných ročních souborů a prezentují data za uvedené územní celky od roku 2000 do současnosti. Data se vztahují vždy k aktuální územní struktuře platné v příslušném roce. Datový soubor za každý rok je po prvním zveřejnění následně ještě jednou aktualizován.

V souborech jsou zastoupeny různé obory statistiky představující tyto okruhy:

  • Území, katastrální výměry
  • Osídlení
  • Obyvatelstvo
  • Ekonomické subjekty
  • Nezaměstnanost (kraje, okresy)
  • Pracovní síla a ekonomicky neaktivní obyvatelstvo (VŠPS)
  • Průmysl
  • Zemědělství
  • Stavebnictví
  • Bytová výstavba
  • Doprava a dopravní síť
  • Zdravotnictví, pracovní neschopnost
  • Důchodové zabezpečení
  • Kriminalita, dopravní nehody, požáry
  • Hospodaření krajů
  • Školství
  • Sociální služby
  • Sčítání lidu, domů a bytů 2001, 2011, 2021
  • Nezaměstnanost (SO ORP)

Celkový počet ukazatelů v těchto statistických okruzích je 1 252.

Číselník ukazatelů obsahuje kromě kódu a názvu ukazatele také další informace, včetně zdroje dat a metodického vymezení jednotlivých ukazatelů. Vyskytují se v něm následující zdroje dat:

  • ČSÚ – Český statistický úřad
  • ČSSZ – Česká správa sociálního zabezpečení
  • ČÚZK – Český úřad zeměměřický a katastrální
  • GŘ Úřadu práce ČR – Generální ředitelství Úřadu práce ČR
  • HZS ČR – Hasičský záchranný sbor ČR
  • MD ČR – Ministerstvo dopravy ČR
  • MFIN ČR – Ministerstvo financí ČR
  • MPSV ČR – Ministerstvo práce a sociálních věcí ČR
  • MŠMT ČR – Ministerstvo školství, mládeže a tělovýchovy ČR֪
  • Policejní prezidium ČR – Policejní prezidium ČR
  • ŘSD ČR – Ředitelství silnic a dálnic ČR
  • ÚZIS – Ústav zdravotnických informací a statistiky ČR

Číselník území má pevnou strukturu kódů území, tzn., že územní struktura je považovaná za neměnnou za celé období od roku 2000 po současnost. Územní změny v krajích, okresech a SO ORP, pokud k nim došlo, jsou promítnuté v datech příslušného roku a v letech následujících. Zpětné přepočty dat nejsou prováděny.

Seznam a struktura souborů

1.       KROK_DATA_rrrr – datový soubor, kde rrrr je údaj roku

  • ROK - údaj roku
  • KODUKAZ - šestimístný kód ukazatele
  • KODUZEMI - čtyřmístný kód území
  • HODNOTA - číselný údaj nebo  "i.d." pro chráněný údaj

2.       KROK_UKAZ – číselník ukazatelů

  • KODUKAZ - šestimístný kód ukazatele
  • NAZEV - název ukazatele
  • MJ - měřicí jednotka
  • PLATIOD - platí od roku
  • PLATIDO - platí do roku
  • OKRUH - dvoumístný kód okruhu
  • ZDROJ - primární zdroj dat (s eventuálním upřesněním)
  • VERIFIKACE_CSU - pokud je uvedeno "ano", ČSÚ data z primárního zdroje zpřesňoval
  • METODIKA - metodické vymezení ukazatele

3.       KROK_UZEMI – číselník území

  • KODUZEMI - čtyřmístný kód území
  • UZEMI - název území
  • TYPUZEMI - pojmenování typu území textově

4.       KROK_OKRUHY – seznam statistických okruhů dat

  • KOD - dvoumístný kód okruhu
  • NAZEV - název okruhu

Soubory jsou ve formátu CSV a splňují standardy otevřených dat, konkrétně tyto požadavky:

  • Soubor CSV má kódování UTF-8 (ve variantě bez BOM)
  • Jednotlivé řádky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)
  • Údaje v řádku jsou zapsány jako řetězce oddělené čárkou (znak , s UTF-8 kódem U+002C)
  • Uvozovka v textech je zdvojená, tj. místo " je zapsána jako ""