Databáze MOS – otevřená data - dokumentace
Databáze MOS – otevřená data
Databáze MOS obsahuje statistická data za městskou a obecní statistiku. Údaje jsou seskupeny do samostatných ročních souborů a prezentují data za obce od roku 2000 do současnosti. Data se vztahují vždy k aktuálnímu území obce platnému v příslušném roce. Datový soubor za každý rok je po prvním zveřejnění následně ještě jednou aktualizován.
V souborech jsou zastoupeny různé obory statistiky představující tyto okruhy:
- Obecná charakteristika
- Školství
- Zdravotnictví
- Obyvatelstvo
- Byty
- Lázně
- Druhy pozemků
- Sociální oblast
- Ekonomické subjekty
- Cestovní ruch
- Hospodaření obcí
- Sčítání lidu, domů a bytů 1991, 2001, 2011, 2021
- Nezaměstnanost
- Technické a občanské vybavení obcí 2016
Celkový počet ukazatelů v těchto statistických okruzích je 792.
Číselník ukazatelů obsahuje kromě kódu a názvu ukazatele také další informace, včetně zdroje dat a metodického vymezení jednotlivých ukazatelů. Vyskytují se v něm následující zdroje dat:
- ČSÚ – Český statistický úřad
- ČÚZK – Český úřad zeměměřický a katastrální
- GŘ Úřadu práce ČR – Generální ředitelství Úřadu práce ČR
- MFIN ČR – Ministerstvo financí ČR
- MPSV ČR – Ministerstvo práce a sociálních věcí ČR
- MŠMT ČR – Ministerstvo školství, mládeže a tělovýchovy ČR֪
- MV ČR – Ministerstvo vnitra ČR
- ÚZIS – Ústav zdravotnických informací a statistiky ČR
Číselník území této obsahuje historii územních změn. Kromě kódu a názvu obce je uvedena také příslušnost obce k vyššímu správnímu území (SO ORP, okres) v příslušném roce.
Seznam a struktura souborů
1. MOS_DATA_rrrr – datový soubor, kde rrrr je údaj roku
-
ROK - údaj roku
-
KODUKAZ - šestimístný kód ukazatele
-
KODUZEMI - šestimístný kód území
-
HODNOTA - číselný údaj nebo "i.d." pro chráněný údaj
2. MOS_UKAZ – číselník ukazatelů
-
KODUKAZ - šestimístný kód ukazatele
-
NAZEV - název ukazatele
-
MJ - měřicí jednotka
-
PLATIOD - platí od roku
-
PLATIDO - platí do roku
-
OKRUH - dvoumístný kód okruhu
-
ZDROJ - primární zdroj dat (s eventuálním upřesněním)
-
VERIFIKACE_CSU - pokud je uvedeno "ano", ČSÚ data z primárního zdroje zpřesňoval
-
METODIKA - metodické vymezení ukazatele
3. MOS_UZEMI – číselník území
-
KODUZEMI - šestimístní kód obce
-
OBEC - název obce
-
PLATIOD - platí od roku
-
PLATIDO - platí do roku
-
OKRES - název okresu, do kterého obec patří v uvedeném časovém intervalu
-
SOORP - název SO ORP, do kterého obec patří v uvedeném časovém intervalu
4. MOS_OKRUHY – seznam statistických okruhů dat
-
KOD - dvoumístný kód okruhu
-
NAZEV - název okruhu
Soubory jsou ve formátu CSV a splňují standardy otevřených dat, konkrétně tyto požadavky:
-
Soubor CSV má kódování UTF-8 (ve variantě bez BOM)
-
Jednotlivé řádky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)
-
Údaje v řádku jsou zapsány jako řetězce oddělené čárkou (znak , s UTF-8 kódem U+002C)
-
Uvozovka v textech je zdvojená, tj. místo " je zapsána jako ""