Databáze MOS – otevřená data - dokumentace

 

Databáze MOS – otevřená data

Databáze MOS obsahuje statistická data za městskou a obecní statistiku. Údaje jsou seskupeny do samostatných ročních souborů a prezentují data za obce od roku 2000 do současnosti. Data se vztahují vždy k aktuálnímu území obce platnému v příslušném roce. Datový soubor za každý rok je po prvním zveřejnění následně ještě jednou  aktualizován.

V souborech jsou zastoupeny různé obory statistiky představující tyto okruhy:

  • Obecná charakteristika
  • Školství
  • Zdravotnictví
  • Obyvatelstvo
  • Byty
  • Lázně
  • Druhy pozemků
  • Sociální oblast
  • Ekonomické subjekty
  • Cestovní ruch
  • Hospodaření obcí
  • Sčítání lidu, domů a bytů 1991, 2001, 2011, 2021
  • Nezaměstnanost
  • Technické a občanské vybavení obcí 2016

Celkový počet ukazatelů v těchto statistických okruzích je 792.

Číselník ukazatelů obsahuje kromě kódu a názvu ukazatele také další informace, včetně zdroje dat a metodického vymezení jednotlivých ukazatelů. Vyskytují se v něm následující zdroje dat:

  • ČSÚ – Český statistický úřad
  • ČÚZK – Český úřad zeměměřický a katastrální
  • GŘ Úřadu práce ČR – Generální ředitelství Úřadu práce ČR
  • MFIN ČR – Ministerstvo financí ČR
  • MPSV ČR – Ministerstvo práce a sociálních věcí ČR
  • MŠMT ČR – Ministerstvo školství, mládeže a tělovýchovy ČR֪
  • MV ČR – Ministerstvo vnitra ČR
  • ÚZIS – Ústav zdravotnických informací a statistiky ČR

Číselník území této obsahuje historii územních změn. Kromě kódu a názvu obce je uvedena také příslušnost obce k vyššímu správnímu území (SO ORP, okres) v příslušném roce.

Seznam a struktura souborů

1.       MOS_DATA_rrrr – datový soubor, kde rrrr je údaj roku

  • ROK - údaj roku
  • KODUKAZ - šestimístný kód ukazatele
  • KODUZEMI - šestimístný kód území
  • HODNOTA - číselný údaj nebo  "i.d." pro chráněný údaj

2.       MOS_UKAZ – číselník ukazatelů

  • KODUKAZ - šestimístný kód ukazatele
  • NAZEV - název ukazatele
  • MJ - měřicí jednotka
  • PLATIOD - platí od roku
  • PLATIDO - platí do roku
  • OKRUH - dvoumístný kód okruhu
  • ZDROJ - primární zdroj dat (s eventuálním upřesněním)
  • VERIFIKACE_CSU - pokud je uvedeno "ano", ČSÚ data z primárního zdroje zpřesňoval
  • METODIKA - metodické vymezení ukazatele

3.       MOS_UZEMI – číselník území

  • KODUZEMI - šestimístní kód obce
  • OBEC - název obce
  • PLATIOD - platí od roku
  • PLATIDO - platí do roku
  • OKRES - název okresu, do kterého obec patří v uvedeném časovém intervalu
  • SOORP - název SO ORP, do kterého obec patří v uvedeném časovém intervalu

4.       MOS_OKRUHY – seznam statistických okruhů dat

  • KOD - dvoumístný kód okruhu
  • NAZEV - název okruhu

Soubory jsou ve formátu CSV a splňují standardy otevřených dat, konkrétně tyto požadavky:

  • Soubor CSV má kódování UTF-8 (ve variantě bez BOM)
  • Jednotlivé řádky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)
  • Údaje v řádku jsou zapsány jako řetězce oddělené čárkou (znak , s UTF-8 kódem U+002C)
  • Uvozovka v textech je zdvojená, tj. místo " je zapsána jako ""