STATISTICKÁ METODA

 

 
Cílem této publikace je s pomocí vybrané statistické metody kvantifikovat postavení obcí Libereckého kraje v období let 2000 – 2005 ve čtyřech oblastech – demografické, sociální, ekonomické a v oblasti životního prostředí.

Pro kvantifikaci postavení obcí kraje byla zvolena bodová metoda.

Původně bylo navrženo velké množství ukazatelů za jednotlivé sledované oblasti. Vhodnost těchto ukazatelů byla konzultována nejen pracovníky ČSÚ v Liberci a v Praze, ale i s pracovníky Krajského úřadu Libereckého kraje a Agentury regionálního rozvoje, spol. s r.o. Na základě této diskuse byl značný počet ukazatelů z rozličných důvodů vyloučen. Zbývající počet přibližně 65 ukazatelů byl naplněn daty za všechny obce Libereckého kraje a podroben testování na korelační vazby mezi ukazateli napříč čtyřmi vybranými okruhy.

Pro výpočet korelačních koeficientů byla použita funkce MS Excel =CORREL(pole1;pole2).
Vzorec - korelační koeficient


Tab. 1 Korelační koeficienty ukazatelů za demografickou oblast
D1
D2
D3
D4
D5
D6
D7
D1
0,11
-0,06
-0,11
0,01
0,09
-0,17
D2
0,11
0,00
-0,57
-0,18
-0,13
0,11
D3
-0,06
0,00
0,12
-0,09
0,43
0,36
D4
-0,11
-0,57
0,12
0,28
0,14
-0,06
D5
0,01
-0,18
-0,09
0,28
0,16
-0,12
D6
0,09
-0,13
0,43
0,14
0,16
-0,03
D7
-0,17
0,11
0,36
-0,06
-0,12
-0,03
Na základě tohoto testování byly vylučovány z dalšího statistického zpracování především ukazatele, u nichž korelační koeficient v absolutní hodnotě přesáhl hodnotu 0,80. U více obdobných ukazatelů rozhodovalo, který z nich se častěji používá v praxi, jaká je dostupnost dat k jeho naplnění a jakou má vypovídací hodnotu (metodická přesnost výpočtu, schopnost věrohodně zachytit sledovaný jev). Vyřazování byly podrobeny jak ukazatele ze stejných oblastí, tak ukazatele vykazující silnou závislost napříč sledovanými oblastmi. S ohledem na významnost a jedinečnost však byly pro další statistické zpracovaní ponechány dva ukazatele z ekonomické oblasti, které vykazují silnou nepřímou závislost (korelační koeficient odpovídá hodnotě -0,83), a to bonita zemědělské půdy a podíl výměry méně příznivých oblastí (LFA) na celkové výměře.

Korelační analýza připravených ukazatelů ukázala i na množství vazeb, které znamenají mírnou přímou či nepřímou závislost mezi sledovanými indikátory (korelační koeficient dosáhl absolutní hodnoty v intervalu od 0,40 do 0,79).
 
Tab. 2 Korelační koeficienty ukazatelů za sociální oblast
S1
S2
S3
S4
S5
S6
S7
S8
S9
S10
S11
S12
S13
S14
S15
S16
S1
-0,11
0,12
-0,07
0,15
-0,17
-0,05
-0,12
-0,03
-0,02
0,15
0,06
-0,02
0,03
0,04
-0,07
S2
-0,11
-0,33
-0,27
-0,07
-0,03
-0,02
-0,01
-0,05
0,02
0,00
0,04
0,03
0,09
0,16
0,01
S3
0,12
-0,33
0,12
0,06
0,11
0,02
-0,17
-0,17
-0,14
0,18
0,05
-0,07
-0,08
-0,07
0,21
S4
-0,07
-0,27
0,12
0,03
-0,17
0,12
0,00
0,06
0,02
-0,04
-0,14
0,00
0,04
-0,13
-0,06
S5
0,15
-0,07
0,06
0,03
-0,25
-0,01
0,20
0,23
0,20
-0,14
-0,01
-0,27
-0,06
0,01
-0,41
S6
-0,17
-0,03
0,11
-0,17
-0,25
-0,23
-0,19
-0,13
-0,18
0,18
0,00
0,05
-0,11
-0,32
0,30
S7
-0,05
-0,02
0,02
0,12
-0,01
-0,23
0,03
-0,04
-0,10
0,12
-0,12
-0,17
-0,02
0,00
-0,01
S8
-0,12
-0,01
-0,17
0,00
0,20
-0,19
0,03
0,53
0,46
-0,60
0,12
0,12
0,10
0,24
-0,40
S9
-0,03
-0,05
-0,17
0,06
0,23
-0,13
-0,04
0,53
0,61
-0,44
0,01
0,07
0,06
0,14
-0,44
S10
-0,02
0,02
-0,14
0,02
0,20
-0,18
-0,10
0,46
0,61
-0,47
0,04
0,10
0,04
0,21
-0,46
S11
0,15
0,00
0,18
-0,04
-0,14
0,18
0,12
-0,60
-0,44
-0,47
0,00
-0,20
-0,14
-0,32
0,43
S12
0,06
0,04
0,05
-0,14
-0,01
0,00
-0,12
0,12
0,01
0,04
0,00
0,05
0,23
0,15
0,11
S13
-0,02
0,03
-0,07
0,00
-0,27
0,05
-0,17
0,12
0,07
0,10
-0,20
0,05
0,03
0,08
0,04
S14
0,03
0,09
-0,08
0,04
-0,06
-0,11
-0,02
0,10
0,06
0,04
-0,14
0,23
0,03
0,14
-0,06
S15
0,04
0,16
-0,07
-0,13
0,01
-0,32
0,00
0,24
0,14
0,21
-0,32
0,15
0,08
0,14
-0,25
S16
-0,07
0,01
0,21
-0,06
-0,41
0,30
-0,01
-0,40
-0,44
-0,46
0,43
0,11
0,04
-0,06
-0,25
 
Některé z těchto mírně závislých ukazatelů byly na základě výsledků korelační analýzy vyloučeny, určité množství jich však bylo do další části zpracování zahrnuto. Důvodem začlenění těchto indikátorů byla mimo jiné skutečnost, že pro hodnocení regionálních rozdílů do úrovně obcí se nabízí pouze omezené množství možných ukazatelů a potřebných dat.

Těsnost ukazatelů nemusí být brána jako překážka v objektivním hodnocení, naopak ji lze využít ke sledování vazeb mezi jednotlivými indikátory. I když významově a obsahově mohou postrádat závislost, jejich úroveň může spolu zprostředkovaně souviset.

Provázanost jednotlivých ukazatelů můžeme zjednodušeně demonstrovat např. na ukazateli hustota obyvatelstva. Tento ukazatel pozitivně koreluje s počtem spojů zajištěných veřejnou dopravou v sobotu a s podílem trvale obydlených domů napojených na plyn a kanalizační síť a vzájemně tyto ukazatele korelují i mezi sebou.

Tab. 3 Korelační koeficienty ukazatelů za ekonomickou oblast

E1
E2
E3
E4
E5
E6
E7
E8
E9
E10
E11
E12
E13
E14
E15
E16
E17
E18
E1
-0,32
-0,03
-0,10
-0,03
0,08
-0,36
0,02
-0,27
0,03
-0,06
-0,37
0,02
-0,17
-0,46
0,07
-0,06
0,19
E2
-0,32
0,02
0,21
0,25
0,03
0,44
0,11
0,10
0,13
0,12
0,20
-0,06
-0,17
0,37
-0,15
0,11
-0,19
E3
-0,03
0,02
0,36
-0,16
0,22
0,12
0,25
0,14
0,03
0,37
0,24
-0,16
-0,06
0,14
-0,20
0,20
0,06
E4
-0,10
0,21
0,36
0,06
0,06
0,32
0,34
0,12
-0,01
0,24
0,22
-0,22
-0,21
0,23
-0,09
0,09
0,09
E5
-0,03
0,25
-0,16
0,06
-0,10
0,16
0,16
0,10
0,16
0,00
0,08
-0,03
-0,07
0,05
0,04
-0,10
-0,12
E6
0,08
0,03
0,22
0,06
-0,10
-0,03
0,02
-0,04
0,00
0,02
0,05
0,00
0,08
0,03
-0,11
0,11
0,01
E7
-0,36
0,44
0,12
0,32
0,16
-0,03
0,47
0,15
0,23
0,11
0,33
-0,09
-0,03
0,41
0,00
-0,04
-0,15
E8
0,02
0,11
0,25
0,34
0,16
0,02
0,47
0,09
0,16
0,12
0,04
-0,06
-0,14
0,08
-0,07
0,03
-0,03
E9
-0,27
0,10
0,14
0,12
0,10
-0,04
0,15
0,09
0,36
0,09
0,20
-0,03
0,01
0,13
-0,11
0,14
0,01
E10
0,03
0,13
0,03
-0,01
0,16
0,00
0,23
0,16
0,36
0,13
-0,04
-0,07
-0,20
0,04
-0,01
0,00
0,00
E11
-0,06
0,12
0,37
0,24
0,00
0,02
0,11
0,12
0,09
0,13
0,03
-0,32
-0,27
0,11
0,02
-0,05
-0,07
E12
-0,37
0,20
0,24
0,22
0,08
0,05
0,33
0,04
0,20
-0,04
0,03
-0,33
0,05
0,39
-0,17
0,13
0,04
E13
0,02
-0,06
-0,16
-0,22
-0,03
0,00
-0,09
-0,06
-0,03
-0,07
-0,32
-0,33
0,28
-0,10
-0,10
0,11
-0,12
E14
-0,17
-0,17
-0,06
-0,21
-0,07
0,08
-0,03
-0,14
0,01
-0,20
-0,27
0,05
0,28
0,06
-0,02
0,01
-0,02
E15
-0,46
0,37
0,14
0,23
0,05
0,03
0,41
0,08
0,13
0,04
0,11
0,39
-0,10
0,06
-0,29
0,19
-0,13
E16
0,07
-0,15
-0,20
-0,09
0,04
-0,11
0,00
-0,07
-0,11
-0,01
0,02
-0,17
-0,10
-0,02
-0,29
-0,83
-0,08
E17
-0,06
0,11
0,20
0,09
-0,10
0,11
-0,04
0,03
0,14
0,00
-0,05
0,13
0,11
0,01
0,19
-0,83
0,03
E18
0,19
-0,19
0,06
0,09
-0,12
0,01
-0,15
-0,03
0,01
0,00
-0,07
0,04
-0,12
-0,02
-0,13
-0,08
0,03
 
Tab. 4 Korelační koeficienty ukazatelů za oblast životního prostředí
ŽP1
ŽP2
ŽP3
ŽP4
ŽP5
ŽP6
ŽP7a
ŽP7b
ŽP8
ŽP9
ŽP10
ŽP11
ŽP12
ŽP13
ŽP14
ŽP1
-0,17
-0,04
-0,13
0,05
-0,12
0,34
-0,08
-0,13
0,16
-0,06
0,01
-0,08
0,07
-0,10
ŽP2
-0,17
0,46
0,30
-0,14
0,05
-0,04
0,00
0,23
-0,25
-0,04
-0,29
0,22
0,11
0,21
ŽP3
-0,04
0,46
0,30
-0,05
0,01
0,11
-0,10
0,25
-0,09
-0,05
-0,13
0,16
0,06
0,36
ŽP4
-0,13
0,30
0,30
-0,21
0,04
-0,02
-0,05
0,17
-0,13
-0,03
-0,12
0,07
-0,04
0,17
ŽP5
0,05
-0,14
-0,05
-0,21
0,29
0,01
-0,09
-0,08
0,04
-0,13
0,19
-0,28
-0,10
-0,09
ŽP6
-0,12
0,05
0,01
0,04
0,29
0,09
0,03
0,14
-0,20
-0,03
0,07
-0,28
-0,06
0,05
ŽP7a
0,34
-0,04
0,11
-0,02
0,01
0,09
-0,31
-0,03
0,08
0,05
-0,03
-0,12
-0,13
0,07
ŽP7b
-0,08
0,00
-0,10
-0,05
-0,09
0,03
-0,31
-0,05
-0,09
-0,13
0,09
0,10
0,13
-0,05
ŽP8
-0,13
0,23
0,25
0,17
-0,08
0,14
-0,03
-0,05
-0,50
0,27
-0,21
0,15
-0,17
0,28
ŽP9
0,16
-0,25
-0,09
-0,13
0,04
-0,20
0,08
-0,09
-0,50
-0,04
0,23
-0,03
0,11
-0,01
ŽP10
-0,06
-0,04
-0,05
-0,03
-0,13
-0,03
0,05
-0,13
0,27
-0,04
-0,41
0,00
-0,06
0,14
ŽP11
0,01
-0,29
-0,13
-0,12
0,19
0,07
-0,03
0,09
-0,21
0,23
-0,41
-0,16
0,02
-0,17
ŽP12
-0,08
0,22
0,16
0,07
-0,28
-0,28
-0,12
0,10
0,15
-0,03
0,00
-0,16
0,27
0,11
ŽP13
0,07
0,11
0,06
-0,04
-0,10
-0,06
-0,13
0,13
-0,17
0,11
-0,06
0,02
0,27
-0,13
ŽP14
-0,10
0,21
0,36
0,17
-0,09
0,05
0,07
-0,05
0,28
-0,01
0,14
-0,17
0,11
-0,13
 
Dalším strategickým krokem při použití statistické metody bylo rozhodnutí o počtu intervalů a tím i množství přidělených bodů v rámci bodové metody. Toto rozhodnutí bylo pro další postup práce velmi důležité, a proto mu byla věnována velká pozornost. Bylo zřejmé, že při určování počtu intervalů, do kterých se hodnoty ukazatelů roztřídí, bude nutné potlačit náhodné kolísání četností a zároveň zachovat charakteristické rysy rozdělení. Současně by počet intervalů neměl být příliš malý a ani příliš velký. Příliš malý počet intervalů by mohl vést k nepřehlednému rozdělení, ve kterém by nevynikly zákonitosti charakteristické pro daný soubor.

Na stanovení počtu intervalů a jejich délku však neexistuje jednotný názor, a proto konečné stanovení počtu intervalů nebylo snadné.

Při velkém rozsahu náhodného výběru je doporučeno zvolit počet intervalů podle potřeby v rozsahu mezi 5 a 20. Jednou z doporučovaných metod vhodných pro určování počtu intervalů je Sturgesovo pravidlo, podle kterého lze počet intervalů vypočítat jako: k = 1 + 3,3 x log n. V našem případě, kdy n odpovídá počtu obcí Libereckého kraje, tedy 215, vychází výsledný počet intervalů na 8,7. Dalším z faktorů, který ovlivnil rozhodování o konečném počtu intervalů, byl strategický záměr zakreslit všechny vybrané ukazatele do názorných kartogramů. S ohledem na možnosti použitého softwaru byl nakonec počet intervalů snížen tedy na šest.

Konkrétní hranice intervalů pak byly zpravidla vytyčeny pomocí jednoduché metody, kdy hodnota variačního rozpětí (maximální mínus minimální hodnota ukazatele) byla vydělena počtem stanovených intervalů, tj. v našem případě šesti. Výsledné číslo, po zaokrouhlení nahoru (podle velikosti čísla na desítky, stovky, ale i jednotky), udává šířku intervalu. S ohledem na rozdělení některých ukazatelů však byla výsledná škála podle potřeb upravena.
 

GRAF - Rozložení výsledné hodnoty ukazatele "Přírůstek stěhováním na 1 000 obyvatel  v letech 2000 - 2005" mezi 215 obcemi Libereckého kraje
 
Většina sledovaných ukazatelů dosahovala svých optimálních hodnot v maximu. Jen málo z hodnocených ukazatelů bylo optimální ve svém minimu. Stanovení optim však bylo nezbytné pro přidělení bodů jednotlivým obcím rozdělených v intervalech podle dosažených výsledných hodnot. Obce zařazené v nejlepším intervalu (z pohledu optima) získaly v rámci bodové metody 6 bodů a v nejhorším vždy 1 bod. V každém případě tak byla obec obodována v rozmezí od 1 do 6 bodů.

Výsledný počet získaných bodů byl za jednotlivé obce sečten v každé ze sledovaných oblastí. Obec, která tak získala nejvíce bodů v dané oblasti, se stala nejlépe hodnocenou. Celkový počet získaných bodů za jednotlivé obce byl dále analyzován a mimo jiné opět rozdělen do šesti intervalů a výsledné souhrnné hodnocení zobrazeno pomocí kartogramu.

Posledním krokem této statistické metody byl přepočet bodů získaných jednotlivými obcemi v každé z oblastí na jeden ukazatel (celkový počet bodů děleno počet ukazatelů v dané oblasti). Výsledné hodnoty za všechny obce Libereckého kraje pak byly shrnuty do jedné závěrečné tabulky, která umožňuje celkové hodnocení regionálních rozdílů obcí Libereckého kraje v demografické, sociální a ekonomické oblasti, ale i v oblasti životního prostředí.