Míry polohy
Míry polohy jsou parametry popisné statistiky, které se týkají hodnocení kvantitativních znaků. Charakterizují cosi jako „střední hodnotu“ náhodného výběru a často tak odhadují skutečnou střední hodnotu popisované náhodné veličiny. Patří mezi ně výběrový aritmetický průměr, výběrový geometrický průměr, výběrový medián a modus. Dalšími mírami polohy, které se týkají popisu i jiných hodnot než středních, jsou kvantily.
Mohou udávat hodnoty, které sama náhodná veličina ani nenabývá. (Např. „Průměrně onemocní nějakou chorobou 13,48 pacienta za rok.“) Přesto mají důležitou výpovědní hodnotu o tom, jak se náhodná veličina asi tak chová.
Obsah |
upravit Výběrový aritmetický průměr
Výběrový aritmetický průměr (
)
je nejznámější odhad střední hodnoty, počítá se jako součet všech hodnot vydělených jejich počtem:
Výhodami aritmetického průměru jsou především snadný výpočet a názorný význam. V případě, že má soubor Gaussovo rozdělení nebo pokud jde o velký počet výběrů (měření) ze souboru, na jehož rozdělení jsou kladeny poměrně mírné požadavky, (centrální limitní věta říká, že soubor výsledků náhodných výběrů z takového souboru bude mít rozdělení, které se bude blížit Gaussovu rozdělení), je výběrový aritmetický průměr konzistentním nestranným odhadem střední hodnoty. Nevýhodou je především značná citlivost výsledku na odlehlé hodnoty, např. přežije-li po nějaké terapii dvacet pacientů měsíc a jeden pacient přežije třicet let, je průměrné přežití zhruba rok a půl a terapie se může jen podle tohoto výsledku jevit jako úspěšná. Další nevýhodou je to, že u asymetricky rozložených dat nemá aritmetický průměr velký smysl.
upravit Výběrový geometrický průměr
Geometrický průměr (xG) je vhodnější alternativou aritmetického průměru tehdy, když chceme vyjádřit hodnoty poměrové proměnné – tedy takové, která je výsledkem spíše součinu nežli součtu mnohých malých efektů. Je lepším odhadem střední hodnoty u dat s tzv. logaritmicko-normálním rozdělením (tím lze popsat například rozdělení platů nebo rozdělení stáří krvinek).
- Geometrický průměr řady n kladných hodnot xi je definován jako n-tá odmocnina ze součinu všech hodnot
Pokud vycházejí hodnoty tak nízké, že by zanikly, je vhodné původní hodnoty logaritmovat:
Geometrický průměr se pak spočítá podle vztahu:
upravit Výběrový medián
Výběrový medián (
) představuje prostřední hodnotu náhodného souboru, který je seřazen od nejmenší hodnoty po největší. V případě sudého počtu hodnot je medián aritmetickým průměrem hodnot na dvou prostředních místech. (V náhodném výběru čísel 1, 4, 2, 8, 11, který seřadíme jako 1, 2, 4, 8, 11 bude výběrový medián roven 4. V náhodném výběru 1, 2, 4, 8, 11, 371 to bude průměr z 4 a 8, tedy 6.) Je to konzistentní (ale nikoliv nestranný) odhad skutečného mediánu náhodné veličiny. Není tak citlivý na odlehlé hodnoty jako výběrový průměr.
upravit Modus
Modus (
) představuje nejčastěji se vyskytující hodnotu proměnné. (V souboru čísel 2, 3, 5, 1, 5, 3, 7, 5 bude modus číslo 5.) Někdy se dá použít také pro kvalitativní znaky (např. krevní skupiny).
upravit Výběrové kvantily
Výběrové kvantily rozdělují soubor (náhodný výběr) hodnot na definované díly. Jsou přirozeným zobecněním mediánu.
- 100p% kvantil xp je číslo, které odděluje 100p % nejmenších hodnot znaku.(Např. v souboru čísel 3, 4, 6, 7, 9 je dvacetipětiprocentním kvantilem číslo 4, protože 25 % čísel má nižší hodnotu.)
- percentil x0,01 je hodnota, pod kterou leží 1 % hodnot (1. percentil). Percentily tedy rozdělují soubor na 100 částí.(Při použití předchozího příkladu leží pouze číslo 3 pod dvacátým pátým percentilem, kterým je číslo 4. 25% kvantil je tedy 25. percentil.)
Některé kvantily mají speciální názvy:
- Decily rozdělují soubor na 10 částí. (x0,1 – první decil – je 10. percentil)
- Kvartily rozdělují soubor na 4 části. (x0,25 – první kvartil – je 25. percentil)
- Medián je tedy druhý kvartil resp. padesátý percentil.
upravit Odkazy
upravit Související články
upravit Externí odkazy
- Výběr a popisné statistiky, Euromise
- Popisné charakteristiky statistických souborů
- Interaktivní sbírka úloh ze statistiky, Karel Hrach, FSE UJEP Ústí nad Labem, 2003
upravit Literatura
- GEIZEROVÁ, Helena, et al. Epidemiologie – vybrané kapitoly pro seminární a praktická cvičení. 1. vydání. Praha : Karolinum, 1995. 83 s. ISBN 80-7184-179-X.