Míry variability

Z WikiSkript

Míry variability (rozptýlenosti) vypovídají o tom, jak jsou hodnoty veličiny u jednotlivých prvků souboru vzájemně blízké či vzdálené; [1] hodnotí rozptýlenost hodnot statistického souboru kolem nějaké střední hodnoty. Příklady měr variability jsou variační šíře, mezikvartilové rozpětí, rozptyl, směrodatná odchylka, variační koeficient nebo koeficient disperze.

Variační šíře[✎ upravit | ☲ editovat zdroj]

Variační šíře (neboli rozpětí) je nejjednodušší mírou variability. Počítá se jako rozdíl největší a nejmenší hodnoty souboru:

 R = x_{max} - x_{min}.

Nevýhodou této hodnoty je, že závisí na extrémních hodnotách, může tedy poskytnout velmi zavádějící informaci o daném jevu.

Mezikvartilové rozpětí[✎ upravit | ☲ editovat zdroj]

Mezikvartilové rozpětí, též mezikvartilová šíře (angl. Interquartile range, zkratka IQR) představuje rozdíl mezi třetím a prvním kvartilem (tedy mezi 75. a 25. percentilem). Reprezentuje tedy oblast hodnot, které má středních 50 % hodnot proměnné:

 \mathrm{IQR} = q_{3} - q_{1}

Rozptyl[✎ upravit | ☲ editovat zdroj]

Rozptyl (angl. variance, zkratka s2) je poměrně často užívanou mírou variability. Rovná se průměrnému čtverci odchylky hodnoty ze statistického souboru od aritmetického průměru. Čím je rozptyl větší, tím více se údaje odchylují od průměru. Nevýhodou je, že rozptyl nemá stejný fyzikální rozměr jako znaky ze statistického souboru. Rozptyl se spočítá jako:

s^2_n = \frac 1n \sum_{i=1}^n \left(y_i - \overline{y} \right)^ 2 = \frac{1}{n} \sum_{i=1}^{n}y_i^2 - \overline{y}^2

(druhý uvedený vzorec je vhodnější pro ruční výpočet).

Výše uvedené vzorce pro výpočet rozptylu se používají pouze v popisné statistice k určení variability známého statistického souboru. Pokud však usuzujeme na rozptyl neznámé náhodné veličiny ze (známého) výběrového souboru, je nutné použít pro výpočet vzorec pro tzv. výběrový rozptyl:

s^2=\frac{1}{n-1}\sum_{i=1}^n(x_i-\overline{x})^2=\frac{1}{n-1}\sum_{i=1}^n x_i^2-\frac{n}{n-1}\cdot\overline{x}^2.

Takto vypočtený výběrový rozptyl je nestranným odhadem skutečné hodnoty rozptylu neznámé náhodné veličiny. Užití výběrového rozptylu je ve zdravotnické statistice daleko častější než užití „klasického“ rozptylu (s n ve jmenovateli).

Pojem „nestranný odhad“ znamená, že se takto zjištěný odhad charakteristiky chová statisticky v jistém ohledu dobře.

Směrodatná odchylka[✎ upravit | ☲ editovat zdroj]

Směrodatná odchylka (angl. Standard deviation, zkratka s nebo SD) je nejčastěji používanou mírou variability souboru. Její velkou výhodou ve srovnání s rozptylem je to, že má stejný fyzikální rozměr jako střední hodnota. Obvykle se používá výběrová směrodatná odchylka jako odmocnina z výběrového rozptylu:

s = \sqrt{s^2}

Směrodatná odchylka a výběrová směrodatná odchylka jsou v statistických funkcích kalkulaček označovány obvykle jako σn a σn-1

Variační koeficient[✎ upravit | ☲ editovat zdroj]

Variační koeficient představuje relativní míru variability. Používá se na porovnávání variability mezi soubory dat s odlišnými průměry. Počítá se jako podíl směrodatné odchylky a průměru:

k=\frac{s}{\bar{x}}.

Mediánová absolutní odchylka[✎ upravit | ☲ editovat zdroj]

Mediánová absolutní odchylka (MAD) představuje míru variability, která je jenom málo ovlivněna extrémními hodnotami. Je definována vzorcem

\text{MAD}=\text{medián}(|x_i-\tilde{x}|).

Ve zdravotnické statistice se téměř nepoužívá. CAVE!!! Existuje více typů absolutních a relativních odchylek souvisejících s mediánem či aritmetickým průměrem (např. průměrná absolutní odchylka od mediánu). Vždy je třeba dávat pozor, jakou charakteristiku měl autor na mysli!

Odkazy[✎ upravit | ☲ editovat zdroj]

Související články[✎ upravit | ☲ editovat zdroj]

Použitá literatura[✎ upravit | ☲ editovat zdroj]

  • GEIZEROVÁ, Helena, et al. Epidemiologie – vybrané kapitoly pro seminární a praktická cvičení. 1. vydání. Praha : Karolinum, 1995. 83 s. ISBN 80-7184-179-X.
  • ZVÁROVÁ, Jana. Biomedicínská statistika. Díl 1, Základy statistiky pro biomedicínské obory. 2. vydání. Praha : Karolinum, 2011. ISBN 978-80-246-1931-6.

Reference[✎ upravit | ☲ editovat zdroj]

  1. ŠPUNDA, Miroslav a Jaroslav DUŠEK, et al. Zdravotnická informatika. 1. vydání. Praha : Karolinum, 2007. 194 s. ISBN 978-80-246-1378-9.