Míry variability

Z WikiSkript
Tato revize článku byla z tohoto počítače již nedávno hodnocena!
Hodnoceno 3x, počet editací 54, počet autorů 14   
   Děkujeme za Vaše hodnocení (3★)   
star1-1 star2-1 star3-1 star4-0 star5-0
Přejít na: navigace, hledání

Předmětem statistického výzkumu jsou znaky (vlastnosti). Ty mohou být kvantitativní (lze je vyjádřit číslem), nebo kvalitativní (znak nemá číselný charakter). Kvantitativní znaky můžou být spojité, tedy mohou nabývat libovolné hodnoty z nějakého intervalu (např. výška, hmotnost nebo koncentrace roztoku), nebo diskrétní, tedy mohou nabývat jen vybraných hodnot (např. počet sourozenců, rok narození nebo počet CFU v suspenzi bakterií). Kvalitativní znaky lze pro potřeby dalšího zpracování kódovat číslem, toto číslo však nemusí mít žádný smysl (např. 1=červená, 2=modrá, 3=zelená).

Příklady měr variability jsou variační šíře, mezikvartilové rozpětí, rozptyl, směrodatná odchylka, variační koeficient nebo koeficient disperze. Míry variability hodnotí rozptýlenost hodnot statistického souboru kolem nějaké střední hodnoty.

upravit upravit Variační šíře

Variační šíře je nejjednodušší mírou variability. Počítá se jako rozdíl největší a nejmenší hodnoty souboru:

R = xmaxxmin

upravit upravit Mezikvartilové rozpětí

Mezikvartilové rozpětí, též mezikvartilová šíře (angl. Interquartile range, zkratka IQR) představuje rozdíl mezi třetím a prvním kvartilem (tedy mezi 75. a 25. percentilem). Reprezentuje tedy oblast hodnot, které má středních 50% hodnot proměnné:

IQR = q3q1

upravit upravit Výběrový rozptyl

Výběrový rozptyl (angl. sample variance, zkratka s2) je poměrně často užívanou mírou variability. Rovná se průměrnému čtverci odchylky hodnoty ze statistického souboru od výběrového průměru. Čím je rozptyl větší, tím více se údaje odchylují od průměru. Nevýhodou je, že výběrový rozptyl nemá stejný fyzikální rozměr jako znaky ze statistického souboru. Výběrový rozptyl se spočítá jako:

s^2_n = \frac 1n \sum_{i=1}^n \left(y_i - \overline{y} \right)^ 2 = \left(\frac{1}{n} \sum_{i=1}^{n}y_i^2\right) - \overline{y}^2,

Nestranný odhad rozptylu σ2 získáme, pokud místo výběrového rozptylu použijeme tzv. modifikovaný výběrový rozptyl daný vzorcem:

s^2 = \frac{1}{n-1} \sum_{i=1}^n\left( y_i - \overline{y} \right)^2 = \frac{1}{n-1} \left( \sum_{i=1}^n y_i^2 - n \cdot \overline{y}^2 \right)


Pojem „nestranný odhad“ znamená, že se takto zjištěný odhad charakteristiky chová statisticky v jistém ohledu dobře.


upravit upravit Směrodatná odchylka

Směrodatná odchylka (angl. Standard deviation, zkratka s nebo SD) je nejčastěji používanou mírou variability souboru. Její velkou výhodou ve srovnání s výběrovým rozptylem je to, že má stejný fyzikální rozměr jako střední hodnota. Jde o průměrný rozdíl mezi hodnotami a průměrem při ignorování znamének. Obvykle se používá modifikovaná výběrová směrodatná odchylka jako odmocnina z modifikovaného výběrového průměru:

s = \sqrt{s^2}

Výběrová směrodatná odchylka a modifikovaná výběrová směrodatná odchylka jsou v statistických funkcích kalkulaček označovány obvykle jako σn a σn-1

upravit upravit Variační koeficient

Variační koeficient představuje relativní míru variability. Používá se na porovnávání variability mezi soubory dat s odlišnými průměry. Počítá se jako podíl směrodatné odchylky a průměru:

k=\frac{s}{\bar{x}}.

upravit upravit Koeficient disperze

Koeficient disperze představuje relativní míru variability, která je jenom málo ovlivněna extrémními hodnotami. Vypočítá se:

d=\frac{\frac1n\sum\limits_{i=1}^n |x_i-\tilde{x}|}{\tilde{x}}.

upravit upravit Odkazy

upravit upravit Související články

upravit upravit Použitá literatura

Osobní nástroje
Jmenné prostory
Varianty
Akce
Navigace
Portály
Vypracované otázky
Nástroje
Tisk a PDF