Míry variability
Předmětem statistického výzkumu jsou znaky (vlastnosti). Ty mohou být kvantitativní (lze je vyjádřit číslem), nebo kvalitativní (znak nemá číselný charakter). Kvantitativní znaky můžou být spojité, tedy mohou nabývat libovolné hodnoty z nějakého intervalu (např. výška, hmotnost nebo koncentrace roztoku), nebo diskrétní, tedy mohou nabývat jen vybraných hodnot (např. počet sourozenců, rok narození nebo počet CFU v suspenzi bakterií). Kvalitativní znaky lze pro potřeby dalšího zpracování kódovat číslem, toto číslo však nemusí mít žádný smysl (např. 1=červená, 2=modrá, 3=zelená).
Příklady měr variability jsou variační šíře, mezikvartilové rozpětí, rozptyl, směrodatná odchylka, variační koeficient nebo koeficient disperze. Míry variability hodnotí rozptýlenost hodnot statistického souboru kolem nějaké střední hodnoty.
upravit Variační šíře
Variační šíře je nejjednodušší mírou variability. Počítá se jako rozdíl největší a nejmenší hodnoty souboru:
- R = xmax − xmin
upravit Mezikvartilové rozpětí
Mezikvartilové rozpětí, též mezikvartilová šíře (angl. Interquartile range, zkratka IQR) představuje rozdíl mezi třetím a prvním kvartilem (tedy mezi 75. a 25. percentilem). Reprezentuje tedy oblast hodnot, které má středních 50% hodnot proměnné:
- IQR = q3 − q1
upravit Výběrový rozptyl
Výběrový rozptyl (angl. sample variance, zkratka s2) je poměrně často užívanou mírou variability. Rovná se průměrnému čtverci odchylky hodnoty ze statistického souboru od výběrového průměru. Čím je rozptyl větší, tím více se údaje odchylují od průměru. Nevýhodou je, že výběrový rozptyl nemá stejný fyzikální rozměr jako znaky ze statistického souboru. Výběrový rozptyl se spočítá jako:
Nestranný odhad rozptylu σ2 získáme, pokud místo výběrového rozptylu použijeme tzv. modifikovaný výběrový rozptyl daný vzorcem:
upravit Směrodatná odchylka
Směrodatná odchylka (angl. Standard deviation, zkratka s nebo SD) je nejčastěji používanou mírou variability souboru. Její velkou výhodou ve srovnání s výběrovým rozptylem je to, že má stejný fyzikální rozměr jako střední hodnota. Jde o průměrný rozdíl mezi hodnotami a průměrem při ignorování znamének. Obvykle se používá modifikovaná výběrová směrodatná odchylka jako odmocnina z modifikovaného výběrového průměru:
Výběrová směrodatná odchylka a modifikovaná výběrová směrodatná odchylka jsou v statistických funkcích kalkulaček označovány obvykle jako σn a σn-1
upravit Variační koeficient
Variační koeficient představuje relativní míru variability. Používá se na porovnávání variability mezi soubory dat s odlišnými průměry. Počítá se jako podíl směrodatné odchylky a průměru:
.
upravit Koeficient disperze
Koeficient disperze představuje relativní míru variability, která je jenom málo ovlivněna extrémními hodnotami. Vypočítá se:
.
upravit Odkazy
upravit Související články
upravit Použitá literatura
- GEIZEROVÁ, Helena, et al. Epidemiologie – vybrané kapitoly pro seminární a praktická cvičení. 1. vydání. Praha : Karolinum, 1995. 83 s. ISBN 80-7184-179-X.