Testování statistických hypotéz
Testování hypotéz je statistická metoda, která určuje, jak pravděpodobná jsou naměřená data v případě platnosti hypotézy, kterou testujeme.
Pro testování vždy vytváříme dvě hypotézy. Testovanou, kterou označíme jako nulovou a značíme ji H0 a alternativní, kterou značíme H1. Nulová hypotéza H0 je formulovaná negativně („to, co chceme prokázat, neplatí“) a alternativní hypotéza H1 formulovaná jako neplatnost H0.
Nulová hypotéza H0 bývá formulovaná pomocí rozdělení, nebo pravděpodobnosti…
Cílem testování je H0 zamítnout a přijmout H1.
Obsah |
upravit Příklady formulování hypotéz
- Jev, který chceme prokázat – formulace hypotézy H0.
- Účinek léku A se od léku B liší o „x“ – H0: střední hodnota veličiny účinku léku A a B je stejná.
- Účinek léku je u diabetiků vyšší – H0: střední hodnota veličiny účinku léku a diabetiků a u kontrolní skupiny je stejná.
- Střední doba dožití je po podání léku A vyšší – H0: střední doba dožití je po podání léku A stejná jako u kontrolní skupiny.
- Čím vyšší BMI, tím menší střední doba dožití – H0: střední doba dožití u skupiny s BMI kolem 20 a u skupiny s BMI kolem 35 je stejná.
upravit Testová statistika
K samotnému testování se využívá tzv. testová statistika T. Jedná se o vzorec, funkci dat, která udává, jak pravděpodobná jsou naměřená data, pokud platí nulová hypotéza.
U testování hypotéz nelze testovou statistiku interpretovat jako pravděpodobnost, s níž platí nulová hypotéza na základě naměřených dat. Ve frekvenční statistice jsou totiž populační veličiny, o nichž se formulují hypotézy, konstanty, které jsou neměnné, stálé (a pokud se nezměří celá populace, tak neznámé). Mluvit o jejich pravděpodobnosti proto nemá smysl[† 1]. Naopak, mluví se o pravděpodobnosti naměření naměřených dat za předpokladu platnosti nulové hypotézy. (Testování se tedy provádí svým způsobem naruby.)
upravit Nulové rozdělení
Nulové rozdělení je rozdělení testové statistiky při platnosti H0.
upravit p-hodnota testu
p-hodnota testu (z anglického p value) je pravděpodobnost, že při H0 by testová statistika T nabyla hodnoty, jaká vyšla z dat, nebo hodnoty ještě extrémnější (mimo interval <−T,T>).
upravit Hladina testu
Hladina testu se označuje α. (Nejčastěji α = 0,05 = 5 %). Je to zvolené číslo z intervalu od 0 do 1, resp. 100 % (čím menší, tím lepší). Pokud je p < α, tak platnost H0 je velmi málo pravděpodobné a potom:
Zamítáme H0 na hladině α a přijímáme HA.
Buď H0 platí, ale nastala data, která se objevují s pravděpodobností menší než α (nastalo něco velmi nepravděpodobného), nebo vskutku platí HA, k čemuž se kloníme.
Výsledek testu je pak statisticky významný na hladině α. (Často značeno „*“ pro α = 0,05, „**“ pro α = 0,01 a „***“ pro α = 0,001)
Pokud p ≤ α, pak to neznamená, že zamítáme HA, ale pouze nezamítáme H0. Výsledek je pak statisticky nevýznamný (insignifikantní) na hladině α. (Často značeno „NS“.)
upravit Kritická hodnota testu pro hladinu α
Kritická hodnota testu pro hladinu α je hranice mezi statisticky významnou a nevýznamnou hodnotou testové statistiky T.
Neporovnává se p přímo s α, ale pro α se vypočítá kritická hodnota, s níž se porovná samotné T. Jedná se o ekvivalentní porovnání. (Dříve numericky přístupnější — nebylo nutné počítat kvantily.)
upravit Vztah ke konfidenčním intervalům
Pokud je μ0 v konfidenčním intervalu na hladině spolehlivosti 1−α, pak hypotéza μ = μ0 se nezamítá na hladině α.
Konfidenční interval je složen z hodnot, které test na dané hladině nezamítá.
upravit Statistické chyby
- Chyba prvního typu.
- Chyba druhého typu.
upravit Často používané testy
upravit Odkazy
upravit Související články
- ↑ V tomto spočívá rozdíl mezi frekvenční a bayesovskou statistikou, v níž populační veličiny nejsou konstantní, ale náhodnými veličinami.
upravit Reference
upravit Použitá literatura
- KLASCHKA, Jan. Testování statistických hypotéz [přednáška k předmětu Zdravotnická statistika 1,2, obor Všeobecné lékařství, 1. lékařská fakulta Univerzita Karlova]. Praha. 26.4.2011.