Nápověda
Editor knih (vypnout)

Testování statistických hypotéz

Z WikiSkript
Tato revize článku byla z tohoto počítače již nedávno hodnocena!
Hodnoceno 4x, počet editací 15, počet autorů 6   
   Děkujeme za Vaše hodnocení (2★)   
star1-1 star2-1 star3-0 star4-0 star5-0
Přejít na: navigace, hledání

Testování hypotéz je statistická metoda, která určuje, jak pravděpodobná jsou naměřená data v případě platnosti hypotézy, kterou testujeme.

Pro testování vždy vytváříme dvě hypotézy. Testovanou, kterou označíme jako nulovou a značíme ji H0 a alternativní, kterou značíme H1. Nulová hypotéza H0 je formulovaná negativně („to, co chceme prokázat, neplatí“) a alternativní hypotéza H1 formulovaná jako neplatnost H0.

Nulová hypotéza H0 bývá formulovaná pomocí rozdělení, nebo pravděpodobnosti…

Cílem testování je H0 zamítnout a přijmout H1.

Obsah

upravit upravit Příklady formulování hypotéz

upravit upravit Testová statistika

K samotnému testování se využívá tzv. testová statistika T. Jedná se o vzorec, funkci dat, která udává, jak pravděpodobná jsou naměřená data, pokud platí nulová hypotéza.

CAVE!!! U testování hypotéz nelze testovou statistiku interpretovat jako pravděpodobnost, s níž platí nulová hypotéza na základě naměřených dat. Ve frekvenční statistice jsou totiž populační veličiny, o nichž se formulují hypotézy, konstanty, které jsou neměnné, stálé (a pokud se nezměří celá populace, tak neznámé). Mluvit o jejich pravděpodobnosti proto nemá smysl[† 1]. Naopak, mluví se o pravděpodobnosti naměření naměřených dat za předpokladu platnosti nulové hypotézy. (Testování se tedy provádí svým způsobem naruby.)

upravit upravit Nulové rozdělení

Nulové rozdělení je rozdělení testové statistiky při platnosti H0.

upravit upravit p-hodnota testu

p-hodnota testu (z anglického p value) je pravděpodobnost, že při H0 by testová statistika T nabyla hodnoty, jaká vyšla z dat, nebo hodnoty ještě extrémnější (mimo interval <−T,T>).

upravit upravit Hladina testu

Hladina testu se označuje α. (Nejčastěji α = 0,05 = 5 %). Je to zvolené číslo z intervalu od 0 do 1, resp. 100 % (čím menší, tím lepší). Pokud je p < α, tak platnost H0 je velmi málo pravděpodobné a potom:

Zamítáme H0 na hladině α a přijímáme HA.

Buď H0 platí, ale nastala data, která se objevují s pravděpodobností menší než α (nastalo něco velmi nepravděpodobného), nebo vskutku platí HA, k čemuž se kloníme.

Výsledek testu je pak statisticky významný na hladině α. (Často značeno „*“ pro α = 0,05, „**“ pro α = 0,01 a „***“ pro α = 0,001)


CAVE!!! Pokud p ≤ α, pak to neznamená, že zamítáme HA, ale pouze nezamítáme H0. Výsledek je pak statisticky nevýznamný (insignifikantní) na hladině α. (Často značeno „NS“.)

upravit upravit Kritická hodnota testu pro hladinu α

Kritická hodnota testu pro hladinu α je hranice mezi statisticky významnou a nevýznamnou hodnotou testové statistiky T.

Neporovnává se p přímo s α, ale pro α se vypočítá kritická hodnota, s níž se porovná samotné T. Jedná se o ekvivalentní porovnání. (Dříve numericky přístupnější — nebylo nutné počítat kvantily.)

upravit upravit Vztah ke konfidenčním intervalům

Pokud je μ0 v konfidenčním intervalu na hladině spolehlivosti 1−α, pak hypotéza μ = μ0 se nezamítá na hladině α.

Konfidenční interval je složen z hodnot, které test na dané hladině nezamítá.

upravit upravit Statistické chyby

upravit upravit Často používané testy


upravit upravit Odkazy

upravit upravit Související články

  1. V tomto spočívá rozdíl mezi frekvenční a bayesovskou statistikou, v níž populační veličiny nejsou konstantní, ale náhodnými veličinami.

upravit upravit Reference

upravit upravit Použitá literatura

upravit upravit Doporučená literatura

Osobní nástroje
Jmenné prostory
Varianty
Akce
Navigace
Portály
Vypracované otázky
Nástroje
Tisk a PDF