Studentův t-test

From WikiSkripta

Studentův t-test je často používaná metoda testování statistických hypotéz. V závislosti na situaci, kdy se používá, se rozlišuje:

  • jednovýběrový t-test, který slouží k porovnání střední hodnoty μ s konstantou (H0: μ = μ0);
  • dvouvýběrový (nepárový) t-test, který slouží k porovnání střední hodnoty μ1 jedné skupiny se střední hodnotou μ2 jiné skupiny (H0: μ1 − μ2 = konst);
např. střední hodnota systolického tlaku u kuřáků a nekuřáků;
nebo střední hodnota systolického tlaku u skupiny, která bere placebo, a skupiny, která bere β-blokátory
  • párový t-test, který slouží k porovnání středních hodnot mezi prvními a druhými prvky uspořádaných dvojic (H0: μ1 − μ2 = konst).
např. střední hodnota systolického tlaku u kuřáků před ukončením kouření a po ukončení kouření;
nebo střední hodnota hladiny oxytocinu v krvi u matek a u jejich dětí

Jednovýběrový Studentův t-test[edit | edit source]

Jednovýběrový t-test je praxi méně často používaný než dvouvýběrový a párový, ale didaktičtější.

Data[edit | edit source]

Máme data x1, …, xn ~ N(μ, σ2). Z nich získáme výběrový průměr a výběrovou směrodatnou odchylku .

Hypotézy[edit | edit source]

  • H0: μ = μ0 (konstanta)
  • HA: μ ≠ μ0 (oboustranná alternativa; jednostranné: μ < μ0, μ > μ0)

Nulové rozdělení[edit | edit source]

tn−1 (Studentovo s n−1 stupni volnosti)

Testová statistika[edit | edit source]

Kritická hodnota testu pro hladinu α[edit | edit source]

tn−1, 1−α/2[† 1]

Výpočetní technika[edit | edit source]

  • Program STATISTICA: StatistikyZákladní statistikyt-test, samostatný vzorek
  • Program EXCEL:
    1. Je nutné použít párový t-test, jako data do páru je nutné vytvořit sloupec s testovanou konstantou
    2. NástrojeDoplňkyAnalýza dat (zaškrtnout)
    3. NástrojeAnalýza datDvouvýběrový párový studentův test na střední hodnotu
    CAVE!!! V české verzi je nutné dát pozor na parametr stupně volnosti, který je špatně přeložen jako rozdíl.

Dvouvýběrový Studentův t-test[edit | edit source]

Data

, směrodatná odchylka

, směrodatná dochylka

Nulová hypotéza

H0: μ1 = μ2 (obecněji H0: μ1 − μ2 = konstanta)

Alternativní hypotéza
  • HA: μ1 ≠ μ2 (oboustranná alternativa)
  • HA: μ1 > μ2; μ1 < μ2 (jednostranná alternativa)
Používání jednostranné alternativy se obecně nedoporučuje.
Testová statistika

se dá chápat jako:

  1. Předpokládáme , „t-test pro shodné rozptyly“ (klasická varianta)
  2. Uvažujeme i možnost , „t-test pro neshodné rozptyly“ (tzv. Welchův test, Satterthwaiteův test)

K rozlišení vhodnosti daných variant lze použít např. F-test shody rozptylů.

CAVE!!! Použití na testování na shodu rozptylů není ovšem univerzální. Testy na rozptyl mohou vyjít falešně signifikantní pouze díky velkému počtu dat, či falešně nesignifikatní kvůli malému množství dat.

T-test pro shodné rozptyly[edit | edit source]

Označován jako pooled variance t-test. Předpokládáme:

Společný rozptyl se odhaduje jako

Nulové rozdělení

Při H0 platí:

T-test pro neshodné rozptyly[edit | edit source]

Občas označován jako Welchův test, Satterthwaitův test či separed variance t-test. Předpokládáme:

Nulové rozdělení

Při H0 přibližně rozdělení . Počet stupňů volnosti odpovídá n, m, s1, s2. Nemusí to být celé číslo.

Párový Studentův t-test[edit | edit source]

Data

, průměr

, průměr

Párové diference

je SD párových diferencí.

Nulová hypotéza

H0: μ1 = μ2 (obecněji H0: μ1 − μ2 = konstanta)

Alternativní hypotéza
  • HA: μ1 ≠ μ2 (oboustranná alternativa)
  • HA: μ1 > μ2; μ1 < μ2 (jednostranná alternativa)
Používání jednostranné alternativy se obecně nedoporučuje.
Testová statistika

, jsou realizace náhodné veličiny, je tedy také realizace náhodné veličiny, je její směrodatná odchylka

(Obecněji )

Nulové rozdělení

Při platnosti H0:

Pravděpodobnost, že přesáhne hodnotu nebo bude nižší než je

Kritická hodnota

Výpočetní technika[edit | edit source]

  • Program STATISTICA: StatistikyZákladní statistikyt-test, závislé vzorky
  • Program EXCEL:
    1. NástrojeDoplňkyAnalýza dat (zaškrtnout)
    2. NástrojeAnalýza datDvouvýběrový párový studentův test na střední hodnotu
    CAVE!!! V české verzi je nutné dát pozor na parametr stupně volnosti, který je špatně přeložen jako rozdíl.

Výpočetní technika[edit | edit source]

  • Program SAS: TasksANOVAt Test…
  • Program STATISTICA: StatistikyZákladní statistiky → Vhodný typ testu
  • Program Excel: funkce TTEST()
  • Program Excel, alternativní způsob:
    1. V Excelu, který nemá data ve formě objekty × veličiny, je nutné data vhodně uspořádat
    2. NástrojeDoplňkyAnalýza dat (zaškrtnout)
    3. NástrojeAnalýza dat → Vhodný typ testu
    CAVE!!! V české verzi je nutné dát pozor na parametr stupně volnosti, který je špatně přeložen jako rozdíl.

Poznámky[edit | edit source]

  1. (1−α/2)-kvantil rozdělení tn−1

Odkazy[edit | edit source]

Související články[edit | edit source]

Použitá literatura[edit | edit source]

  • KLASCHKA, Jan. Testování statistických hypotéz [přednáška k předmětu Zdravotnická statistika 1,2, obor Všeobecné lékařství, 1. lékařská fakulta Univerzita Karlova]. Praha. 26.4.2011. 
  • KLASCHKA, Jan. Studentův t-test [přednáška k předmětu Zdravotnická statistika 1,2, obor Všeobecné lékařství, 1. LF Univerzita Karlova]. Praha. 3.5.2011. 
  • KLASCHKA, Jan. Studentův t-test [přednáška k předmětu Zdravotnická statistika 1,2, obor Všeobecné lékařství, 1. LF Univerzita Karlova]. Praha. 10.5.2011.