Fórum:Testy/Pearsonův korelační koeficient

Z WikiSkript

Pearsonův korelační koeficient měří sílu lineární závislosti mezi dvěma veličinami. Pomůže nám například vyčíslit, jak silná je vazba mezi výsledky ve dvou různých testech, nebo mezi výsledkem v testu a průměrnou známkou na vysvědčení.

Tip.png
Tip: Korelace neznamená kauzalitu

Pokud spolu dva jevy korelují, pak jsou pravděpodobně provázané (závislé), ale nelze z toho soudit na kauzální souvislost, tj. že by jeden jev byl příčinou a druhý následkem. V západním Německu v sedmdesátých letech velmi dobře koreloval vývoj porodnosti s poklesem počtu hnízdících čapích párů [1]. Nutně to však neznamená, že by současná představa o reprodukci populace musela být neprodleně zavržena.

Obr. 10.3
Tip.png
Tip: Korelace neznamená kauzalitu

Předpokládáme, že máme u jedinců dvojice hodnot Pearsonův korelační koeficient je pak dán vztahem

kde je aritmetický průměr prvních měření a je aritmetický průměr druhých měření.


Ekvivalentně lze Pearsonův korelační koeficient vyjádřit pomocí součinů z-skórů

kde je směrodatná odchylka (standard deviation, SD) prvních měření, směrodatná odchylka druhých měření. z-skór říká, jak daleko je hodnota od průměru přičemž za jednotku vzdálenosti bereme směrodatnou odchylku

V případě, kdy jeden ze znaků je binární (např. sledujeme-li závislost binární položky Y a celkového počtu bodů X, tzv. index RIT), se korelační koeficient redukuje na tzv. bodově-biseriální korelační koeficient

kde je průměr celkového počtu bodů těch studentů, kteří mají hodnotu sledované položky rovnou 1, je průměr celkového počtu bodů těch studentů, kteří mají hodnotu sledované položky rovnou 0, je směrodatná odchylka celkových bodových zisků, je počet jedniček a je počet nul.

Korelační koeficient nabývá pouze hodnot z intervalu od -1 do 1. Svých extrémních hodnot (tedy 1 a -1) nabývá pouze pokud všechny body leží na jedné přímce. Korelační koeficient je roven 1, pokud je mezi veličinami vztah přímé úměry (tedy čím větší je hodnota jedné veličiny, tím větší je hodnota i druhé veličiny). Pokud je mezi veličinami vztah nepřímé úměry, je korelační koeficient roven -1.

Obr. 10.4 Korelační koeficient nabývající hodnot z intervalu od -1 do 1

Jsou-li veličiny nezávislé, je korelace mezi nimi nulová. Nicméně Pearsonův korelační koeficient je pouze odhad populačního korelačního koeficientu, a při každém výběru n-tice studentů vyjde hodnota odhadu nepatrně jiná. Proto i pro nezávislé náhodné veličiny zpravidla vyjde Pearsonův korelační koeficient nenulový. Nulovost pak můžeme testovat pomocí statistického testu (viz např. [2]).

  1. SIES, Helmut. A new parameter for sex education. Nature. 1988, roč. -, vol. -, no. 332, s. 495, ISSN (Print) 0028-0836, (Online) 1476-4687. DOI: 10.1038/332495a0.
  2. ZVÁRA, Karel. Základy statistiky v prostředí R. 1. vydání. Praha : Karolinum, 2013. 249 s.