Střední chyba průměru

Z WikiSkript

Střední chyba průměru (standardní chyba průměru, standard error of the mean, SEM, SE) je směrodatná odchylka náhodné veličiny výběrový průměr dat získaných jako náhodný výběr ze základního souboru.

Zjednodušeně řečeno je to číslo, které označuje, jak moc se asi námi získaný průměr náhodného výběru liší od střední hodnoty základního souboru.

Spočítá se jako

[math] \mathrm{SEM} = \frac{\sigma}{\sqrt{n}}, [/math]

kde [math]\sigma[/math] je směrodatná odchylka výběrového souboru a [math]n[/math] je množství dat, z nichž průměr počítáme.

V praxi většinou není možné znát směrodatnou odchylku výběrového průměru, protože bychom k tomu museli znát celý základní soubor. Proto se jako střední chyba průměru často označuje její odhad, který získáme nahrazením směrodatné odchylky výběrového průměru [math]\sigma[/math] směrodatnou odchylkou realizace náhodného výběru [math]s[/math] (veličinu popisující základní soubor odhadneme pomocí čísla, které máme z našeho výběru):

[math] \mathrm{SEM} = \frac{s}{\sqrt{n}}. [/math]

Výběrový průměr jako náhodná veličina[upravit | editovat zdroj]

Vezmeme-li z populace náhodné pacienty a budeme u nich měřit nějakou veličinu, řekněme krevní tlak, můžeme z ní vypočítat průměr, což je poměrně rutinní záležitost. Jedná se však o náhodnou veličinu, protože stejně tak můžeme náhodně vybrat z populace další pacienty, změřit jim krevní tlak a s největší pravděpodobností získáme jiná čísla, která budou mít jiný průměr.

Výběrový průměr si proto představujeme jako realizaci náhodné veličiny, která by vznikla postupným náhodným vybíráním skupin vzorků ze základního souboru a počítáním průměru v každé jednotlivé skupině.

V praxi se ovšem vzorky nedělí do jednotlivých skupin (až na metodu zvanou bootstrapping), protože by jich pak bylo v každé skupině poměrně málo, ale zahrnou se do jedné velké skupiny, z níž se průměr počítá. Pokud tato skupina má [math]n[/math] prvků, měli bychom průměr počítat ze souboru [math]X_1, X_2, \ldots, X_n[/math]. V praxi ale máme skupinu [math]x_1, x_2, \ldots, x_n[/math], v níž každé [math]x_i[/math] reprezentuje jen jedno číslo z [math]X_i[/math].

Proto číslo, které získáme jako

[math]\overline{x} = \frac{x_1 + x_2 + \cdots + x_n}{n}[/math]

považujeme za realizaci náhodné veličiny výběrového průměru.

Pokud má základní soubor rozptyl [math]\sigma^2[/math], pro rozptyl našeho výběrového průměru potom dostáváme:

[math]\mathrm{var}(\overline{X}) = \frac{\sigma^2}{n}[/math]

Směrodatná odchylka našeho výběrového průměru a tím pádem i střední chyba průměru pak bude odmocnina rozptylu:

[math]\mathrm{SEM} = \sqrt{\frac{\mathrm{var} (\overline{X})}{n}} = \sqrt{\frac{\sigma^2}{n}} = \frac{\sigma}{\sqrt{n}}.[/math]

Čím větší počet vzorků, tím menší SEM:

[math]\lim_{n \to \infty} \mathrm{SEM} = 0.[/math]

Výpočetní technika[upravit | editovat zdroj]

  • Výpočet SEM v programu Statistica: StatistikaZákladní statistika (SEM není popisná statistika, ale dá se mezi základními statistikami najít, protože se počítá často)
  • Výpočet SEM v programu Excel: NástrojeAnalýza datPopisná statistika (je nutné přidat modul popisných statistik v možnostech nástrojů)
  • Výpočet SEM v programu R:
data <- c(1, 2, 3, 4, 5, 6, 7, 8, 9)
sd(data)/sqrt(length(data))

Odkazy[upravit | editovat zdroj]

Související články[upravit | editovat zdroj]

Externí odkazy[upravit | editovat zdroj]

Použitá literatura[upravit | editovat zdroj]

  • KLASCHKA, Jan. Střední chyba průměru [přednáška k předmětu Zdravotnická statistika 1,2, obor Všeobecné lékařství, 1. lékařská fakulta Univerzita Karlova]. Praha. 4.4.2011. 
  • ZVÁRA, Karel. Biostatistika. 2. vydání. Praha : Karolinum, 2004. 214 s. s. 74–75. ISBN 80-246-0739-5.