2.2.1. Feladatok megoldása egymintás u-próbára
Megoldás kézi számítással
Számoljuk ki a próbastatisztika értékét!
# a z próbastatisztika értéke
(z <- (113.5 - 110)/(10/sqrt(16)))
[1] 1.4
Mivel a próbastatisztika értéke kisebb, mint az 5%-os kritikus érték (1.96), így azt mondhatjuk, hogy a vizsgált népességcsoport intelligenciahányadosának a várható értéke nem tér el szignifikánsan 110-től 95%-os biztonsági szinten.
Megoldás a zsum.test()
függvénnyel
# Egymintás u-próba kétoldali ellenhipotézissel összesített adatok alapján
library(BSDA)
zsum.test(mean.x = 113.5, sigma.x = 10, n.x = 16, mu = 110)
One-sample z-Test
data: Summarized x
z = 1.4, p-value = 0.1615
alternative hypothesis: true mean is not equal to 110
95 percent confidence interval:
108.6 118.4
sample estimates:
mean of x
113.5
Az outputból leolvasható az előző megoldással megegyező eredmény, azaz a próba nem szignifikáns (p=0.1615).
Megoldás p-érték alapján a zsum.test()
függvénnyel
A feladat megoldásához használjuk a BSDA
csomag zsum.test()
függvényét! Az argumentumokat a feladatban szereplő számértékekkel kell feltölteni, de figyelni kell az alternatív hipotézis alakjára, amely most egyoldali (\(H_1:\mu>42000\)).
library(BSDA)
zsum.test(mean.x = 43260, sigma.x = 5230, n.x = 30, mu = 42000, alternative = "greater")
One-sample z-Test
data: Summarized x
z = 1.32, p-value = 0.09349
alternative hypothesis: true mean is greater than 42000
95 percent confidence interval:
41689 NA
sample estimates:
mean of x
43260
Látható, hogy nem tudjuk elfogadni az ellenhipotézist (p=0.093).
Megoldás p-érték alapján kézi számítással
Más módon is megkaphatjuk a fenti eredményt. Először számoljuk ki az u-próbastatisztika értékét:
# a u-próbastatisztika értéke
(z <- (43260 - 42000)/(5230/sqrt(30)))
[1] 1.32
Ha a döntésünket az előbbi esethez hasonlóan, a p-érték alapján szeretnénk meghozni, akkor állapítsuk meg, hogy mennyi a valószínűsége az u-próbastatisztika értékénél nagyobb értékeknek:
1 - pnorm(q = z) # p-érték jelen jobb-oldali esetben
[1] 0.09349
Látható, hogy ez nagyobb, mint 0.05, így megtartjuk a nullhipotézist.
Megoldás elfogadási tartomány alapján
Döntésünket alapozhatjuk az elfogadási tartomány határaira is. A határértékek meghatározásához a qnorm()
függvényt használjuk. A jobb-oldali próba miatt most a jobboldali határ megkeresése a cél.
qnorm(1 - 0.05) # jobb-oldali próba jobb oldali elfogadási tartomány határa
[1] 1.645
Az elfogadási tartomány jobb oldali határánál a u-próbastatisztika értéke kisebb, így megtartjuk a nullhipotézist.
Megoldás konfidencia-intervallum alapján
Szerkesztünk egy jobb-oldali 95%-os konfidencia-intervallumot a minta alapján a várható értékre. Az intervallum jobb oldala a plusz végtelen, a bal oldal pedig a hibahatár alapján számítható.
E <- qnorm(1 - 0.05) * (5230/sqrt(30)) # hibahatár 95%-os egyoldali esetben
c(43260 - E, Inf)
[1] 41689 Inf
A konfidencia-intervallum értelmezése: 95%-os megbízhatósággal a fizetés nagyobb 41689 dollárnál. Mivel a nullhipotézisben szereplő 42000 dollár beleesik ebbe az intervallumba (mivel nagyobb 41689 dollárnál), így megtartjuk a nullhipotézist.
Számoljuk ki a 8.1. példa megoldásában szereplő R output numerikus értékeit! Ismételjük meg az egymintás u-próbát!
# Egymintás u-próba kétoldali ellenhipotézissel a TeachingDemos::z.test()
# függvénnyel
x <- c(9, 10, 6, 4, 8, 11, 10, 5, 5, 6, 13, 12, 4, 4, 3, 9, 12, 5, 6, 6, 8,
9, 8, 5, 7, 9, 10, 9, 5, 4)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 8, stdev = 2)
One Sample z-test
data: x
z = -1.643, n = 30.000, Std. Dev. = 2.000, Std. Dev. of the sample
mean = 0.365, p-value = 0.1003
alternative hypothesis: true mean is not equal to 8
95 percent confidence interval:
6.684 8.116
sample estimates:
mean of x
7.4
A mintaátlagot a már ismert mean()
függvény szolgáltatja.
# az x minta átlaga
mean(x)
[1] 7.4
Kiszámoljuk a standard hibát.
# a standard hiba
(s.hiba <- 2/sqrt(length(x)))
[1] 0.3651
A próbastatisztika mintából számolt értékét a következő kifejezés adja.
# a z próbastatisztika értéke
(z <- (mean(x) - 8)/s.hiba)
[1] -1.643
A p-érték megállapítása a jelen kétoldali próba esetén.
# a p-érték
2 * pnorm(z)
[1] 0.1003
A várható értékre a 95%-os megbízhatóságú konfidencia intervallumot a következő kifejezéssel kaphatjuk meg.
# az u kritikus érték meghatározása
(u.alfa <- qnorm(1 - 0.05/2))
[1] 1.96
# 95%-os megbízhatóságú konfidencia intervallum
c(mean(x) - u.alfa * s.hiba, mean(x) + u.alfa * s.hiba)
[1] 6.684 8.116
Ismételjük meg az egymintás u-próbát a 8.2. példa esetében is!
# Egymintás u-próba bal-oldali ellenhipotézissel
x <- c(60, 70, 75, 55, 80, 55, 50, 40, 80, 70, 50, 95, 120, 90, 75, 85, 80,
60, 110, 65, 80, 85, 85, 45, 75, 60, 90, 90, 60, 95, 110, 85, 45, 90, 70,
70)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 80, stdev = 19.2, alternative = "less", conf.level = 0.9)
One Sample z-test
data: x
z = -1.562, n = 36.0, Std. Dev. = 19.2, Std. Dev. of the sample
mean = 3.2, p-value = 0.05909
alternative hypothesis: true mean is less than 80
90 percent confidence interval:
-Inf 79.1
sample estimates:
mean of x
75
A mintaátlagot a már ismert mean()
függvény szolgáltatja.
# az x minta átlaga
mean(x)
[1] 75
Kiszámoljuk a standard hibát.
# a standard hiba
(s.hiba <- 19.2/sqrt(length(x)))
[1] 3.2
A próbastatisztika mintából számolt értékét a következő kifejezés adja.
# a z próbastatisztika értéke
(z <- (mean(x) - 80)/s.hiba)
[1] -1.563
A p-érték megállapítása a jelen bal-oldali próba esetén.
# a p-érték
pnorm(z)
[1] 0.05909
A várható értékre a 90%-os megbízhatóságú konfidencia intervallumot a következő kifejezéssel kaphatjuk meg.
# az u kritikus érték meghatározása
(u.alfa <- qnorm(1 - 0.1))
[1] 1.282
# 95%-os megbízhatóságú konfidencia intervallum
c(-Inf, mean(x) + u.alfa * s.hiba)
[1] -Inf 79.1
Végül ismételjük meg az egymintás u-próbát a 8.3. példa esetében is!
# Egymintás u-próba jobb-oldali ellenhipotézissel
x <- c(178, 61, 30, 29, 41, 31, 24, 25, 24, 22, 122, 56, 28, 16, 38, 30, 16,
25, 23, 21, 91, 46, 28, 16, 36, 19, 15, 18, 17, 20, 44, 20, 20, 19, 15,
19, 15, 14, 17, 17, 35, 32, 27, 15, 25, 19, 19, 15, 22, 20)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 24, stdev = 28.7, alternative = "greater")
One Sample z-test
data: x
z = 1.848, n = 50.000, Std. Dev. = 28.700, Std. Dev. of the sample
mean = 4.059, p-value = 0.03231
alternative hypothesis: true mean is greater than 24
95 percent confidence interval:
24.82 Inf
sample estimates:
mean of x
31.5
A mintaátlag kiszámítása.
# az x minta átlaga
mean(x)
[1] 31.5
Kiszámoljuk a standard hibát.
# a standard hiba
(s.hiba <- 28.7/sqrt(length(x)))
[1] 4.059
A próbastatisztika mintából számolt értékét a következő kifejezés adja.
# a z próbastatisztika értéke
(z <- (mean(x) - 24)/s.hiba)
[1] 1.848
A p-érték megállapítása a jelen jobb-oldali próba esetén.
# a p-érték
1 - pnorm(z)
[1] 0.03231
A várható értékre a 95%-os megbízhatóságú konfidencia intervallumot a következő kifejezéssel kaphatjuk meg.
# az u kritikus érték meghatározása
(u.alfa <- qnorm(1 - 0.05))
[1] 1.645
# 95%-os megbízhatóságú konfidencia intervallum
c(mean(x) - u.alfa * s.hiba, Inf)
[1] 24.82 Inf
Ismételjük meg a 8.1. példa megoldását!
# Egymintás u-próba kétoldali ellenhipotézissel a TeachingDemos::z.test()
# függvénnyel
x <- c(9, 10, 6, 4, 8, 11, 10, 5, 5, 6, 13, 12, 4, 4, 3, 9, 12, 5, 6, 6, 8,
9, 8, 5, 7, 9, 10, 9, 5, 4)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 8, stdev = 2)
One Sample z-test
data: x
z = -1.643, n = 30.000, Std. Dev. = 2.000, Std. Dev. of the sample
mean = 0.365, p-value = 0.1003
alternative hypothesis: true mean is not equal to 8
95 percent confidence interval:
6.684 8.116
sample estimates:
mean of x
7.4
A magyarázó ábra létrehozása a HH
csomag normal.and.t.dist()
függvényével.
library(HH)
normal.and.t.dist(mu.H0=8,
obs.mean=7.4,
n=30,
std.dev=2,
Use.obs.mean=T,
Use.alpha.left=T,
Use.alpha.right=T,
alpha.left=0.05/2,
alpha.right=0.05/2,
hypoth.or.conf="Hypoth")
Ismételjük meg az egymintás u-próbát a 8.2. példa esetében is!
# Egymintás u-próba bal-oldali ellenhipotézissel
x <- c(60, 70, 75, 55, 80, 55, 50, 40, 80, 70, 50, 95, 120, 90, 75, 85, 80,
60, 110, 65, 80, 85, 85, 45, 75, 60, 90, 90, 60, 95, 110, 85, 45, 90, 70,
70)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 80, stdev = 19.2, alternative = "less", conf.level = 0.9)
One Sample z-test
data: x
z = -1.562, n = 36.0, Std. Dev. = 19.2, Std. Dev. of the sample
mean = 3.2, p-value = 0.05909
alternative hypothesis: true mean is less than 80
90 percent confidence interval:
-Inf 79.1
sample estimates:
mean of x
75
A magyarázó ábra létrehozása hasonlóan történik bal-oldali próba esetén is.
library(HH)
normal.and.t.dist(mu.H0=80,
obs.mean=75,
n=36,
std.dev=19.2,
Use.obs.mean=T,
Use.alpha.left=T,
Use.alpha.right=F,
alpha.left=0.1,
alpha.right=NA,
hypoth.or.conf="Hypoth")
Végül ismételjük meg az egymintás u-próbát a 8.3. példa esetében is!
# Egymintás u-próba jobb-oldali ellenhipotézissel
x <- c(178, 61, 30, 29, 41, 31, 24, 25, 24, 22, 122, 56, 28, 16, 38, 30, 16,
25, 23, 21, 91, 46, 28, 16, 36, 19, 15, 18, 17, 20, 44, 20, 20, 19, 15,
19, 15, 14, 17, 17, 35, 32, 27, 15, 25, 19, 19, 15, 22, 20)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 24, stdev = 28.7, alternative = "greater")
One Sample z-test
data: x
z = 1.848, n = 50.000, Std. Dev. = 28.700, Std. Dev. of the sample
mean = 4.059, p-value = 0.03231
alternative hypothesis: true mean is greater than 24
95 percent confidence interval:
24.82 Inf
sample estimates:
mean of x
31.5
A magyarázó ábra létrehozása jobb-oldali próba esetén.
library(HH)
normal.and.t.dist(mu.H0=24,
obs.mean=31.5,
n=50,
std.dev=28.7,
Use.obs.mean=T,
Use.alpha.left=F,
Use.alpha.right=T,
alpha.left=NA,
alpha.right=0.05,
hypoth.or.conf="Hypoth")