2.2.1. Feladatok megoldása egymintás u-próbára

8.1. feladat megoldása. Népességcsoport IQ értéke

Megoldás kézi számítással

Számoljuk ki a próbastatisztika értékét!

# a z próbastatisztika értéke
(z <- (113.5 - 110)/(10/sqrt(16)))

[1] 1.4

Mivel a próbastatisztika értéke kisebb, mint az 5%-os kritikus érték (1.96), így azt mondhatjuk, hogy a vizsgált népességcsoport intelligenciahányadosának a várható értéke nem tér el szignifikánsan 110-től 95%-os biztonsági szinten.

Megoldás a zsum.test() függvénnyel

# Egymintás u-próba kétoldali ellenhipotézissel összesített adatok alapján
library(BSDA)
zsum.test(mean.x = 113.5, sigma.x = 10, n.x = 16, mu = 110)


    One-sample z-Test

data:  Summarized x
z = 1.4, p-value = 0.1615
alternative hypothesis: true mean is not equal to 110
95 percent confidence interval:
 108.6 118.4
sample estimates:
mean of x 
    113.5

Az outputból leolvasható az előző megoldással megegyező eredmény, azaz a próba nem szignifikáns (p=0.1615).

8.2. feladat megoldása. Egyetemi adjunktusok fizetése

Megoldás p-érték alapján a zsum.test() függvénnyel

A feladat megoldásához használjuk a BSDA csomag zsum.test() függvényét! Az argumentumokat a feladatban szereplő számértékekkel kell feltölteni, de figyelni kell az alternatív hipotézis alakjára, amely most egyoldali (\(H_1:\mu>42000\)).

library(BSDA)
zsum.test(mean.x = 43260, sigma.x = 5230, n.x = 30, mu = 42000, alternative = "greater")


    One-sample z-Test

data:  Summarized x
z = 1.32, p-value = 0.09349
alternative hypothesis: true mean is greater than 42000
95 percent confidence interval:
 41689    NA
sample estimates:
mean of x 
    43260

Látható, hogy nem tudjuk elfogadni az ellenhipotézist (p=0.093).

Megoldás p-érték alapján kézi számítással

Más módon is megkaphatjuk a fenti eredményt. Először számoljuk ki az u-próbastatisztika értékét:

# a u-próbastatisztika értéke
(z <- (43260 - 42000)/(5230/sqrt(30)))

[1] 1.32

Ha a döntésünket az előbbi esethez hasonlóan, a p-érték alapján szeretnénk meghozni, akkor állapítsuk meg, hogy mennyi a valószínűsége az u-próbastatisztika értékénél nagyobb értékeknek:

1 - pnorm(q = z)  # p-érték jelen jobb-oldali esetben

[1] 0.09349

Látható, hogy ez nagyobb, mint 0.05, így megtartjuk a nullhipotézist.

Megoldás elfogadási tartomány alapján

Döntésünket alapozhatjuk az elfogadási tartomány határaira is. A határértékek meghatározásához a qnorm() függvényt használjuk. A jobb-oldali próba miatt most a jobboldali határ megkeresése a cél.

qnorm(1 - 0.05)  # jobb-oldali próba jobb oldali elfogadási tartomány határa

[1] 1.645

Az elfogadási tartomány jobb oldali határánál a u-próbastatisztika értéke kisebb, így megtartjuk a nullhipotézist.

Megoldás konfidencia-intervallum alapján

Szerkesztünk egy jobb-oldali 95%-os konfidencia-intervallumot a minta alapján a várható értékre. Az intervallum jobb oldala a plusz végtelen, a bal oldal pedig a hibahatár alapján számítható.

E <- qnorm(1 - 0.05) * (5230/sqrt(30))  # hibahatár 95%-os egyoldali esetben
c(43260 - E, Inf)

[1] 41689   Inf

A konfidencia-intervallum értelmezése: 95%-os megbízhatósággal a fizetés nagyobb 41689 dollárnál. Mivel a nullhipotézisben szereplő 42000 dollár beleesik ebbe az intervallumba (mivel nagyobb 41689 dollárnál), így megtartjuk a nullhipotézist.

8.3. feladat megoldása. Az egymintás u-próba outputjának kézi számítása

Számoljuk ki a 8.1. példa megoldásában szereplő R output numerikus értékeit! Ismételjük meg az egymintás u-próbát!

# Egymintás u-próba kétoldali ellenhipotézissel a TeachingDemos::z.test()
# függvénnyel
x <- c(9, 10, 6, 4, 8, 11, 10, 5, 5, 6, 13, 12, 4, 4, 3, 9, 12, 5, 6, 6, 8, 
    9, 8, 5, 7, 9, 10, 9, 5, 4)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 8, stdev = 2)


    One Sample z-test

data:  x
z = -1.643, n = 30.000, Std. Dev. = 2.000, Std. Dev. of the sample
mean = 0.365, p-value = 0.1003
alternative hypothesis: true mean is not equal to 8
95 percent confidence interval:
 6.684 8.116
sample estimates:
mean of x 
      7.4

A mintaátlagot a már ismert mean() függvény szolgáltatja.

# az x minta átlaga
mean(x)

[1] 7.4

Kiszámoljuk a standard hibát.

# a standard hiba
(s.hiba <- 2/sqrt(length(x)))

[1] 0.3651

A próbastatisztika mintából számolt értékét a következő kifejezés adja.

# a z próbastatisztika értéke
(z <- (mean(x) - 8)/s.hiba)

[1] -1.643

A p-érték megállapítása a jelen kétoldali próba esetén.

# a p-érték
2 * pnorm(z)

[1] 0.1003

A várható értékre a 95%-os megbízhatóságú konfidencia intervallumot a következő kifejezéssel kaphatjuk meg.

# az u kritikus érték meghatározása
(u.alfa <- qnorm(1 - 0.05/2))

[1] 1.96

# 95%-os megbízhatóságú konfidencia intervallum
c(mean(x) - u.alfa * s.hiba, mean(x) + u.alfa * s.hiba)

[1] 6.684 8.116

Ismételjük meg az egymintás u-próbát a 8.2. példa esetében is!

# Egymintás u-próba bal-oldali ellenhipotézissel
x <- c(60, 70, 75, 55, 80, 55, 50, 40, 80, 70, 50, 95, 120, 90, 75, 85, 80, 
    60, 110, 65, 80, 85, 85, 45, 75, 60, 90, 90, 60, 95, 110, 85, 45, 90, 70, 
    70)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 80, stdev = 19.2, alternative = "less", conf.level = 0.9)


    One Sample z-test

data:  x
z = -1.562, n = 36.0, Std. Dev. = 19.2, Std. Dev. of the sample
mean = 3.2, p-value = 0.05909
alternative hypothesis: true mean is less than 80
90 percent confidence interval:
 -Inf 79.1
sample estimates:
mean of x 
       75

A mintaátlagot a már ismert mean() függvény szolgáltatja.

# az x minta átlaga
mean(x)

[1] 75

Kiszámoljuk a standard hibát.

# a standard hiba
(s.hiba <- 19.2/sqrt(length(x)))

[1] 3.2

A próbastatisztika mintából számolt értékét a következő kifejezés adja.

# a z próbastatisztika értéke
(z <- (mean(x) - 80)/s.hiba)

[1] -1.563

A p-érték megállapítása a jelen bal-oldali próba esetén.

# a p-érték
pnorm(z)

[1] 0.05909

A várható értékre a 90%-os megbízhatóságú konfidencia intervallumot a következő kifejezéssel kaphatjuk meg.

# az u kritikus érték meghatározása
(u.alfa <- qnorm(1 - 0.1))

[1] 1.282

# 95%-os megbízhatóságú konfidencia intervallum
c(-Inf, mean(x) + u.alfa * s.hiba)

[1] -Inf 79.1

Végül ismételjük meg az egymintás u-próbát a 8.3. példa esetében is!

# Egymintás u-próba jobb-oldali ellenhipotézissel
x <- c(178, 61, 30, 29, 41, 31, 24, 25, 24, 22, 122, 56, 28, 16, 38, 30, 16, 
    25, 23, 21, 91, 46, 28, 16, 36, 19, 15, 18, 17, 20, 44, 20, 20, 19, 15, 
    19, 15, 14, 17, 17, 35, 32, 27, 15, 25, 19, 19, 15, 22, 20)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 24, stdev = 28.7, alternative = "greater")


    One Sample z-test

data:  x
z = 1.848, n = 50.000, Std. Dev. = 28.700, Std. Dev. of the sample
mean = 4.059, p-value = 0.03231
alternative hypothesis: true mean is greater than 24
95 percent confidence interval:
 24.82   Inf
sample estimates:
mean of x 
     31.5

A mintaátlag kiszámítása.

# az x minta átlaga
mean(x)

[1] 31.5

Kiszámoljuk a standard hibát.

# a standard hiba
(s.hiba <- 28.7/sqrt(length(x)))

[1] 4.059

A próbastatisztika mintából számolt értékét a következő kifejezés adja.

# a z próbastatisztika értéke
(z <- (mean(x) - 24)/s.hiba)

[1] 1.848

A p-érték megállapítása a jelen jobb-oldali próba esetén.

# a p-érték
1 - pnorm(z)

[1] 0.03231

A várható értékre a 95%-os megbízhatóságú konfidencia intervallumot a következő kifejezéssel kaphatjuk meg.

# az u kritikus érték meghatározása
(u.alfa <- qnorm(1 - 0.05))

[1] 1.645

# 95%-os megbízhatóságú konfidencia intervallum
c(mean(x) - u.alfa * s.hiba, Inf)

[1] 24.82   Inf

8.4. feladat megoldása. Magyarázó ábra az egymintás u-próbához

Ismételjük meg a 8.1. példa megoldását!

# Egymintás u-próba kétoldali ellenhipotézissel a TeachingDemos::z.test()
# függvénnyel
x <- c(9, 10, 6, 4, 8, 11, 10, 5, 5, 6, 13, 12, 4, 4, 3, 9, 12, 5, 6, 6, 8, 
    9, 8, 5, 7, 9, 10, 9, 5, 4)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 8, stdev = 2)


    One Sample z-test

data:  x
z = -1.643, n = 30.000, Std. Dev. = 2.000, Std. Dev. of the sample
mean = 0.365, p-value = 0.1003
alternative hypothesis: true mean is not equal to 8
95 percent confidence interval:
 6.684 8.116
sample estimates:
mean of x 
      7.4

A magyarázó ábra létrehozása a HH csomag normal.and.t.dist() függvényével.

library(HH)
normal.and.t.dist(mu.H0=8,
                  obs.mean=7.4, 
                  n=30,
                  std.dev=2,
                  Use.obs.mean=T,
                  Use.alpha.left=T,
                  Use.alpha.right=T,
                  alpha.left=0.05/2,
                  alpha.right=0.05/2,
                  hypoth.or.conf="Hypoth")

plot of chunk unnamed-chunk-27

Ismételjük meg az egymintás u-próbát a 8.2. példa esetében is!

# Egymintás u-próba bal-oldali ellenhipotézissel
x <- c(60, 70, 75, 55, 80, 55, 50, 40, 80, 70, 50, 95, 120, 90, 75, 85, 80, 
    60, 110, 65, 80, 85, 85, 45, 75, 60, 90, 90, 60, 95, 110, 85, 45, 90, 70, 
    70)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 80, stdev = 19.2, alternative = "less", conf.level = 0.9)


    One Sample z-test

data:  x
z = -1.562, n = 36.0, Std. Dev. = 19.2, Std. Dev. of the sample
mean = 3.2, p-value = 0.05909
alternative hypothesis: true mean is less than 80
90 percent confidence interval:
 -Inf 79.1
sample estimates:
mean of x 
       75

A magyarázó ábra létrehozása hasonlóan történik bal-oldali próba esetén is.

library(HH)
normal.and.t.dist(mu.H0=80,
                  obs.mean=75, 
                  n=36,
                  std.dev=19.2,
                  Use.obs.mean=T,
                  Use.alpha.left=T,
                  Use.alpha.right=F,
                  alpha.left=0.1,
                  alpha.right=NA,
                  hypoth.or.conf="Hypoth")

plot of chunk unnamed-chunk-29

Végül ismételjük meg az egymintás u-próbát a 8.3. példa esetében is!

# Egymintás u-próba jobb-oldali ellenhipotézissel
x <- c(178, 61, 30, 29, 41, 31, 24, 25, 24, 22, 122, 56, 28, 16, 38, 30, 16, 
    25, 23, 21, 91, 46, 28, 16, 36, 19, 15, 18, 17, 20, 44, 20, 20, 19, 15, 
    19, 15, 14, 17, 17, 35, 32, 27, 15, 25, 19, 19, 15, 22, 20)
library(TeachingDemos)
TeachingDemos::z.test(x, mu = 24, stdev = 28.7, alternative = "greater")


    One Sample z-test

data:  x
z = 1.848, n = 50.000, Std. Dev. = 28.700, Std. Dev. of the sample
mean = 4.059, p-value = 0.03231
alternative hypothesis: true mean is greater than 24
95 percent confidence interval:
 24.82   Inf
sample estimates:
mean of x 
     31.5

A magyarázó ábra létrehozása jobb-oldali próba esetén.

library(HH)
normal.and.t.dist(mu.H0=24,
                  obs.mean=31.5, 
                  n=50,
                  std.dev=28.7,
                  Use.obs.mean=T,
                  Use.alpha.left=F,
                  Use.alpha.right=T,
                  alpha.left=NA,
                  alpha.right=0.05,
                  hypoth.or.conf="Hypoth")

plot of chunk unnamed-chunk-31