1.1.5.3. Kétmintás t-próba jobb-oldali ellenhipotézissel

A kétmintás t-próba jobb-odali ellenhipotézise a \(H_1:\mu_1 > \mu_2\) vagy \(H_1:\mu_1-\mu_2 > 0\) hipotézis. Az ismertetett példa adatbázison alapul.

8.16. példa. Virtuális iskolák létszáma
Virtuális iskolák tanulói létszámát vizsgálták egy adott kerülethez tartozó és a kerületen kívüli iskolák két csoportjában. Az adatok a 8.7. táblázatban láthatók. Állíthatjuk 5%-os szikgnifikanciaszinten, hogy a kerülethez tartozó iskolákban magasabb a tanulói létszám?
Forrás: (Bluman, 2012, p. 488, Exercises 9–2 13.)

8.7. táblázat. Tanulói létszám a kerülethez tartozó és a kerületen kívüli iskolákban
Kerületben 25 75 38 41 27 32
Kerületen kívül 57 25 38 14 10 29

Kétmintás t-próba végrehajtásához hozzuk létre a független mintákat tartalmazó adatobjektumokat, majd a jobb-oldali ellenhipotézisnek megfelelően a alternative="greater" argumentummal hívjuk meg a t.test() függvényt.

keruletben <- c(25, 75, 38, 41, 27, 32)
keruleten.kivul <- c(57, 25, 38, 14, 10, 29)
t.test(x = keruletben, y = keruleten.kivul, var.equal = T, alternative = "greater")

    Two Sample t-test

data:  keruletben and keruleten.kivul
t = 1.056, df = 10, p-value = 0.1578
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
 -7.751    Inf
sample estimates:
mean of x mean of y 
    39.67     28.83 

A feladatot oldjuk meg Welch-féle d-próbával is:

keruletben <- c(25, 75, 38, 41, 27, 32)
keruleten.kivul <- c(57, 25, 38, 14, 10, 29)
t.test(x = keruletben, y = keruleten.kivul, var.equal = F, alternative = "greater")

    Welch Two Sample t-test

data:  keruletben and keruleten.kivul
t = 1.056, df = 9.951, p-value = 0.1579
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
 -7.76   Inf
sample estimates:
mean of x mean of y 
    39.67     28.83 

Az eddigi példákban a t.test() függvényt a két független mintát tartalmazó x= és y= argumentummal hívtuk. Gyakori a formula objektum

keruletben <- c(25, 75, 38, 41, 27, 32)
keruleten.kivul <- c(57, 25, 38, 14, 10, 29)
d <- data.frame(iskola = rep(c("kerületben", "kerületen.kívül"), times = c(length(keruletben), 
    length(keruleten.kivul))), letszam = c(keruletben, keruleten.kivul))

t.test(letszam ~ iskola, data = d, var.equal = T, alternative = "greater")

    Two Sample t-test

data:  letszam by iskola
t = 1.056, df = 10, p-value = 0.1578
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
 -7.751    Inf
sample estimates:
     mean in group kerületben mean in group kerületen.kívül 
                        39.67                         28.83 

Mindegyik fenti outputból kiolvasható: nincs elegendő bizonyíték, hogy a kerület virtuális iskoláiba többen járnak, mint a kerületen kívüli iskolákba.