1.1.2.1. Kétmintás u-próba kétoldali ellenhipotézissel

A kétmintás u-próba kétoldali ellenhipotézise a \(H_1:\mu_1\neq \mu_2\) vagy \(H_1:\mu_1-\mu_2 \neq 0\) hipotézis. Két példát mutatunk be, melyek közül az első adatbázis birtokában, a másik adatbázis nélkül hajt végre kétmintás u-próbát.

8.4. példa. Férfiak és nők testtömegének összehasonlítása
Férfiak és nők testsúlyát szeretnénk összehasonlítani. Ehhez veszünk két 11 elemű mintát, miközben feltesszük, hogy a férfiak testsúlyának szórása 8, a nőké pedig 6 a populációban. Az adatok a 8.1. táblázatban láthatók. Vizsgáljuk meg 5%-os szignifikanciaszinten, hogy van-e eltérés a nők és férfiak testtömegében!

8.1. táblázat. Férfiak és nők testtömegének összehasonlítása
Férfiak (kg): 65 70 56 80 101 79 63 84 92 88 76
Nők (kg): 52 48 70 63 56 64 58 77 90 58 60

A kétmintás u-próba végrehajtása a fentiek alapján a \(H_1:\mu_1\neq \mu_2\) kétoldali ellenhipotézis esetén:

# kétmintás u-próba kétoldali ellenhipotézissel
library(BSDA)
ff <- c(65, 70, 56, 80, 101, 79, 63, 84, 92, 88, 76)
no <- c(52, 48, 70, 63, 56, 64, 58, 77, 90, 58, 60)
BSDA::z.test(x = ff, y = no, sigma.x = 8, sigma.y = 6)

    Two-sample z-Test

data:  ff and no
z = 4.764, p-value = 0.000001899
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  8.454 20.273
sample estimates:
mean of x mean of y 
    77.64     63.27 

8.12. output. Kétmintás u-próba

Az outputból kiolvasható, hogy a próba nem szignifikáns (p-érték = 0.1), így a nullhipotézist megtartjuk.

8.5. példa. Szállodai szobaárak
Egy felmérésből kiderült, hogy az átlagos szállodai szobaár New Orleansban 88.42 dollár, míg Phoenix-ben 80.61 dollár. Tegyük fel, hogy az adatokat két 50 elemű minta alapján kapták, továbbá az árak szórása a populációban rendre 5.62 és 4.83 dollár volt. Lehet-e 5%-os szignifikanciaszinten arra következtetni, hogy jelentős különbség van a két városban a szállodai szobaárak között?
Forrás: (Bluman, 2012, pp. Example 9-1)

# kétmintás u-próba kétoldali ellenhipotézissel, összesített adatokkal
library(BSDA)
zsum.test(mean.x = 88.42, sigma.x = 5.62, n.x = 50, mean.y = 80.61, sigma.y = 4.83, 
    n.y = 50)

    Two-sample z-Test

data:  Summarized x and y
z = 7.452, p-value = 0.00000000000009164
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 5.756 9.864
sample estimates:
mean of x mean of y 
    88.42     80.61 

Az outputból kiolvasható, hogy szignifikáns különbség van a két város átlagos szobaárában.