1.1.5. Kétmintás t-próba

A kétmintás t-próbát annak a hipotézisnek a tesztelésére használjuk, hogy a két minta azonos várható értékű populációból származik. A kétmintás t-próba végrehajtása is a t.test() függvénnyel történik, amelynek az általános alakja kétmintás esetben:

# ------
# SABLON Kétmintás t-próba és Welch-féle d-próba
# ------
t.test(x, y, var.equal=F, alternative="two.sided", conf.level=0.95)          # I.  változat
t.test(formula, data, var.equal=F, alternative="two.sided", conf.level=0.95) # II. változat

Az argumentumok jelentése:

  • x=, y=: a két független mintát tartalmazó numerikus vektor (I. változat)
  • formula= általános esetben num ~ fakt alakú formula, ahol num egy numerikus vektor, fakt pedig egy kétszintű faktor (II. változat)
  • data= az adattábla neve, amelynek megadása esetén a formulában nem szükséges adattábla nevet használni (II. változat)
  • var.equal= a két minta szórásazonosságát közölhetjük a függvényhívás során; var.equal=T esetén kétmintás t-próba kerül végrehajtásra, egyébként pedig a Welch-féle d-próba végrehajtása az alapértelmezés
  • az alternative= és conf.level= argumentumok jelentése megegyezik az egymintás esettel.

Adatbázis hiányában összesítő adatok segítségével is végrehajthatunk kétmintás t-próbát. A két független minta átlagára, szórására és elemszámára van szükség. A BSDA csomag tsum.test() függvényének argumentumlistájában ezeket az összesítő adatokat kell megadnunk, a két mintát tartalmazó adatvektor helyett.

# ------
# SABLON Kétmintás t-próba és Welch-féle d-próba összesített adatok alapján
# ------
library(BSDA)
tsum.test(mean.x, s.x, n.x, mean.y, s.y, n.y, var.equal=F, alternative="two.sided", conf.level=0.95)
  • mean.x= ,mean.y=: a két mintaátlag
  • s.x=, s.y=: a két mintabeli szórás
  • n.x= ,n.y=: a két mintaelemszám
  • var.equal= a két minta szórásazonosságát közölhetjük a függvényhívás során; var.equal=T esetén kétmintás t-próba kerül végrehajtásra, egyébként pedig a Welch-féle d-próba végrehajtása az alapértelmezés
  • alternative=: az alternatív hipotézis alakja. Alapértelmezés szerint kétoldali, de lehet egyoldalit is választani ("less" vagy "greater" karakteres konstansok megadásával);
  • conf.level= az átlagok különbségére szerkesztett konfidencia-intervallum megbízhatósági szintje.

Mind a t.test(), mind a tsum.test() függvény alapértelmezés szerint Welch-féle d-próbát hajt végre. Ez a populációbeli szórások különbözőségét állító var.equal=FALSE argumentumnak köszönhető, amely mindkét függvény esetén az alapértelmezett beállítás. A kétmintás t-próba végrehajtását mindkét esetben a var.equal=TRUE argumentum megadásával kezdeményezhetjük.

A kétmintás t-próba és a Welch-féle d-próba általános alakjának ismertetése után kétoldali és egyoldali próbák végrehajtására mutatunk példát.