mvst

1.6 Példák
  1.6.1 probléma. Befolyásolja-e a munkahellyel való elégedettséget a fizetés nagysága és az életkor?

A munkahellyel való elégedettséget számos tényező befolyásolhatja, ilyen lehet a fizetés és az életkor. Korábbi példáinkban már vizsgáltuk ezeket a változókat egy kisebb, hipotetikus adatbázis kapcsán. Mivel a többváltozós lineáris regresszió nagyobb adatbázison működik a legjobban, ezért vizsgáljuk meg ezt a kapcsolatot egy nagyobb, 30 fős adatbázison is. A számításokat most is az R statisztikai program segítségével végezzük el.

Az adatokat tartalmazó file-t a már korábban bemutatott 1.11. R-forráskóddal tudjuk megnyitni az R-ben. Az adatokat pedig az 1.11. R-eredmény mutatja.

Miután előhívtuk a változókat, futassuk le rájuk a lineáris regresszió-analízist (1.32. R-forráskód).

print(summary(lm(elegedettseg~fizetes+kor, data=d)),digits=1)
1.32. R-forráskód

Most a következő összefoglaló táblázatot kapjuk (1.32. R-eredmény):

Call:
lm(formula = elegedettseg ~ fizetes + kor, data = d)

Residuals:
   Min     1Q Median     3Q    Max 
   -10     -2      1      2      4 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)     8.14       3.27       3     0.02 *  
fizetes         0.44       0.02      19   <2e-16 ***
kor             0.53       0.07       8    5e-08 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Residual standard error: 4 on 27 degrees of freedom
Multiple R-Squared:  1, Adjusted R-squared: 0.9 
F-statistic:  3e+02 on 2 and 27 DF,  p-value: <2e-16
1.32. R-eredmény.

Az adatokból azt láthatjuk, hogy a fizetés és  a kor változó is szignifikánsan befolyásolja az elégedettséget, hiszen a hozzájuk tartozó szignifikanciaszint p<0,05. Továbbá a fizetés változó együtthatója ( b 1 ) 0,44, a kor változó együtthatója ( b 2 ) pedig 0,53, ami arra utal, hogy egyenes kapcsolat van a változó között: minél magasabb a fizetés, és minél idősebbek az emberek, annál elégedettebbek a munkahelyükkel. A pontos becslés a regressziós egyenlet alapján a következőképpen fest:

elégedettség = 8,14 + 0,44 * fizetés + 0,53 * kor

Mivel a többszörös regresszió esetében a független változók hatása csak a sztenderdizált együtthatók mentén hasonlítható össze, így számíttassuk ki a sztenderdizált együtthatókat is (1.33. R-forráskód).

modell<-summary(lm(scale(elegedettseg)~scale(fizetes)+scale(kor), data=d))
print(modell$coeff,digits=3)
1.33. R-forráskód

               Estimate Std. Error  t value Pr(>|t|)
(Intercept)    6.95e-16     0.0410 1.69e-14 1.00e+00
scale(fizetes) 8.32e-01     0.0435 1.91e+01 3.14e-17
scale(kor)     3.26e-01     0.0435 7.49e+00 4.71e-08
1.33. R-eredmény.

Az adatok (1.33. R-eredmény) azt is jól példázzák, hogy miért fontos a sztenderdizált együtthatókat is vizsgálni, hiszen a nem sztenderdizál együtthatók esetén a kor változó együtthatójának értéke a magasabb, míg a sztenderdizált értékeknél fordítva. Vagyis, ha az egyes változók relatív fontosságának vizsgálatakor nem nézzük a dimenziómentes értékeket, akkor könnyen téves következtetésre juthatunk.

A négyzetes korrelációs együttható értéke 0,9, ami arra utal, hogy a független változók igen jól magyarázzák a függő változót.

   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.