1.6 Példák 1.6.1 probléma. Befolyásolja-e a munkahellyel való elégedettséget a fizetés nagysága és az életkor?
A munkahellyel való elégedettséget számos tényező befolyásolhatja, ilyen lehet a fizetés és az életkor. Korábbi példáinkban már vizsgáltuk ezeket a változókat egy kisebb, hipotetikus adatbázis kapcsán. Mivel a többváltozós lineáris regresszió nagyobb adatbázison működik a legjobban, ezért vizsgáljuk meg ezt a kapcsolatot egy nagyobb, 30 fős adatbázison is. A számításokat most is az R statisztikai program segítségével végezzük el.
Az adatokat tartalmazó file-t a már korábban bemutatott 1.11. R-forráskóddal tudjuk megnyitni az R-ben. Az adatokat pedig az 1.11. R-eredmény mutatja.
Miután előhívtuk a változókat, futassuk le rájuk a lineáris regresszió-analízist (1.32. R-forráskód).
print(summary(lm(elegedettseg~fizetes+kor, data=d)),digits=1)
|
|
1.32. R-forráskód
|
Most a következő összefoglaló táblázatot kapjuk (1.32. R-eredmény):
Call:
lm(formula = elegedettseg ~ fizetes + kor, data = d)
Residuals:
Min 1Q Median 3Q Max
-10 -2 1 2 4
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.14 3.27 3 0.02 *
fizetes 0.44 0.02 19 <2e-16 ***
kor 0.53 0.07 8 5e-08 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 4 on 27 degrees of freedom
Multiple R-Squared: 1, Adjusted R-squared: 0.9
F-statistic: 3e+02 on 2 and 27 DF, p-value: <2e-16
|
|
1.32. R-eredmény.
|
Az adatokból azt láthatjuk, hogy a fizetés és a kor változó is szignifikánsan befolyásolja az elégedettséget, hiszen a hozzájuk tartozó szignifikanciaszint p<0,05. Továbbá a fizetés változó együtthatója () 0,44, a kor változó együtthatója () pedig 0,53, ami arra utal, hogy egyenes kapcsolat van a változó között: minél magasabb a fizetés, és minél idősebbek az emberek, annál elégedettebbek a munkahelyükkel. A pontos becslés a regressziós egyenlet alapján a következőképpen fest:
elégedettség = 8,14 + 0,44 * fizetés + 0,53 * kor
Mivel a többszörös regresszió esetében a független változók hatása csak a sztenderdizált együtthatók mentén hasonlítható össze, így számíttassuk ki a sztenderdizált együtthatókat is (1.33. R-forráskód).
modell<-summary(lm(scale(elegedettseg)~scale(fizetes)+scale(kor), data=d))
print(modell$coeff,digits=3)
|
|
1.33. R-forráskód
|
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.95e-16 0.0410 1.69e-14 1.00e+00
scale(fizetes) 8.32e-01 0.0435 1.91e+01 3.14e-17
scale(kor) 3.26e-01 0.0435 7.49e+00 4.71e-08
|
|
1.33. R-eredmény.
|
Az adatok (1.33. R-eredmény) azt is jól példázzák, hogy miért fontos a sztenderdizált együtthatókat is vizsgálni, hiszen a nem sztenderdizál együtthatók esetén a kor változó együtthatójának értéke a magasabb, míg a sztenderdizált értékeknél fordítva. Vagyis, ha az egyes változók relatív fontosságának vizsgálatakor nem nézzük a dimenziómentes értékeket, akkor könnyen téves következtetésre juthatunk.
A négyzetes korrelációs együttható értéke 0,9, ami arra utal, hogy a független változók igen jól magyarázzák a függő változót.
|