1.6.2 probléma. Befolyásolja-e a kalandvágy a hivatásos katonai szolgálatnál eltöltött időt?
A hivatásos katonák élete tele van kalanddal, veszéllyel, munkájukat semmiképpen sem lehet egyhangúnak és unalmasnak mondani. Ebből kiindulva ésszerűnek tűnik a feltételezés, hogy aki szereti a kalandos dolgokat, extrém sportokat, az a katonai életet is jobban szereti, vagyis több évet tölt el katonai szolgálatban, mint az, aki inkább a csendesebb, nyugodtabb életet kedveli.
A „katonasag” file egy erre irányuló - hipotetikus - vizsgálat adatait tartalmazza. A személyek 3 állítást ítéltek meg egy 1-5 skálán az alapján, hogy mennyire tartják igaznak saját magukra nézve. A file változói a következők:
- kaland: Szeretem, ha kalandosan, változatosan alakul az életem.
- sport: Szeretem az extrém sportokat.
- egyhangu: Szeretem az egyhangú, szürke hétköznapokat.
Függő változóként pedig a katonai szolgálatban eltöltött idő szerepel években számítva („evek” változó).
Először hívjuk be az adatokat az R statisztikai programba (1.34. R-forráskód). Az adatok (1.34. R-forráskód) az 1.7.5 mellékletben tekinthetők meg.
d<-read.csv("c:/adat/katonasag.csv")
print(d)
|
|
1.34. R-forráskód
|
Ha ezzel készen vagyunk, futassunk lineáris regresszió-analízist az adatokra (1.35. R-forráskód).
print(summary(lm(evek~kaland+sport+egyhangu, data=d)),digits=2)
|
|
1.35. R-forráskód
|
Ha az eredményeket nézzük (1.35. R-eredmény), akkor megállapíthatjuk, hogy a lineáris regressziós modellt megtarthatjuk, hiszen az F-statisztika értékét tekintve a modell szignifikáns, a változók együtthatóinak az értéke nem nulla. A modell magyarázóértéke igen jó, hiszen az R-négyzet értéke 0,92, vagyis a független változók a függő változó varianciájának kb. 92%-át magyarázzák. Azt is láthatjuk, hogy minden egyes független változó hatással van a függő változóra, vagyis mind a kalandvágy, az extrém sportok szeretete és a nyugalom utáni vágy is befolyásolja azt, hogy mennyi időt tölt valaki a hivatásos katonai szolgálatban. Ellenben a
, vagyis a konstans értéke most nulla, hiszen a táblázatban szereplő érték nem szignifikáns.
Maga a regressziós egyenlet a pontos együtthatók ismeretében a következőképpen alakul:
evek=3,175*kaland+1,53*sport-2,282*egyhangu
Vagyis minél jobban kedveli valaki a kalandos életet és az extrém sportokat, és minél jobban irtózik a szürke hétköznapoktól, annál több időt tölt a katonaság kötelékében.
Call:
lm(formula = evek ~ kaland + sport + egyhangu, data = d)
Residuals:
Min 1Q Median 3Q Max
-1.66 -0.59 -0.08 0.27 9.78
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.640 0.333 1.9 0.06 .
kaland 3.175 0.099 32.1 <2e-16 ***
sport 1.530 0.094 16.2 <2e-16 ***
egyhangu -2.282 0.092 -24.9 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.2 on 152 degrees of freedom
Multiple R-Squared: 0.92, Adjusted R-squared: 0.92
F-statistic: 5.8e+02 on 3 and 152 DF, p-value: <2e-16
|
|
1.35. R-eredmény. A lineáris regresszió eredménye a katonai szolgálat vizsgálata esetén.
|
A teljes képhez már csak annyi hiányzik, hogy megnézzük, mely változók hatása erősebb, vagyis, hogy kiszámoljuk a sztenderdizált együtthatókat is (1.36. R-forráskód).
modell<-summary(lm(scale(evek)~scale(kaland)+scale(sport)+scale(egyhangu), data=d))
print(modell$coeff,digits=3)
|
|
1.36. R-forráskód
|
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.62e-17 0.0229 2.01e-15 1.00e+00
scale(kaland) 7.68e-01 0.0239 3.21e+01 1.22e-69
scale(sport) 3.82e-01 0.0236 1.62e+01 6.57e-35
scale(egyhangu) -5.93e-01 0.0238 -2.49e+01 1.56e-55
|
|
1.36. R-ererdmény.
|
Az 1.36. R-eredmény alapján a sztenderdizált változók alapján a kaland szeretetének a hatása a legerősebb (=0,768), a második legerősebb hatás az egyhangúság kedvelése, ám hatásának iránya negatív (=-0,593), leggyengébb hatása pedig az extrém sportok szeretetének van (=0,382).
|