mvst

2.5.2 Probléma: Egy kérdőív szerkesztésének problémái

Kérdőívek kialakításkor gyakran előfordul az a probléma, hogy egy dimenzió mérésére nem áll rendelkezésünkre valamilyen bevált mérőeszköz, hanem magunknak kell egyet kialakítani. Egy jó kérdőív kialakítása hosszas és nagyon alapos munkát igényel. Ez a folyamat nagyvonalakban úgy néz ki, hogy az összeállított itemeket először egy kisebb mintán teszteljük (elővizsgálat), majd megnézzük, hogy az itemek valóban úgy „működnek-e”, ahogyan azt mi feltételeztük. Ez jelenti egyrészt a teszt megbízhatóságának, másrészt érvényességének vizsgálatát. Ezek módszertani kérdések, melyekkel jelen tanulmány keretében nem foglalkozunk részletesebben. A megbízhatóság vizsgálatának egyik módszere, hogy megnézzük, az itemek valóban egy dimenzióra illeszkednek-e. A nem odaillő itemeket pedig kivesszük a kérdőívből (itemszelekció). Ennek módszerei lehetnek a korábban már tárgyalt Cronbach-alfa, illetve ha főkomponens-analízist végzünk az itemekkel, akkor a Theta is. A következőkben egy főkomponens-analízisen és Cronbach-alfán alapuló itemszelekcióra nézünk példát.

Első lépésként nyissunk meg egy adatbázist (2.22. R-forráskód), amely kérdőív 10 itemére adott válaszokat tartalmazza. A kapcsolódó R-eredményt, vagyis az adatokat a 2.6.1. melléklet tartalmazza.

g<-read.csv("c:/adat/kerdoivtervezet.csv")
print(g)
2.22. R-forráskód

Miután átfutottuk az adatokat, első lépésként futtassunk főkomponens-analízist a változókra, hogy képet kaphassunk az adatok egymáshoz való viszonyáról (2.23. R-forráskód és R-eredmény).

P<-summary(princomp(g))
print(P)
2.23. R-forráskód

Importance of components:
                          Comp.1    Comp.2     Comp.3     Comp.4     Comp.5
Standard deviation     4.1886290 2.8628046 1.63073385 1.25118650 1.07170109
Proportion of Variance 0.5193064 0.2425846 0.07871293 0.04633658 0.03399595
Cumulative Proportion  0.5193064 0.7618910 0.84060396 0.88694054 0.92093650
                           Comp.6     Comp.7     Comp.8     Comp.9     Comp.10
Standard deviation     0.89489278 0.82561391 0.80654114 0.56194354 0.471568161
Proportion of Variance 0.02370401 0.02017594 0.01925453 0.00934685 0.006582166
Cumulative Proportion  0.94464051 0.96481645 0.98407098 0.99341783 1.000000000
2.23. R-eredmény.

A 2.23. R-eredmény alapján az első két főkomponens játszik meghatározó szerepet. Az első főkomponens magyarázza az összvariancia 52%-át, míg a második 24%-át. Ha az adatbázisban szereplő itemeink elképzelésünk szerint egyetlen dimenziót hivatott mérni, akkor szükséges az itemszelekció, melynek segítségével javíthatjuk a kérdőívünk pontosságát.

Az itemszelekció első lépéseként nézzük meg, hogy a főkomponens-analízis szerint mely itemek „lógnak ki” az egydimenziós modellből, vagyis mely itemek kapcsolata leggyengébb az első főkomponenssel (2.24. R-forráskód és R-eredmény).

P$loadings
2.24. R-forráskód

Loadings:
     Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 Comp.9 Comp.10
K_1  -0.417  0.135                      -0.115  0.453  0.204  0.153  0.720 
K_2  -0.411  0.152                      -0.182  0.408  0.275  0.233 -0.687 
K_3  -0.399  0.113        -0.211 -0.224  0.492 -0.531  0.455               
K_4  -0.384  0.115 -0.219  0.234         0.417        -0.717  0.215        
K_5  -0.388                             -0.243        -0.171 -0.861        
K_6   0.154  0.513 -0.144  0.321  0.605  0.319  0.122  0.244 -0.219        
K_7   0.229  0.474 -0.556 -0.596 -0.165 -0.114        -0.120               
K_8  -0.326               -0.114  0.581 -0.491 -0.470         0.257        
K_9   0.131  0.489         0.552 -0.446 -0.340 -0.322         0.129        
K_10         0.442  0.784 -0.352                      -0.224               

               Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 Comp.9
SS loadings       1.0    1.0    1.0    1.0    1.0    1.0    1.0    1.0    1.0
Proportion Var    0.1    0.1    0.1    0.1    0.1    0.1    0.1    0.1    0.1
Cumulative Var    0.1    0.2    0.3    0.4    0.5    0.6    0.7    0.8    0.9
               Comp.10
SS loadings        1.0
Proportion Var     0.1
Cumulative Var     1.0
2.24. R-eredmény.

A 2.24. R-eredmény alapján a 6,7,9 és 10-es itemek nem nagy súllyal vesznek részt az első főkomponensben, a Cronbach-alfa segíthet annak eldöntésében, hogy valóban érdemes-e a kérdéses itemeket eltávolítani (2.25. R-forráskód és R-eredmény).

library(Rcmdr)
rel<-reliability(cov(g, use="complete.obs"))
print(rel,digits=3)
2.25. R-forráskód

A 2.25. R.eredmény szerint a 6,7,9 és 10-es itemek eltávolítása jelentősen növelné az alfa értékét is, hiszen az eredmény első oszlopának adatai alapján, ha a nevezett itemek nem lennének benne az analízisben, akkor a megbízhatósági mutató értéke jelentősen javulna.

A 2.26. R-eredményen szereplő Theta-érték elég jó (0,9), ám a kérdéses itemek eltávolításával még javulhat valamennyit.

Alpha reliability =  0.773 
Standardized alpha =  0.78 

Reliability deleting each item in turn:
     Alpha Std.Alpha r(item, total)
K_1  0.713     0.721          0.729
K_2  0.710     0.719          0.748
K_3  0.723     0.731          0.660
K_4  0.724     0.731          0.659
K_5  0.720     0.726          0.701
K_6  0.791     0.800          0.140
K_7  0.819     0.819         -0.049
K_8  0.740     0.746          0.558
K_9  0.787     0.798          0.160
K_10 0.774     0.783          0.278
2.25. R-eredmény.

cor<-cor(g)
eigen<-eigen(cor)$values
theta<-length(g)/(length(g)-1)*(1-1/eigen[1])
print(theta,digits=3)
2.26. R-forráskód

[1] 0.901
2.26. R-eredmény.

cors<-cor(P$scores[,1], g)
print(cors,digits=3)
2.27. R-forráskód

        K_1    K_2    K_3    K_4    K_5   K_6   K_7    K_8   K_9   K_10
[1,] -0.933 -0.924 -0.887 -0.872 -0.934 0.352 0.469 -0.837 0.310 0.0245
2.27. R-eredmény.

A 2.27. R-eredményen látható komponens mátrix adatai is alapján az első főkomponens nem túl jól egyesíti egyes eredeti változókban szereplő adatokat, hiszen a korrelációs értékek helyenként nem túl magasak. A következő változókat tudta a legkevésbé becsülni a modell: K_6 (0,352), K_7 (0,469), K_9 (0,31) és K_10 (0,02).

Következő lépésként távolítsuk el a nevezett négy itemet, majd nézzük, hogyan alakul a főkomponens-analízis, a Theta és a Cronbach-alfa eredménye (2.28-2.31 R-forráskód és eredmény).

P0<-summary(princomp(~K_1+K_2+K_3+K_4+K_5+K_8, data=g))
print(P0)
2.28. R-forráskód

Importance of components:
                          Comp.1     Comp.2     Comp.3    Comp.4     Comp.5
Standard deviation     4.0686087 0.97190879 0.88848593 0.8607871 0.60388497
Proportion of Variance 0.8437437 0.04814705 0.04023647 0.0377668 0.01858776
Cumulative Proportion  0.8437437 0.89189076 0.93212723 0.9698940 0.98848179
                           Comp.6
Standard deviation     0.47537147
Proportion of Variance 0.01151821
Cumulative Proportion  1.00000000

2.28. R-eredmény.

d<-g[c(1:5, 8)]
cors1<-cor(P0$scores[,1], d)
print(cors1,digits=3)
2.29. R-forráskód

       K_1    K_2    K_3    K_4    K_5    K_8
[1,] -0.954 -0.952 -0.904 -0.898 -0.947 -0.836
2.29. R-eredmény.

rel1<-reliability(cov(g[,c("K_1", "K_2", "K_3", "K_4", "K_5", "K_8")], use="complete.obs"))
print(rel1,digits=3)
2.30. R-forráskód

Alpha reliability =  0.961 
Standardized alpha =  0.961 

Reliability deleting each item in turn:
    Alpha Std.Alpha r(item, total)
K_1 0.948     0.949          0.926
K_2 0.949     0.949          0.924
K_3 0.956     0.956          0.856
K_4 0.957     0.957          0.850
K_5 0.949     0.949          0.923
K_8 0.963     0.963          0.788
2.30. R-eredmény.

cor<-cor(d)
eigen<-eigen(cor)$values
theta<-length(d)/(length(d)-1)*(1-1/eigen[1])
print(theta,digits=3)
2.31. R-forráskód

[1] 0.962
2.31. R-eredmény.

A 2.28. R-eredményen azt láthatjuk, hogy az első főkomponens immár az összvariancia 84%-át magyarázza. Ez alapján az itemek igen jól illeszkednek egyetlen dimenzióra. Továbbá az alfa-érték (2.30. R-eredmény) most már jelentősen nem is javítható.  A 2.31. R-eredmény alapján pedig a Theta értéke 0,962-re javult.

A 2.29. R-forráskód egy kis magyarázatra szorul. Az első sor azt mutatja, hogyan vegyük ki a feleslegessé vált négy változót az aktív adatok közül. A „d<-g[c(1:5, 8)]” parancs azt jelenti, hogy létrehozunk egy új, g objektumot, amelyben az eredeti, d objektum első öt változója szerepel, valamit a nyolcadik - vagyis azok, amelyekre szükségünk van. A 2.29. R-eredményen láthatjuk, hogy immár minden korrelációs érték 0,8 felett van, vagyis jelentős javulást sikerült elérnünk a modell szempontjából.

A kapott eredmények alapján az itemszelekciót ennél a lépésnél befejezhetjük. Az így kapott hat itemünk a statisztikai eredmények alapján egészen jól lefednek egy dimenziót, ezáltal használhatóak egy jelenség kérdőíves vizsgálatára.

   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.