3.4.2 Faktor-rotáció
Ebben a lépésben az előzetes faktorokat átalakítjuk, hogy ezáltal könnyebben interpretálható faktorokat kapjunk. A „forgatás” ebben az esetben tulajdonképpen a fenti egyenletben szereplő
értékek megválasztását jelenti.
A faktor-rotáció lehet derékszögű vagy ferdeszögű. A derékszögű forgatással kapott új faktorok az eredeti faktorokhoz hasonlóan nem korrelálnak egymással. A ferdeszögű forgatással kapott faktorok korrelálnak. Bármelyik típusú forgatást is használjuk, jó, ha az új faktorok faktorsúlyai vagy közel vannak nullához, vagy nagyon távol tőle. Egy nullához közeli
érték azt jelenti, hogy az
változó nem kapcsolódik szorosan az
faktorhoz. Egy magas (pozitív vagy negatív)
érték azt jelenti, hogy az
változót erősen meghatározza az
faktor. Ha minden egyes tesztpontszám szoros kapcsolatban van néhány faktorral, de nem mindegyik áll kapcsolatban a többivel, akkor könnyebb meghatározni a faktorokat.
A derékszögű faktor-rotáció egyik módszerét, amelyet gyakran használnak, varimax rotációnak nevezik. Ez azon a feltevésen alapul, hogy j faktor interpretálhatóságát mérni lehet a faktorsúlyaik négyzetének varianciájával, vagyis az
varianciájával. Ha ez a variancia nagy, akkor az
értékek vagy nullához vagy egyhez tendálnak. Ezért a varimax rotáció ezeknek a varianciáknak az összegét maximalizálja minden faktor esetében. H.F. Kaiser javasolta ezt a megközelítést, majd később módosította is egy kicsit. A módosításban normalizálta a faktorsúlyokat, mielőtt maximalizálta a négyzetük varianciáját, mivel ez jobb eredményt ad. A varimax rotáció ezért elvégezhető a Kaiser-féle normalizációval vagy anélkül. Számos egyéb derékszögű forgatási eljárást is kidolgoztak, ám általában a varimax rotáció használata ajánlott egy probléma megközelítéshez.
Néha a faktoranalízis során kénytelenek vagyunk elvetni a korrelálatlan faktorok gondolatát azért, hogy a lehető legegyszerűbb faktorsúlyokat kapjuk. Ilyen esetekben a ferdeszögű forgatás jobb eredményt adhat, mint a derékszögű. Természetesen a ferdeszögű forgatásnak is számos eljárása ismert.
FA<-factanal(d, factors=2, rotation="varimax", scores="Bartlett")
FA
|
|
3.4. R-forráskód
|
A 3.4. R-forráskódban a „factors” paranccsal két faktoros megoldást kértünk, a forgatásnál a „varimax” módszert, míg az egyes személyek faktorértékeinek kiszámításánál a Bartlett-módszert alkalmazzuk.
Call:
factanal(x = d, factors = 2, scores = "Bartlett", rotation = "varimax")
Uniquenesses:
v1 v2 v3 v4 v5 v6
0.408 0.081 0.005 0.030 0.022 0.009
Loadings:
Factor1 Factor2
v1 0.404 0.655
v2 0.155 0.946
v3 0.175 0.982
v4 0.964 0.200
v5 0.949 0.280
v6 -0.970 -0.225
Factor1 Factor2
SS loadings 2.988 2.457
Proportion Var 0.498 0.410
Cumulative Var 0.498 0.908
Test of the hypothesis that 2 factors are sufficient.
The chi square statistic is 5.27 on 4 degrees of freedom.
The p-value is 0.261
|
|
3.4. R-eredmény.
|
A faktoranalízis eredménye a 3.4. R-eredményen látható. Elsőként az egyes változók egyedi hatását, az egyedi fakorokat láthatjuk a „uniquenesses” címszó alatt. A egyedi faktorok és a kommunalitások kapcsolatban vannak egymással, összegük 1 (3.5. R-forráskód). Minél nagyobb egy változó egyedi faktorbeli értéke, annál kisebb lesz a kommunalitása, és minél nagyobb a kommunalitás értéke, annál nagyobb mértékben őrzi meg a faktor az eredeti változók szórását.
Communaltities<-(1-FA$uniquenesses)
print(Communaltities,digits=3)
|
|
3.5. R-forráskód
|
Az egyes változók kommunalitását a 3.5. R-eredmény tartalmazza. Láthatjuk, hogy a faktorok a legjobban a v6-os változó szórását őrizték meg, legkevésbé pedig az első (v1) itemét, hiszen ezek kommunalitása a legnagyobb, illetve a legkisebb. Mindez arra utal, hogy a faktorok az utolsó itemből származó információkat őrizték meg a leginkább, és az első itemből származókat a legkevésbé.
v1 v2 v3 v4 v5 v6
0.592 0.919 0.995 0.970 0.978 0.991
|
|
3.5. R-eredmény.
|
Térjünk vissza a 3.4. R-eredmény többi adatára. Az egyedi faktorok után „loadings” címszóval a faktorsúlyokat láthatjuk. Amint már arról korábban szó volt, a faktorsúlyok mutatják az egyes változók faktorokhoz való relatív hozzájárulását, a változók és a faktor közötti korrelációt. Ezek az értékek a már rotált faktorsúlyok. A faktorsúlyok megerősítik a korrelációs mátrix alapján felállított hipotézisünket, mely szerint két faktoros modell illeszkedik az adatokra. A v1-v3 faktor a második faktornál, míg a v4-v6 az első faktornál szerepel nagyobb súllyal. A v6 item faktorsúlya negatív előjelű, ennek oka, hogy fordított itemről van szó.
Ezután a főkomponens-analízisből már ismert varianciák és magyarázott varianciahányadok szerepelnek. A táblázatban látható, hogy az első faktor varianciája majdnem 3, míg a második faktoré 2,5 („SS loadings”). Az első faktor a varianciahányad közel 50%-át magyarázza, míg a második a 41%-át („Proportion var”). A „Cumulative var” sor mutatja, hogy a két faktor összesen az összvariancia 91%-át magyarázza.
Az eredmény utolsó soraiban egy khi-négyzet próbát látunk, amely azt teszteli, hogy illeszkedik-e az adatokra az általunk választott kétfaktoros modell. Ha a tesztstatisztika értéke túl nagy, akkor nem illeszkedik a modell, egy másik megoldást kell választanunk. A khi-négyzet statisztika értéke a mintára 5,27, 4 szabadsági fokkal, a hozzá tartozó valószínűség p=0,261. Mivel jelen esetben p>0,05, így megtartjuk a null-hipotézist, vagyis a kétfaktoros modell valóban jól illeszkedik az adatokra. A két faktort pedig a faktorsúlyoknál vizsgált szerkezet alapján a következőképpen nevezhetjük el: mivel az első három változó a második faktorral mutat szorosabb kapcsolatot, így azt elnevezhetjük az állapot-szorongás faktorának, míg az első faktort - amely a második három változóval mutat szorosabb kapcsolatot - a vonás-szorongásnak.
Itt érdemes egy kis kitérőt tenni a khi-négyzet próba kapcsán. A khi-négyzet próba a modell illeszkedését vizsgálja oly módon, hogy az eredeti változókból számított korrelációs mátrix értékeit hasonlítja össze a modell alapján becsült korrelációs mátrix értékeivel. Ha az értékek között kicsi a különbség, akkor a modell jól illeszkedik az adatokra. Az eredeti korrelációs mátrixot a 3.2. R-eredményen láthatjuk. A modell alapján becsült korrelációs mátrixot a 3.6. R-forráskóddal hívhajuk elő és a 3.6. R-eredményen láthatjuk.
d.cor<-cor(d)
szfa<-lapply(1:2,function(nf) factanal(covmat=d.cor, factors=nf, method="mle"))
pred<-szfa[[2]]$loadings%*%t(szfa[[2]]$loadings)+diag(szfa[[2]]$uniquenesses)
print(pred,digits=3)
|
|
3.6. R-forráskód
|
v1 v2 v3 v4 v5 v6
v1 1.000 0.682 0.714 0.521 0.566 -0.539
v2 0.682 1.000 0.956 0.339 0.411 -0.363
v3 0.714 0.956 1.000 0.366 0.441 -0.391
v4 0.521 0.339 0.366 1.000 0.971 -0.980
v5 0.566 0.411 0.441 0.971 1.000 -0.983
v6 -0.539 -0.363 -0.391 -0.980 -0.983 1.000
|
|
3.6. R-eredmény.
|
Ha a 3.2. és a 3.6. R-eredményt összevetjük, akkor láthatjuk, hogy az értékek közel azonosak.
Ám sokkal áttekinthetőbben látjuk az eltéréseket, ha a két mátrix különbségét vizsgáljuk. Ez főként akkor hasznos, ha egy nagyobb mátrixról van szó. A mátrixok különbségét a 3.7. R-forráskóddal kérhetjük le.
print(d.cor-pred,digits=3)
|
|
3.7. R-forráskód
|
v1 v2 v3 v4 v5 v6
v1 2.98e-06 3.14e-02 -9.54e-04 1.61e-02 -5.84e-02 -1.88e-02
v2 3.14e-02 -1.36e-07 -3.87e-05 2.32e-02 -6.56e-03 4.52e-03
v3 -9.54e-04 -3.87e-05 -8.95e-06 -1.52e-03 8.23e-04 -1.30e-04
v4 1.61e-02 2.32e-02 -1.52e-03 -8.72e-08 1.12e-03 5.24e-04
v5 -5.84e-02 -6.56e-03 8.23e-04 1.12e-03 1.53e-07 -5.13e-05
v6 -1.88e-02 4.52e-03 -1.30e-04 5.24e-04 -5.13e-05 2.67e-08
|
|
3.7. R-eredmény.
|
A 3.7. R-eredményen láthatjuk, hogy a különbségmátrix értékei nagyon kicsik, ami a modell illeszkedésére utal, ahogyan azt a khi-négyzet statisztika szignifikancia-szintjéből is láthattuk. A faktoranalízisnek pont ez a lényege: a reprodukált korrelációs mátrix minél jobban hasonlítson az eredeti korrelációs mátrixhoz.
|