mvst

3.4.2 Faktor-rotáció

Ebben a lépésben az előzetes faktorokat átalakítjuk, hogy ezáltal könnyebben interpretálható faktorokat kapjunk. A „forgatás” ebben az esetben tulajdonképpen a fenti egyenletben szereplő d ij  értékek megválasztását jelenti.

A faktor-rotáció lehet derékszögű vagy ferdeszögű. A derékszögű forgatással kapott új faktorok az eredeti faktorokhoz hasonlóan nem korrelálnak egymással. A ferdeszögű forgatással kapott faktorok korrelálnak. Bármelyik típusú forgatást is használjuk, jó, ha az új faktorok faktorsúlyai vagy közel vannak nullához, vagy nagyon távol tőle. Egy nullához közeli   a ij  érték azt jelenti, hogy az X i változó nem kapcsolódik szorosan az F j faktorhoz. Egy magas (pozitív vagy negatív)   a ij  érték azt jelenti, hogy az X i változót erősen meghatározza az F j faktor. Ha minden egyes tesztpontszám szoros kapcsolatban van néhány faktorral, de nem mindegyik áll kapcsolatban a többivel, akkor könnyebb meghatározni a faktorokat.

A derékszögű faktor-rotáció egyik módszerét, amelyet gyakran használnak, varimax rotációnak nevezik. Ez azon a feltevésen alapul, hogy j faktor interpretálhatóságát mérni lehet a faktorsúlyaik négyzetének varianciájával, vagyis az   a 1j 2 , a 2j 2 ,... a pj 2  varianciájával.  Ha ez a variancia nagy, akkor az   a ij 2  értékek vagy nullához vagy egyhez tendálnak. Ezért a varimax rotáció ezeknek a varianciáknak az összegét maximalizálja minden faktor esetében. H.F. Kaiser javasolta ezt a megközelítést, majd később módosította is egy kicsit. A módosításban normalizálta a faktorsúlyokat, mielőtt maximalizálta a négyzetük varianciáját, mivel ez jobb eredményt ad. A varimax rotáció ezért elvégezhető a Kaiser-féle normalizációval vagy anélkül. Számos egyéb derékszögű forgatási eljárást is kidolgoztak, ám általában a varimax rotáció használata ajánlott egy probléma megközelítéshez.

Néha a faktoranalízis során kénytelenek vagyunk elvetni a korrelálatlan faktorok gondolatát azért, hogy a lehető legegyszerűbb faktorsúlyokat kapjuk. Ilyen esetekben a ferdeszögű forgatás jobb eredményt adhat, mint a derékszögű. Természetesen a ferdeszögű forgatásnak is számos eljárása ismert.

FA<-factanal(d, factors=2, rotation="varimax", scores="Bartlett")
FA
3.4. R-forráskód

A 3.4. R-forráskódban a „factors” paranccsal két faktoros megoldást kértünk, a forgatásnál a „varimax” módszert, míg az egyes személyek faktorértékeinek kiszámításánál a Bartlett-módszert alkalmazzuk.

 Call:
factanal(x = d, factors = 2, scores = "Bartlett", rotation = "varimax")
Uniquenesses: v1 v2 v3 v4 v5 v6 0.408 0.081 0.005 0.030 0.022 0.009
Loadings: Factor1 Factor2 v1 0.404 0.655 v2 0.155 0.946 v3 0.175 0.982 v4 0.964 0.200 v5 0.949 0.280 v6 -0.970 -0.225
Factor1 Factor2 SS loadings 2.988 2.457 Proportion Var 0.498 0.410 Cumulative Var 0.498 0.908
Test of the hypothesis that 2 factors are sufficient. The chi square statistic is 5.27 on 4 degrees of freedom. The p-value is 0.261
3.4. R-eredmény.

A faktoranalízis eredménye a 3.4. R-eredményen látható. Elsőként az egyes változók egyedi hatását, az egyedi fakorokat láthatjuk a „uniquenesses” címszó alatt. A egyedi faktorok és a kommunalitások kapcsolatban vannak egymással, összegük 1 (3.5. R-forráskód). Minél nagyobb egy változó egyedi faktorbeli értéke, annál kisebb lesz a kommunalitása, és minél nagyobb a kommunalitás értéke, annál nagyobb mértékben őrzi meg a faktor az eredeti változók szórását.

      

Communaltities<-(1-FA$uniquenesses)
print(Communaltities,digits=3)
3.5. R-forráskód

Az egyes változók kommunalitását a 3.5. R-eredmény tartalmazza. Láthatjuk, hogy a faktorok a legjobban a v6-os változó szórását őrizték meg, legkevésbé pedig az első (v1) itemét, hiszen ezek kommunalitása a legnagyobb, illetve a legkisebb. Mindez arra utal, hogy a faktorok az utolsó itemből származó információkat őrizték meg a leginkább, és az első itemből származókat a legkevésbé.

   v1    v2    v3    v4    v5    v6 
0.592 0.919 0.995 0.970 0.978 0.991
3.5. R-eredmény.

Térjünk vissza a 3.4. R-eredmény többi adatára. Az egyedi faktorok után „loadings” címszóval a faktorsúlyokat láthatjuk. Amint már arról korábban szó volt, a faktorsúlyok mutatják az egyes változók faktorokhoz való relatív hozzájárulását, a változók és a faktor közötti korrelációt. Ezek az értékek a már rotált faktorsúlyok. A faktorsúlyok megerősítik a korrelációs mátrix alapján felállított hipotézisünket, mely szerint két faktoros modell illeszkedik az adatokra. A v1-v3 faktor a második faktornál, míg a v4-v6 az első faktornál szerepel nagyobb súllyal. A v6 item faktorsúlya negatív előjelű, ennek oka, hogy fordított itemről van szó.

Ezután a főkomponens-analízisből már ismert varianciák és magyarázott varianciahányadok szerepelnek. A táblázatban látható, hogy az első faktor varianciája majdnem 3, míg a második faktoré 2,5 („SS loadings”). Az első faktor a varianciahányad közel 50%-át magyarázza, míg a második a 41%-át („Proportion var”). A „Cumulative var” sor mutatja, hogy a két faktor összesen az összvariancia 91%-át magyarázza.

Az eredmény utolsó soraiban egy khi-négyzet próbát látunk, amely azt teszteli, hogy illeszkedik-e az adatokra az általunk választott kétfaktoros modell. Ha a tesztstatisztika értéke túl nagy, akkor nem illeszkedik a modell, egy másik megoldást kell választanunk. A khi-négyzet statisztika értéke a mintára 5,27, 4 szabadsági fokkal, a hozzá tartozó valószínűség p=0,261. Mivel jelen esetben p>0,05, így megtartjuk a null-hipotézist, vagyis a kétfaktoros modell valóban jól illeszkedik az adatokra. A két faktort pedig a faktorsúlyoknál vizsgált szerkezet alapján a következőképpen nevezhetjük el: mivel az első három változó a második faktorral mutat szorosabb kapcsolatot, így azt elnevezhetjük az állapot-szorongás faktorának, míg az első faktort - amely a második három változóval mutat szorosabb kapcsolatot - a vonás-szorongásnak.

Itt érdemes egy kis kitérőt tenni a khi-négyzet próba kapcsán. A khi-négyzet próba a modell illeszkedését vizsgálja oly módon, hogy az eredeti változókból számított korrelációs mátrix értékeit hasonlítja össze a modell alapján becsült korrelációs mátrix értékeivel. Ha az értékek között kicsi a különbség, akkor a modell jól illeszkedik az adatokra. Az eredeti korrelációs mátrixot a 3.2. R-eredményen láthatjuk. A modell alapján becsült korrelációs mátrixot a 3.6. R-forráskóddal hívhajuk elő és a 3.6. R-eredményen láthatjuk.

d.cor<-cor(d)
szfa<-lapply(1:2,function(nf) factanal(covmat=d.cor, factors=nf, method="mle"))
pred<-szfa[[2]]$loadings%*%t(szfa[[2]]$loadings)+diag(szfa[[2]]$uniquenesses)
print(pred,digits=3)
3.6. R-forráskód

       v1     v2     v3     v4     v5     v6
v1  1.000  0.682  0.714  0.521  0.566 -0.539
v2  0.682  1.000  0.956  0.339  0.411 -0.363
v3  0.714  0.956  1.000  0.366  0.441 -0.391
v4  0.521  0.339  0.366  1.000  0.971 -0.980
v5  0.566  0.411  0.441  0.971  1.000 -0.983
v6 -0.539 -0.363 -0.391 -0.980 -0.983  1.000
3.6. R-eredmény.

Ha a 3.2. és a 3.6. R-eredményt összevetjük, akkor láthatjuk, hogy az értékek közel azonosak.

Ám sokkal áttekinthetőbben látjuk az eltéréseket, ha a két mátrix különbségét vizsgáljuk. Ez főként akkor hasznos, ha egy nagyobb mátrixról van szó. A mátrixok különbségét a 3.7. R-forráskóddal kérhetjük le.

print(d.cor-pred,digits=3)
3.7. R-forráskód

          v1        v2        v3        v4        v5        v6
v1  2.98e-06  3.14e-02 -9.54e-04  1.61e-02 -5.84e-02 -1.88e-02
v2  3.14e-02 -1.36e-07 -3.87e-05  2.32e-02 -6.56e-03  4.52e-03
v3 -9.54e-04 -3.87e-05 -8.95e-06 -1.52e-03  8.23e-04 -1.30e-04
v4  1.61e-02  2.32e-02 -1.52e-03 -8.72e-08  1.12e-03  5.24e-04
v5 -5.84e-02 -6.56e-03  8.23e-04  1.12e-03  1.53e-07 -5.13e-05
v6 -1.88e-02  4.52e-03 -1.30e-04  5.24e-04 -5.13e-05  2.67e-08
3.7. R-eredmény.

A 3.7. R-eredményen láthatjuk, hogy a különbségmátrix értékei nagyon kicsik, ami a modell illeszkedésére utal, ahogyan azt a khi-négyzet statisztika szignifikancia-szintjéből is láthattuk. A faktoranalízisnek pont ez a lényege: a reprodukált korrelációs mátrix minél jobban hasonlítson az eredeti korrelációs mátrixhoz.

   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.