mvst

3.4.1 Faktorsúlyok kiszámítása

A faktorsúlyok kiszámításának egyik módja, hogy elvégzünk egy főkomponens-analízist és csak az első m főkomponenst vesszük figyelembe, ezek lesznek a faktorok. Az így kapott faktorok nem korrelálnak egymással és így a specifikus faktorokkal sem.

Ha F 1 , F 2 ,...  F m az előzetes faktorok, akkor ezek lineáris kombinációit a következőképpen lehet kiszámolni

F 1 ' = d 11 F 1 + d 12 F 2 +...+ d 1m F m F 2 ' = d 21 F 1 + d 22 F 2 +...+ d 2m F m . . . F m ' = d m1 F 1 + d m2 F 2 +...+ d mm F m       (3.6. egyenlet)

Ezek egymással nem korrelálnak és jól „magyarázzák” az adatokat.

Általában a faktorok számát (m) a számításkor inputként adjuk meg, de alapvetően az adatok természete határozza meg. Ha főkomponens-analízist használunk egy előzetes eredmények meghatározásához, egy durva „hüvelykujjszabály” az, hogy m értékét úgy választjuk meg, hogy egyenlő legyen a tesztpontszámok korrelációs mátrixából kiszámított egynél nagyobb sajátértékek számával. A logika itt is ugyanaz, mint a főkomponens-analízis esetében: az egynél kisebb sajátértékkel rendelkező faktorok kevesebbet „magyaráznak” az adatok varianciájából, mint az eredeti tesztpontszámok. Általánosságban az m növelése a változók kommunalitásának növekedését eredményezi. Jóllehet, a kommunalitások nem változnak a faktor-rotáció során.

Ezek után nézzünk egy konkrét példát a 3.1. táblázat adatai alapján. Először vigyük be a táblázat adatait a 3.1. R-forráskóddal.

d<-data.frame(v1=c(2,5,4,7,3,5,4,7,2,3), v2=c(3,5,4,7,4,5,6,4,2,3), v3=c(2,4,3,7,4,5,6,4,2,3), v4=c(5,2,4,7,2,3,5,7,4,1), v5=c(4,1,4,7,2,3,5,6,4,1), v6=c(4,7,4,1,7,5,3,1,4,7))
print(d)
3.1. R-forráskód

    v1 v2 v3 v4 v5 v6
1   2  3  2  5  4  4
2   5  5  4  2  1  7
3   4  4  3  4  4  4
4   7  7  7  7  7  1
5   3  4  4  2  2  7
6   5  5  5  3  3  5
7   4  6  6  5  5  3
8   7  4  4  7  6  1
9   2  2  2  4  4  4
10  3  3  3  1  1  7	
3.1. R-eredmény.

A 3.1. táblázat adatai megegyeznek a 3.1. R-eredmény adataival. Mivel a faktoranalízis is a korrelációs mátrixból indul ki - a főkomponens-analízishez hasonlóan -, így elsőként az adatok korrelációs mátrixát érdemes megvizsgálni (3.2. R-forráskód).

cor<-cor(d)
print(cor, digits=3)
3.2. R-forráskód

       v1     v2     v3     v4     v5     v6
v1  1.000  0.713  0.713  0.537  0.508 -0.558
v2  0.713  1.000  0.956  0.362  0.405 -0.358
v3  0.713  0.956  1.000  0.364  0.442 -0.391
v4  0.537  0.362  0.364  1.000  0.972 -0.980
v5  0.508  0.405  0.442  0.972  1.000 -0.983
v6 -0.558 -0.358 -0.391 -0.980 -0.983  1.000
3.2. R-eredmény.

A 3.2. R-eredményen láthatjuk, hogy az első három változó (v1-v3) viszonylag szorosabb kapcsolatban van egymással, hiszen a mátrixban szereplő korrelációs értékek elég magasak: a v1 és v2 közötti korreláció értéke 0,713, v1 és v3 között 0,713, míg v2 és v3 között 0,956. Hasonlóan erős kapcsolatot figyelhetünk meg v4-v6 változók estében is: v4 és v45 változók közötti korreláció értéke 0,972, v4 és v6 között -0,98, míg v5 és v6 között -0,983.

A korrelációs mátrix értékei azt sugallják, hogy két faktort azonosíthatunk. Az első faktort az első három változó (vagyis az állapot-szorongás itemei) alkotják, míg a második faktort a második három változó, azaz a vonás-szorongás itemei adják. A következő lépésben faktoranalízis segítségével teszteljük, hogy helyes-e a megérzésünk (3.3. R-forráskód). Először a forgatás előtti faktorokat vizsgáljuk meg.

FA<-factanal(d, factors=2, rotation="none")
FA
3.3. R-forráskód

 Call:
factanal(x = d, factors = 2, rotation = "none")
Uniquenesses: v1 v2 v3 v4 v5 v6 0.408 0.081 0.005 0.030 0.022 0.009
Loadings: Factor1 Factor2 v1 0.763 0.102 v2 0.830 0.479 v3 0.871 0.486 v4 0.765 -0.620 v5 0.817 -0.558 v6 -0.788 0.609
Factor1 Factor2 SS loadings 3.904 1.541 Proportion Var 0.651 0.257 Cumulative Var 0.651 0.908
Test of the hypothesis that 2 factors are sufficient. The chi square statistic is 5.27 on 4 degrees of freedom. The p-value is 0.261
3.3. R-eredmény.

A 3.3. R-eredményen láthatjuk a forgatás előtti faktorok adatait. Elsőként az egyes változók egyedi hatását, az egyedi fakorokat láthatjuk a „uniquenesses” címszó alatt. A „loadings” címszóval a faktorsúlyokat jelölik. A forgatás nélküli faktorok esetében több olyan változó van, amely mindkét faktorral erős kapcsolatban van. Ilyen például a v6 változó, amely faktorsúlya az első faktornál -0,788, a második faktornál pedig 0,609. Ezáltal a vizsgált látens struktúra kevésbé áttekinthető.

A faktoranalízis modelljének végtelen számú alternatív megoldása van, és ez vezet a faktoranalízis második lépéséhez, amelyet faktor-rotációnak, vagy faktorforgatásnak hívnak.

   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.