2.3.3 Sajátértékek és sajátvektorok kiszámítása
A főkomponens-analízis során kapott sajátértékek egyenlők a kapcsolódó főkomponens által magyarázott varianciával (). Mivel a főkomponens-analízisben a legtöbbször sztenderdizálják a változókat, így azok varianciája 1. Ebből következik, hogy minden olyan főkomponens, amely sajátértéke 1-nél nagyobb, az eredeti változóknál nagyobb magyarázóerővel bír. Ezért általánosan használt szabály a főkomponensek számának meghatározásához, hogy azokat a főkomponenseket tartjuk meg, melyek sajátértéke 1-nél nagyobb.
A sajátvektorok tulajdonképpen súlyozások, melyek segítségével az eredeti adatokból megkaphatjuk a főkomponensértékeket.
A főkomponens súlyokkal kapcsolatban fontos tudni, hogy vannak olyan statisztikai könyvek, illetve programok, amelyek nem a sajátvektorokat, hanem az úgynevezett komponens mátrixot, nevezik főkomponens súlyoknak.
A 2.5. R-forráskód és R-eredmény azt mutatja, hogyan kaphatjuk meg a sajátértékeket és a sajátvektorokat az R program segítségével.
eigen<-eigen(cov)
print(eigen,digits=3)
|
|
2.5. R-forráskód
|
$values
[1] 7.5469 0.4215 0.0740 0.0687
$vectors
[,1] [,2] [,3] [,4]
[1,] 0.573 -0.134 -0.216 0.779
[2,] 0.361 0.656 -0.584 -0.315
[3,] 0.525 -0.653 -0.123 -0.532
[4,] 0.517 0.354 0.773 -0.104
|
|
2.5. R-eredmény.
|
A 2.5. R-eredményen a „values” utal a sajátértékekre. Láthatjuk, hogy az első főkomponens sajátértéke 7,55 kerekítve, míg a második főkomponensé már csak 0,42. Ez alapján valószínű, hogy csak az első főkomponenst fogjuk megtartani, de ez már a következő, utolsó lépés feladata lesz.
A „vectors” a sajátvektorok komponenseit tartalmazza. Ezek segítségével lehet kiszámolni az egyes főkomponensbeli értékeket, ahogyan azt a következő lépésben tesszük.
Fontos tudni, hogy az R-program normalizált sajátvektorértékeket jelenít meg, azaz az egyes sajátvektorokhoz tartozó értékek négyzetösszege 1 (például a 2.5. R-eredmény sajátvektorának első komponense esetében:
).
|