mvst

2.3.2 A korrelációs és a kovariancia mátrix kiszámítása

Ebben a szakaszban a kovariancia és a korrelációs mátrixot vizsgáljuk meg, hogy valóban szorosan együtt változnak-e a négy tantárgy osztályzatai.

A korreláció és a kovariancia két egymással rokon fogalom, melyek azt fejezik ki, hogy két változó mennyire változik együtt. Tegyük fel, hogy van két intelligencia tesztünk. Ha mindkét intelligencia tesztet felvesszük ugyanazzal az emberrel, akkor - mivel az intelligencia nem egy napról-napra változó tulajdonság - a két teszteredménynek relatíve azonos értéket kell adnia, ha valóban mindkét teszt az intelligenciát méri. Az azonos érték természetesen nem arra utal, hogy ha egyik teszten 115 pontot ért el az illető, akkor a másikon is 115 körüli értéket kell elérnie, hanem az értéknek relatíve ugyanolyan nagyságú intelligenciára kell utalnia. Vagyis ha az egyik tesztben a 115 egy átlagos értéket jelent, akkor a másik tesztben elért értéknek is átlagosnak kell lennie, vagyis lehet akár 316 is, ha annak a tesznek a pontszámainak ennyi az átlaga. Továbbá, ha több emberrel is felvesszük ezeket a teszteket, akkor ezeknek a tesztpontszámoknak a két teszt esetében, együtt kell mozogniuk. Ez arra utal, hogy a kevésbé intelligens személyek mindkét tesztben alacsonyabb pontszámot érnek el, míg az intelligensebbek magasabbat.

Írjuk fel formálisan is, képletek segítségével az eddig tárgyaltakat. Van egy jellemzője az egyénnek, amit mérni szeretnénk, vagyis az intelligencia (I). Ezt két változó segítségével tesszük ( X 1  és X 2 ).

I=( X 1 X 2 )

Az együttjárás vizsgálatakor ezt a két változót, vagyis X 1 -et és X 2 -t vetjük össze. Vizsgáljuk először a két változó kovarianciáját. A két változó kovarianciáját cov( X 1 , X 2 ) -vel jelöljük. A kovarianciát a várható értékkel határozzuk meg:

cov( X 1 , X 2 )=E[( X 1 μ 1 )( X 2 μ 2 )]

A képletben az X 1 , X 2 a két változót jelöli, míg µ 1  és µ 2 az X 1  és X 2 változók valószínűségi eloszlásának az átlaga.

Definíció szerint a kovariancia szimmetrikus, vagyis cov( X 1 , X 2 )=cov( X 2 , X 1 ) . A kovariancia másik tulajdonsága, hogy egy változó önmagával vett kovarianciája egyenlő a változó varianciájával, vagyis cov( X 1 , X 1 )=var( X 1 ) .

Ha mindezt egy kissé általánosabban szeretnénk felírni több változóra, akkor azt a következőképpen tehetjük meg.

Van egy X jelenség (mint előzőleg az intelligencia volt), amelyet X 1 , X 2 ...,  X p változókkal mérünk.

X=( X 1 X 2 . . . X p )

Ekkor két tetszőleges változó ( X i  és X j ) kovarianciáját a következőképpen írhatjuk fel:

cov( X i , X j )=E[( X i μ i )( X j μ j )]

A kovarianciát röviden c ij -vel jelölhetjük.

Mivel a kovarianciákat a szimmetria jellemzi, így a kovariancia mátrix is szükségszerűen szimmetrikus lesz:

C=[ c 11 c 12 . . . c 1p c 21 c 22 . . . c 2p . . . . . . . . . c p1 c p2 . . . c pp ]

A mátrix főátlójában található c ii eleme az X i változó varianciája, míg egy c ij elem X i  és X j változók kovarianciája. A főkomponensek varianciái a C mátrix sajátértékei. Összesen p darab van belőlük, értékük lehet nulla, de negatív értékeket nem vehetnek fel.  

A c ij  kovariancia nagysága az X i  és X j komponensek sztenderd szórásától függ. Ha szeretnénk közvetlenebbül megismerni a két változó együttjárását, akkor azonos mértékre kell hozni a változókat, hogy megkaphassuk a korrelációs értéket.

Ha adottak az X i  és X j komponensek, akkor a köztük lévő korrelációt  cor( X i , X j ) , röviden r ij -vel jelöljük. A korrelációs értéket a következőképpen számíthatjuk ki:

cor( X i , X j )= cov( X i , X j ) σ i σ j

A képletben szereplő σ i  és σ j az X i  és X j változók sztenderd szórásai.

A korreláció kiszámításának képletéből következik, hogy értéke -1 és 1 közé esik. Továbbá a korreláció örökli a kovariancia szimmetrikus tulajdonságát, vagyis cor( X i , X j )=cor( X j , X i ) . Ezen kívül  cor( X i , X i )=1 , vagyis egy változó tökéletesen együtt változik saját magával, azonos irányban.  Ha pedig két változó teljesen független egymástól, akkor korrelációs értékük nulla. A -1-es korrelációs érték is tökéletes együttváltozásra utal, ekkor a változás iránya ellentétes: az egyik változó értékeinek csökkenése a másik változó értékeinek a növekedését vonja maga után. Ahogyan a kovarianciánál láthattuk, a korrelációs értékeket is megjeleníthetjük egy mátrix segítségével.

cor( X 1 , X 1 ) cor( X 1 , X 2 ) ... cor( X 1 , X p ) cor( X 2 , X 1 ) cor( X 2 , X 2 ) cor( X 2 , X p ) . . . cor( X p , X 1 ) cor( X p , X 2 ) cor( X p , X p )

Figyelembe véve, hogy egy változó önmagával vett korrelációja nulla, a korrelációs mátrix főátlójában végig 1 értékek szerepelnek:

1 cor( X 1 , X 2 ) ... cor( X 1 , X p ) cor( X 2 , X 1 ) 1 cor( X 2 , X p ) . . . cor( X p , X 1 ) cor( X p , X 2 ) 1

Ezek után számítsuk ki az R-program segítségével a kovariancia-majd a korrelációs mátrixot (2.3-2.4. R-forráskód, illetve R-eredmény).

cov<-cov(d)
print(cov,digits=3)
2.3. R-forráskód

            matek fizika informatika kemia
matek        2.53   1.51        2.28  2.19
fizika       1.51   1.19        1.26  1.47
informatika  2.28   1.26        2.28  1.94
kemia        2.19   1.47        1.94  2.11
2.3. R-eredmény. A 2.3. táblázat adatainak kovariancia mátrixa.

cor<-cor(d)
print(cor,digits=3)
2.4. R-forráskód

            matek fizika informatika kemia
matek       1.000  0.871       0.949 0.950
fizika      0.871  1.000       0.766 0.927
informatika 0.949  0.766       1.000 0.887
kemia       0.950  0.927       0.887 1.000
2.4. R-ererdmény.

Mind a kovariancia, mind a korrelációs mátrix adatai arra utalnak, hogy szoros kapcsolat van a változók között. A kovariancia, illetve a korrelációs értékek nullánál nagyobbak, ami azonos irányú tendenciákra utal. E két mátrix is alátámasztja a feltételezésünket, hogy a változók szorosan együtt változnak.

   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.