mvst

4.4 A csoportok szétválasztásának problémája

A diszkriminancia-analízis módszerével tehát alapvetően az emberek különböző csoportjait próbáljuk szétválasztani.

Általános esetben van m random minta, melyek különböző csoportokból származnak, és melyek nagysága n 1 ,  n 2  ...  n m . Ezen túl a minta minden egyes tagjáról rendelkezésünkre áll p darab változó  X 1 ,  X 2  ...  X p  értéke. Ezeket az adatokat a 4.2. táblázat szemlélteti.

 
Személyek X 1 X 2 ... X p
1 x 111 x 112 ... x 11p
2 x 211 x 212 ... x 21p
.
.
.
.
.
.
.
.
.
.
.
.
n 1 x n 1 11 x n 1 12 ... x n 1 1p
1 x 121 x 122 ... x 12p
2 x 221 x 222 ... x 22p
.
.
.
.
.
.
.
.
.
.
.
.
n 2 x n 2 21 x n 2 22 ... x n 2 2p
1 x 1m1 x 1m2 ... x 1mp
2 x 2m1 x 2m2 ... x 2mp
.
.
.
.
.
.
.
.
.
.
.
.
n m x n m m1 x n m m2 ... x n m mp
 
  4.2. táblázat.  

A diszkriminancia-analízis esetén az adatokat nem szükséges sztenderdizálni, ennek oka, hogy az analízis eredményét nem befolyásolja jelentős mértékben az egyes változók mértékegysége.

A csoportok szétválasztásának egyik megközelítése a Mahalanobis-féle távolságot használja. Erről a távolságmérő eljárásról részletesebben a 4.8.1 mellékletben van szó. Az eljárás lényege, hogy az m minta átlagvektorával becsüljük a csoportok valódi átlagvektorát. Az egyes személyek csoportközéptől való átlagát számoljuk ki a Mahalanobis-féle távolsággal, és minden személyt abba a csoportba sorolunk be ez alapján, amelyhez közelebb esik. Ez lehet az a csoport, amelybe a személy valóban beletartozik, de lehet másik is. A helyes besorolások aránya világosan megmutatja, hogy mennyire jól lehet a csoportokat szétválasztani a használt változók alapján.

   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.