4.4 A csoportok szétválasztásának problémája
A diszkriminancia-analízis módszerével tehát alapvetően az emberek különböző csoportjait próbáljuk szétválasztani.
Általános esetben van m random minta, melyek különböző csoportokból származnak, és melyek nagysága
. Ezen túl a minta minden egyes tagjáról rendelkezésünkre áll p darab változó értéke. Ezeket az adatokat a 4.2. táblázat szemlélteti.
|
1 |
|
|
... |
|
2 |
|
|
... |
|
. . . |
. . . |
. . . |
|
. . . |
|
|
|
... |
|
1 |
|
|
... |
|
2 |
|
|
... |
|
. . . |
. . . |
. . . |
|
. . . |
|
|
|
... |
|
1 |
|
|
... |
|
2 |
|
|
... |
|
. . . |
. . . |
. . . |
|
. . . |
|
|
|
... |
|
|
|
|
4.2. táblázat. |
|
A diszkriminancia-analízis esetén az adatokat nem szükséges sztenderdizálni, ennek oka, hogy az analízis eredményét nem befolyásolja jelentős mértékben az egyes változók mértékegysége.
A csoportok szétválasztásának egyik megközelítése a Mahalanobis-féle távolságot használja. Erről a távolságmérő eljárásról részletesebben a 4.8.1 mellékletben van szó. Az eljárás lényege, hogy az m minta átlagvektorával becsüljük a csoportok valódi átlagvektorát. Az egyes személyek csoportközéptől való átlagát számoljuk ki a Mahalanobis-féle távolsággal, és minden személyt abba a csoportba sorolunk be ez alapján, amelyhez közelebb esik. Ez lehet az a csoport, amelybe a személy valóban beletartozik, de lehet másik is. A helyes besorolások aránya világosan megmutatja, hogy mennyire jól lehet a csoportokat szétválasztani a használt változók alapján.
|