4.5 Kanonikus diszkriminancia függvények
Általában hasznos dolog, ha
változóknak fel tudjuk írni egy olyan függvényét, amely valamilyen eljárással a lehető legjobban tudja szétválasztani az m csoportot. A legegyszerűbb megközelítés, ha a változók lineáris kombinációinak előállításával próbáljuk megközelíteni a problémát:
A Z függvény akkor tudja a csoportokat jól elkülöníteni, ha az egyes csoportok átlagai egymástól jelentős mértékben eltérnek, ám a csoporton belül viszonylag konstansak az átlagok. Ezért az
együtthatók meghatározásának egyik módszere, hogy maximalizáljuk az egy-szempontos variancia analízisben szereplő F-arányt. Így ha összesen N személy van az összes csoportban, a Z értékekre vonatkozó variancia analízis a 4.3 táblázat szerint alakul.
|
Csoportok között |
m-1 |
|
|
Csoporton belül |
N-m |
|
|
|
N-1 |
|
|
|
|
|
4.3. táblázat. |
|
Mindezek után a csoportokat legmegfelelőbben szétválasztó diszkriminancia-függvényt úgy határozhatjuk meg, mint az a lineáris kombináció, amely esetén az
képlettel leírt F-arány a lehető legnagyobb. Ezt az elvet elsőként Fisher írta le.
Ha ezt a megközelítést használjuk, akkor kiderülhet, hogy több lineáris kombinációt is meg lehet határozni, amely képes a csoportok szétválasztására. Általában számuk p és (m-1) közül a kevesebb, legyen például s. Ezeket kanonikus diszkriminációs függvények hívjuk. Az első függvény
adja az egy-szempontos variancia analízis F (csoportokon belüli és csoportok közötti) arányának lehető legnagyobb értékét. Ha egynél több függvény van, akkor a második függvény, vagyis
az egy-szempontos variancia analízis F arányának a lehető legnagyobb értékét adja, azzal a feltétellel, hogy
és
között csoporton belül nincs korreláció. A további függvényeket is ugyanígy határozzuk meg.
Vagyis az i-edik kanonikus diszkriminancia függvény
az a lineáris kombináció, amely esetén a variancia analízis F arányának értéke maximális, azzal a feltétellel, hogy
és
között csoporton belül nincs korreláció.
A kanonikus diszkriminancia függvény együtthatóinak meghatározásakor egy sajátérték problémával találjuk magunkat szembe. Ennek részletei a 4.8.2 mellékletben találhatóak meg.
A
kanonikus diszkriminancia függvények az eredeti változó lineáris kombinációiként keletkeznek oly módon, hogy
a lehető legnagyobb mértékben mutatja a csoportok közötti különbséget;
a lehető legnagyobb mértékben mutatja a csoportok közötti különbségek azon aspektusát, amelyet
nem foglal magában;
a lehető legnagyobb mértékben mutatja a csoportok közötti különbségek azon aspektusát, amelyet
nem foglal magában, és így tovább. Mindezzel a cél az, hogy az első néhány függvénnyel magyarázni tudjuk a legfontosabb csoportok közötti különbségeket.
|