mvst

4.5 Kanonikus diszkriminancia függvények

Általában hasznos dolog, ha X 1 ,  X 2  ...  X p változóknak fel tudjuk írni egy olyan függvényét, amely valamilyen eljárással a lehető legjobban tudja szétválasztani az m csoportot. A legegyszerűbb megközelítés, ha a változók lineáris kombinációinak előállításával próbáljuk megközelíteni a problémát:

Z= a 1 X 1 + a 2 X 2 +...+ a p X p

A Z függvény akkor tudja a csoportokat jól elkülöníteni, ha az egyes csoportok átlagai egymástól jelentős mértékben eltérnek, ám a csoporton belül viszonylag konstansak az átlagok. Ezért az a 1 ,  a 2  ...  a p együtthatók meghatározásának egyik módszere, hogy maximalizáljuk az egy-szempontos variancia analízisben szereplő F-arányt. Így ha összesen N személy van az összes csoportban, a Z értékekre vonatkozó variancia analízis a 4.3 táblázat szerint alakul.

 
Variancia forrása Szabadsági fok Négyzetek átlaga F-arány
Csoportok között m-1 M B M B  /M w
Csoporton belül N-m M w
N-1
 
  4.3. táblázat.  

Mindezek után a csoportokat legmegfelelőbben szétválasztó diszkriminancia-függvényt úgy határozhatjuk meg, mint az a lineáris kombináció, amely esetén az M B  /M w   képlettel leírt F-arány a lehető legnagyobb. Ezt az elvet elsőként Fisher írta le.

Ha ezt a megközelítést használjuk, akkor kiderülhet, hogy több lineáris kombinációt is meg lehet határozni, amely képes a csoportok szétválasztására. Általában számuk p és (m-1) közül a kevesebb, legyen például s. Ezeket kanonikus diszkriminációs függvények hívjuk. Az első függvény

Z 1 = a 11 X 1 + a 12 X 2 +...+ a 1p X p

adja az egy-szempontos variancia analízis F (csoportokon belüli és csoportok közötti) arányának lehető legnagyobb értékét. Ha egynél több függvény van, akkor a második függvény, vagyis

Z 2 = a 21 X 1 + a 22 X 2 +...+ a 2p X p

az egy-szempontos variancia analízis F arányának a lehető legnagyobb értékét adja, azzal a feltétellel, hogy Z 1  és Z 2 között csoporton belül nincs korreláció. A további függvényeket is ugyanígy határozzuk meg.

Vagyis az i-edik kanonikus diszkriminancia függvény

Z i = a i1 X 1 + a i2 X 2 +...+ a ip X p

az a lineáris kombináció, amely esetén a variancia analízis F arányának értéke maximális, azzal a feltétellel, hogy Z i  és Z 1 ,  Z 2  ...  Z i-1 között csoporton belül nincs korreláció.

A kanonikus diszkriminancia függvény együtthatóinak meghatározásakor egy sajátérték problémával találjuk magunkat szembe. Ennek részletei a 4.8.2 mellékletben találhatóak meg.

A Z 1 ,  Z 2  ...  Z s kanonikus diszkriminancia függvények az eredeti változó lineáris kombinációiként keletkeznek oly módon, hogy Z 1 a lehető legnagyobb mértékben mutatja a csoportok közötti különbséget; Z 2 a lehető legnagyobb mértékben mutatja a csoportok közötti különbségek azon aspektusát, amelyet Z 1 nem foglal magában;   Z 3 a lehető legnagyobb mértékben mutatja a csoportok közötti különbségek azon aspektusát, amelyet Z 2 nem foglal magában, és így tovább. Mindezzel a cél az, hogy az első néhány függvénnyel magyarázni tudjuk a legfontosabb csoportok közötti különbségeket.

   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.