5.3.1.3 Egyéb hierarchikus eljárások
A következőkben bemutatunk még néhány hierarchikus klaszterképzési eljárást, csupán a felsorolás szintjén.
- Átlagos távolság: A két klaszter távolsága az összes megfigyelési egység páronkénti távolságának átlaga.
- Variancia-módszerek: A varianaciamódszerek a klaszteren belüli szórásnégyzet minimalizálásával állítunk elő klasztereket
- Ward-féle eljárás: Első lépésként minden egyes klaszterre kiszámoljuk az összes változó átlagát. Ezután a klaszterátlaghoz képest kiszámítjuk a négyzetes euklideszi távolságot minden elemre. Ezeket megfigyelési egységenként összegezzük. Minden lépésnél azt a két klasztert vonjuk össze, amely a klaszteren belüli szórásnégyzetet a legkevésbé növeli.
- Centroidmódszerek: A centroid a klaszter összes változójának átlaga. Két klaszter közötti távolságot a centroidjuk közötti távolság határozza meg. Az egységeket csoportosítjuk, az átlagokat kiszámítjuk, és a legkisebb távolságot keressük az összevonáshoz.
- Szekvenciális küszöbérték módszer: Kiválasztjuk a klaszter-középpontot, és minden egység, ami a középponttól egy előre meghatározott küszöbértéken belülre esik egy klaszterbe kerül. Ezután új középpontot választunk és csoportosítjuk a fennmaradó egységeket (egy egységet csak egy klaszter-középponttal lehet csoportosítani).
- Párhuzamos küszöbérték módszer: A klaszter-középpontokat itt egyidejűleg választjuk ki, a küszöbértéken belüli egységeket pedig a legközelebb eső középponthoz rendeljük.
- Optimális felosztás módszere: A megfigyelési egységeket a folyamat során újra hozzárendeljük más klaszterekhez is, hogy egy általános kritériumot optimalizálhassunk (pl.: adott számú klaszterre a klaszteren belüli távolságok átlagát).
|