mvst

5.3.1.3 Egyéb hierarchikus eljárások

A következőkben bemutatunk még néhány hierarchikus klaszterképzési eljárást, csupán a felsorolás szintjén.

  • Átlagos távolság: A két klaszter távolsága az összes megfigyelési egység páronkénti távolságának átlaga.
  • Variancia-módszerek: A varianaciamódszerek a klaszteren belüli szórásnégyzet minimalizálásával állítunk elő klasztereket
  • Ward-féle eljárás: Első lépésként minden egyes klaszterre kiszámoljuk az összes változó átlagát. Ezután a klaszterátlaghoz képest kiszámítjuk a négyzetes euklideszi távolságot minden elemre. Ezeket megfigyelési egységenként összegezzük. Minden lépésnél azt a két klasztert vonjuk össze, amely a klaszteren belüli szórásnégyzetet a legkevésbé növeli.
  • Centroidmódszerek: A centroid a klaszter összes változójának átlaga. Két klaszter közötti távolságot a centroidjuk közötti távolság határozza meg. Az egységeket csoportosítjuk, az átlagokat kiszámítjuk, és a legkisebb távolságot keressük az összevonáshoz.
  • Szekvenciális küszöbérték módszer: Kiválasztjuk a klaszter-középpontot, és minden egység, ami a középponttól egy előre meghatározott küszöbértéken belülre esik egy klaszterbe kerül. Ezután új középpontot választunk és csoportosítjuk a fennmaradó egységeket (egy egységet csak egy klaszter-középponttal lehet csoportosítani).
  • Párhuzamos küszöbérték módszer: A klaszter-középpontokat itt egyidejűleg választjuk ki, a küszöbértéken belüli egységeket pedig a legközelebb eső középponthoz rendeljük.
  • Optimális felosztás módszere: A megfigyelési egységeket a folyamat során újra hozzárendeljük más klaszterekhez is, hogy egy általános kritériumot optimalizálhassunk (pl.: adott számú klaszterre a klaszteren belüli távolságok átlagát).

   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.