mvst

5.3.1.2 Teljes lánc, avagy a legtávolabbi szomszéd elve

Ezen elv alapján két klaszter közötti távolság a két legtávolabbi pontjuk távolsága. Példaként most is nézzük az 5.1. táblázat adatait. Első lépésként most is a hármas és a négyes elemet vonjuk össze, hiszen ez a két elem van egymáshoz a legközelebb (két egységnyi). Ekkor a távolságok a legtávolabbi szomszéd elve alapján az 5.5. táblázatnak megfelelően alakulnak.

 
1 2 (3,4) 5
1 0
2 3 0
(3,4) 10 9 0
5 9 8 5 0
 
  5.5. táblázat.  

Az 5.5. táblázaton láthatjuk, hogy a következő legkisebb távolság a 3 egység, ez alapján a következő lépésben az első két elemet vonjuk össze. A távolságok most az 5.6. táblázatnak megfelelően alakulnak.

 
(1,2) (3,4) 5
(1,2) 0
(3,4) 10 0
5 9 5 0
 
  5.6. táblázat.  

Az 5.6. táblázat alapján a legkisebb távolság most az 5 egység. Ezért most az ötös elemet bevonjuk a hármas és a négyes elem által alkotott klaszterbe. Ezáltal most már csak két klaszter maradt, ahogyan azt az 5.7. táblázatban is láthatjuk.

 
(1,2) (3,4,5)
(1,2) 0
(3,4,5) 10 0
 
  5.7. táblázat.  

A maradék két klasztert tíz egységnyi távolságnál vonhatjuk össze, így az összes elem egyetlen klaszterbe kerül. A lépéseket az 5.8. táblázat foglalja össze.

 
távolság csoportok
0 1,2,3,4,5
2 1,2,(3,4),5
3 (1,2),(3,4),5
5 (1,2),(3,4,5)
10 (1,2,3,4,5)
 
  5.8. táblázat.  

klaszter<-hclust(tavolsag,method="complete")
plot(klaszter)
5.7. R-forráskód

5.7. R-eredmény.

Az 5.7. R-forráskóddal az R-ben is lefuttathatjuk a klaszteranalízist, a kapott dendrogramot az 5.7. R-eredmény mutatja. Az 5.8 és az 5.9. R-eredményen pedig ismét az 5.8. táblázat adatait láthatjuk, ahogyan azt már az egyszerű lánc módszernél is láthattuk.

klaszter$merge
5.8. R-forráskód

     [,1] [,2]
[1,]   -3   -4
[2,]   -1   -2
[3,]   -5    1
[4,]    2    3
5.8. R-eredmény.

klaszter$height
5.9. R-forráskód

 [1]  2  3  5 10
5.9. R-eredmény.
   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.