mvst

6.5.3 probléma: Vállalatok vizsgálata

Harmadik példában sem távolságmátrixból indulunk ki. Visszatérünk az 5.6.4 példához, amelyben vállalatok egymáshoz való viszonyát vizsgáltuk a klaszteranalízis segítségével. Futtassuk le az 5.6.4 példánál található 5.27-5.29. R-forráskódot, melyek segítségével előhívjuk az adatokat és ismét megkapjuk a távolságmátrixot is (5.29. R-eredmény).

Ez tehát olyan példája a többdimenziós skálázásnak, amikor nyersadatokból indulunk ki, és az egyes esetek közötti távolságokat tartalmazza a távolságmátrix.

library(MASS)
mds<-isoMDS(távolságmátrix)
6.35. R-forráskód

A 6.35. R-forráskód mutatja, hogyan futtathatjuk a többdimenziós skálázást. A 6.36. R-forráskód segítségével pedig megjeleníthetjük a kétdimenziós reprezentációt.

plot(mds$points,xlim=c(-1800,900),ylim=c(-5,5))
text(mds$points,labels=rownames(d),pos=3)
6.36. R-forráskód

6.36. R-eredmény.

print(mds$points,digits=3)
6.37. R-forráskód

                     [,1]    [,2]
A vallalat             600 -3.1262
B vallalat            -825 -0.6714
C vallalat           -1325 -3.7827
D vallalat             654  0.0377
E vallalat            -325  2.4353
F vallalat            -225  3.0520
G vallalat            -325  3.8541
H vallalat             640 -0.0540
I vallalat             555 -2.7010
J vallalat             575  0.9563
6.37. R-eredmény.

A 6.37. R-eredmény segítségével pedig pontosan megtudhatjuk, hogy az egyes vállalatok milyen értékekkel szerepelnek az egyes dimenziókban. Most folytonos változók mérőszámai alapján készítettünk kétdimenziós ábrázolást, három változó adatai alapján kaptunk egy kétdimenziós geometriai reprezentációt, amely azt mutatja, hogy az emberek véleménye szerint az egyes vállalatok hogyan helyezkednek el egymáshoz képest.

Vizsgáljuk meg az illeszkedési mutatókat.

print(mds$stress,digits=3)
6.38. R-forráskód

 
[1] 5.94e-14 
6.38. R-eredmény.

Első lépésben a Stess-értéket nézhetjük meg a 6.38. R-eredményen. Az értéke megfelelően kicsi, így elfogadhatjuk a kétdimenziós megoldást.

delta<-dist(mds$points)
plot(delta,távolságmátrix)
6.39. R-forráskód

6.39. R-eredmény.

A Shepard-diagramon (6.39. R-eredmény) egy egyenesre illeszkednek az adatok, ami szintén a kétdimenziós megoldás jóságát erősíti meg. A 6.39. R-eredményen látható diagram y-tengelyén látható „távolságmátrix” az 5.29. R-forráskóddal előállított távolságmátrix elemeire utal.

Sh<-Shepard(dist,mds$points)
lm<-summary(lm(Sh$yf~Sh$x))
print(lm$r.squared,digits=3)
6.40. R-forráskód

 [1] 1
6.40. R-eredmény.

fi<-mds$stress^2/2
print(fi,digits=3)
6.41. R-forráskód

 [1] 1.76e-27
6.41. R-eredmény.

mu<-cor(távolságmátrix,delta)
print(mu,digits=4)
6.42. R-forráskód

 [1] 1
6.42. R-eredmény.

Az illeszkedés jóságát erősíti meg egy értéket felvevő RSQ (6.40. R-eredmény) és mü-érték (6.42. R-eredmény), valamint a nullához közeli f-érték is (6.41. R-eredmény).

   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.