6.3 A többdimenziós skálázás menete 6.3.1 A távolságmátrix előállítása
A többdimenziós skálázás klasszikusan egy távolságmátrixból indul ki. A távolságmátrixban n elemre vonatkozóan találunk adatokat, a mátrix
eleme az i-edik és a j-edik elem közötti távolságot mutatja. Az elemzés elején meghatározzuk a térképen ábrázolt objektumok, elemek dimenziójának a számát, t-t. Különböző statisztikai szoftverek különböző eljárásokat alkalmaznak, ám rendszerint a következő lépéseket hajtják végre.
A kezdeti konfiguráció esetén általában nem távolságmátrixok állnak a rendelkezésünkre, hanem nyersadataink vannak. Ez rendszerint azt jelenti, hogy az egyes objektumokra vonatkozóan rendelkezünk információkkal, néhány dimenzió mentén értékeljük őket. Ekkor ezekből az információkból kell megkapnunk a távolságmátrixot. Ehhez az egyes személyek közötti euklideszi távolságot kell meghatározni. Jelölje
az i-edik és a j-edik objektum közötti távolságot.
Előfordulhat, hogy ez a lépés kimarad, ha rendelkezésünkre áll a távolságmátrix.
d<-read.csv("c:/adat/vnev.csv")
d
|
|
6.1. R-forráskód
|
A 6.1. R-forráskóddal előhívott adatok már eleve távolságmátrixban vannak reprezentálva, ahogyan az a 6.1. R-eredményen is látszik. Az R-eredményen magyar városok adatai láthatóak. Az egyes cellák a városok közti légvonalbeli távolságot tartalmazzák. Mivel a többdimenziós skálázást eredetileg a térképészetben használták térképek rajzolására, az első példában Magyarország nagyobb városait jelenítjük meg egy kétdimenziós térképen.
VAROSNEV BUDAPEST GYŐR TATAB SZHELY ZALAE KAPOSVAR SZEGED DEBRECEN
1 Budapest 0 NA NA NA NA NA NA NA
2 Gyor 114 0 NA NA NA NA NA NA
3 Tatab 52 60 0 NA NA NA NA NA
4 Szhely 185 95 144 0 NA NA NA NA
5 Zszeg 190 113 144 45 0 NA NA NA
6 Kaposvar 160 148 140 126 90 0 NA NA
7 Szeged 157 248 193 289 262 183 0 NA
8 Debrecen 190 304 243 381 375 322 179 0
9 Nyhaza 204 305 251 392 391 345 220 44
10 Miskolc 135 233 182 330 330 297 208 91
NYHAZA MISKOLC
1 NA NA
2 NA NA
3 NA NA
4 NA NA
5 NA NA
6 NA NA
7 NA NA
8 NA NA
9 0 NA
10 72 0
|
|
6.1. R-eredmény.
|
A távolságmátrix előállításához első lépésként adjuk meg a mátrix soraihoz tartozó neveket (6.2. R-forráskód), amelyek megegyeznek az oszlopok neveivel, ugyanis szimmetrikus távolságmátrixokkal dolgozunk.
rownames(d)<-d$VAROSNEV
d
|
|
6.2. R-forráskód
|
VAROSNEV BUDAPEST GYŐR TATAB SZHELY ZALAE KAPOSVAR
Budapest Budapest 0 NA NA NA NA NA
Gyor Gyor 114 0 NA NA NA NA
Tatab Tatab 52 60 0 NA NA NA
Szhely Szhely 185 95 144 0 NA NA
Zszeg Zszeg 190 113 144 45 0 NA
Kaposvar Kaposvar 160 148 140 126 90 0
Szeged Szeged 157 248 193 289 262 183
Debrecen Debrecen 190 304 243 381 375 322
Nyhaza Nyhaza 204 305 251 392 391 345
Miskolc Miskolc 135 233 182 330 330 297
SZEGED DEBRECEN NYHAZA MISKOLC
Budapest NA NA NA NA
Gyor NA NA NA NA
Tatab NA NA NA NA
Szhely NA NA NA NA
Zszeg NA NA NA NA
Kaposvar NA NA NA NA
Szeged 0 NA NA NA
Debrecen 179 0 NA NA
Nyhaza 220 44 0 NA
Miskolc 208 91 72 0
|
|
6.2. R-eredmény.
|
A 6.3. R-forráskód azt mutatja, hogyan lehet a mátrixot távolságmátrixként kezeltetni az R-programban.
dist<-as.dist(d[2:11])
dist
|
|
6.3. R-forráskód
|
A kapott távolságmátrixokat a 6.3. R-eredmény mutatja.
Budapest Gyor Tatab Szhely Zszeg Kaposvar
Gyor 114
Tatab 52 60
Szhely 185 95 144
Zszeg 190 113 144 45
Kaposvar 160 148 140 126 90
Szeged 157 248 193 289 262 183
Debrecen 190 304 243 381 375 322
Nyhaza 204 305 251 392 391 345
Miskolc 135 233 182 330 330 297
Szeged Debrecen Nyhaza
Gyor
Tatab
Szhely
Zszeg
Kaposvar
Szeged
Debrecen 179
Nyhaza 220 44
Miskolc 208 91 72
|
|
6.3. R-eredmény.
|
|