mvst

6.3 A többdimenziós skálázás menete
  6.3.1 A távolságmátrix előállítása

A többdimenziós skálázás klasszikusan egy távolságmátrixból indul ki. A távolságmátrixban n elemre vonatkozóan találunk adatokat, a mátrix δ ij eleme az i-edik és a j-edik elem közötti távolságot mutatja. Az elemzés elején meghatározzuk a térképen ábrázolt objektumok, elemek dimenziójának a számát, t-t. Különböző statisztikai szoftverek különböző eljárásokat alkalmaznak, ám rendszerint a következő lépéseket hajtják végre.

A kezdeti konfiguráció esetén általában nem távolságmátrixok állnak a rendelkezésünkre, hanem nyersadataink vannak. Ez rendszerint azt jelenti, hogy az egyes objektumokra vonatkozóan rendelkezünk információkkal, néhány dimenzió mentén értékeljük őket. Ekkor ezekből az információkból kell megkapnunk a távolságmátrixot. Ehhez az egyes személyek közötti euklideszi távolságot kell meghatározni. Jelölje d ij az i-edik és a j-edik objektum közötti távolságot.

Előfordulhat, hogy ez a lépés kimarad, ha rendelkezésünkre áll a távolságmátrix.

d<-read.csv("c:/adat/vnev.csv")
d
6.1. R-forráskód

A 6.1. R-forráskóddal előhívott adatok már eleve távolságmátrixban vannak reprezentálva, ahogyan az a 6.1. R-eredményen is látszik. Az R-eredményen magyar városok adatai láthatóak. Az egyes cellák a városok közti légvonalbeli távolságot tartalmazzák. Mivel a többdimenziós skálázást eredetileg a térképészetben használták térképek rajzolására, az első példában Magyarország nagyobb városait jelenítjük meg egy kétdimenziós térképen.

          VAROSNEV BUDAPEST GYŐR TATAB SZHELY ZALAE KAPOSVAR SZEGED DEBRECEN
1  Budapest               0   NA    NA     NA    NA       NA     NA       NA
2  Gyor                 114    0    NA     NA    NA       NA     NA       NA
3  Tatab                 52   60     0     NA    NA       NA     NA       NA
4  Szhely               185   95   144      0    NA       NA     NA       NA
5  Zszeg                190  113   144     45     0       NA     NA       NA
6  Kaposvar             160  148   140    126    90        0     NA       NA
7  Szeged               157  248   193    289   262      183      0       NA
8  Debrecen             190  304   243    381   375      322    179        0
9  Nyhaza               204  305   251    392   391      345    220       44
10 Miskolc              135  233   182    330   330      297    208       91
   NYHAZA MISKOLC
1      NA      NA
2      NA      NA
3      NA      NA
4      NA      NA
5      NA      NA
6      NA      NA
7      NA      NA
8      NA      NA
9       0      NA
10     72       0
6.1. R-eredmény.

A távolságmátrix előállításához első lépésként adjuk meg a mátrix soraihoz tartozó neveket (6.2. R-forráskód), amelyek megegyeznek az oszlopok neveivel, ugyanis szimmetrikus távolságmátrixokkal dolgozunk.

rownames(d)<-d$VAROSNEV
d
6.2. R-forráskód

                       VAROSNEV BUDAPEST GYŐR TATAB SZHELY ZALAE KAPOSVAR
Budapest        Budapest               0   NA    NA     NA    NA       NA
Gyor            Gyor                 114    0    NA     NA    NA       NA
Tatab           Tatab                 52   60     0     NA    NA       NA
Szhely          Szhely               185   95   144      0    NA       NA
Zszeg           Zszeg                190  113   144     45     0       NA
Kaposvar        Kaposvar             160  148   140    126    90        0
Szeged          Szeged               157  248   193    289   262      183
Debrecen        Debrecen             190  304   243    381   375      322
Nyhaza          Nyhaza               204  305   251    392   391      345
Miskolc         Miskolc              135  233   182    330   330      297
                SZEGED DEBRECEN NYHAZA MISKOLC
Budapest            NA       NA     NA      NA
Gyor                NA       NA     NA      NA
Tatab               NA       NA     NA      NA
Szhely              NA       NA     NA      NA
Zszeg               NA       NA     NA      NA
Kaposvar            NA       NA     NA      NA
Szeged               0       NA     NA      NA
Debrecen           179        0     NA      NA
Nyhaza             220       44      0      NA
Miskolc            208       91     72       0
6.2. R-eredmény.

A 6.3. R-forráskód azt mutatja, hogyan lehet a mátrixot távolságmátrixként kezeltetni az R-programban.

dist<-as.dist(d[2:11])
dist
6.3. R-forráskód

A kapott távolságmátrixokat a 6.3. R-eredmény mutatja.

                Budapest        Gyor            Tatab           Szhely          Zszeg           Kaposvar       
Gyor                        114                                                                                
Tatab                        52              60                                                                
Szhely                      185              95             144                                                
Zszeg                       190             113             144              45                                
Kaposvar                    160             148             140             126              90                
Szeged                      157             248             193             289             262             183
Debrecen                    190             304             243             381             375             322
Nyhaza                      204             305             251             392             391             345
Miskolc                     135             233             182             330             330             297
                Szeged          Debrecen        Nyhaza         
Gyor                                                           
Tatab                                                          
Szhely                                                         
Zszeg                                                          
Kaposvar                                                       
Szeged                                                         
Debrecen                    179                                
Nyhaza                      220              44                
Miskolc                     208              91              72
6.3. R-eredmény.
   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.