mvst

6.4. Hasonlósági értékek távolsággá transzformálása

A hasonlóságokat, vagy skaláris szorzatokat távolsággá alakíthatjuk a koszinusz-tétel egyszerű alkalmazásának a segítségével. A koszinusz-tétel a következőképpen hangzik: Egy nem derékszögű háromszögben  c 2 = a 2 + b 2 2abcosθ , ahol a,b,c a háromszög oldalai, θ pedig az a és a b oldal által bezárt szög.

Tekintsük CB-t és CA-t vektornak, θ pedig legyen az általuk bezárt szög. Ekkor a tételt a következőképpen írhatjuk fel:

d(A,B)= l a 2 + l b 2 2 l a l b cos θ ab

        = l a 2 + l b 2 2× (a és b skaláris szorzata)

        = a ii + a jj 2 a ij  

A koszinusz-tétel speciális esete, amikor sztenderdizált változókkal dolgozunk, melyek egységnyi szórásúak. Ebben az esetben megmutatható, hogy a korrelációk és a távolságok monoton kapcsolatban állnak egymással.

A koszinusz-tétel  d ij 2 = l i 2 + l j 2 2 l i l j cos θ ij .

Mivel                  r ij =cos θ ij ,

így                    d ij 2 =22 r ij

és                     d ij = (22 r ij) = 2(1 r ij ) .

Ezen képlet alapján pedig megállapítható, hogy a korreláció és a távolság mérőszáma egymással egy csökkenő (mivel 1-r ij határozza meg a távolsági együtthatót) és nemlineáris kapcsolatban van (a négyzetgyök miatt). A távolságok és a korrelációk között ez alapján egy monoton kapcsolat áll fenn.

A hasonlósági adatokból kiinduló többdimenziós skálázást a 6.5.2, 6.5.3 és a 6.5.4 probléma szemlélteti.

   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.