6.4. Hasonlósági értékek távolsággá transzformálása
A hasonlóságokat, vagy skaláris szorzatokat távolsággá alakíthatjuk a koszinusz-tétel egyszerű alkalmazásának a segítségével. A koszinusz-tétel a következőképpen hangzik: Egy nem derékszögű háromszögben
, ahol a,b,c a háromszög oldalai, θ pedig az a és a b oldal által bezárt szög.
Tekintsük CB-t és CA-t vektornak, θ pedig legyen az általuk bezárt szög. Ekkor a tételt a következőképpen írhatjuk fel:
(a és b skaláris szorzata)
A koszinusz-tétel speciális esete, amikor sztenderdizált változókkal dolgozunk, melyek egységnyi szórásúak. Ebben az esetben megmutatható, hogy a korrelációk és a távolságok monoton kapcsolatban állnak egymással.
A koszinusz-tétel
.
Mivel
,
így
és
.
Ezen képlet alapján pedig megállapítható, hogy a korreláció és a távolság mérőszáma egymással egy csökkenő (mivel
határozza meg a távolsági együtthatót) és nemlineáris kapcsolatban van (a négyzetgyök miatt). A távolságok és a korrelációk között ez alapján egy monoton kapcsolat áll fenn.
A hasonlósági adatokból kiinduló többdimenziós skálázást a 6.5.2, 6.5.3 és a 6.5.4 probléma szemlélteti.
|