mvst

4.7.4 probléma: Kik vásárolnak gyakran bio termékeket?

Utolsó példánk a marketingkutatás területére kalauzol minket. Azt próbáljuk megvizsgálni, hogy főként kik vásárolnak bio termékeket. A bio termékek a modernkori egészséges táplálkozás mozgalmának találmánya. Általában a termék természetes eredetét, vegyszer- és génkezelés-mentességét jelölik vele. A termékek fogyasztása manapság igen „divatos”.

Az elemzéshez használt adatbázis a 4.26. R-forráskóddal hívható elő és a 4.8.7 mellékletben tekinthető meg.

d<-read.csv("c:/adat/bio.csv")
4.26. R-forráskód

Az adatbázisban a „vasarlas” változó mutatja a biotermékek vásárlásának gyakoriságát. Az 1-es kód azt jelenti, hogy a személy szinte soha nem vesz ilyen termékeket. A 2-es azt jelenti, hogy időnként, míg a 3-as azt, hogy gyakran. A vásárlás gyakoriságát a következő változókkal próbáljuk előre jelezni: milyen értékeket tulajdonít ezeknek a termékeknek („ertek” változó, minél nagyobb pontszámot kap a skálán, annál jobban értékeli a személy a bio termékeket); az „attitud” skála a termékek iránti attitűdöt méri, a magasabb értékek itt is kedvezőbb atttitűdöt jeleznek; ezen túl szerepel még a személy életkora („kor” változó) és a fizetése is („fizetes”).

A diszkriminancia-analízisben az első lépésében megvizsgáljuk, vajon valóban szét lehet-e választani a bio termékeket vásárlók három csoportját az adott változók alapján. Ehhez a Wilks-lambda tesztet használjuk a többváltozós variancia-analízis keretein belül (4.27. R-forráskód).

A 4.27 R-eredmény tesztstatisztikájának szignifikanciaszintje azt mutatja, hogy a csoportok közötti különbségek szignifikánsak, vagyis valóban van különbség a három csoport között az adott változókat vizsgálva.

DA<-manova(cbind(ertek,attitud,fizetes,kor)~vasarlas, data=d)
DA<-summary(DA, test="Wilks")
print(DA, digits=3)
4.27. R-forráskód

          Df  Wilks approx F num Df den Df    Pr(>F)    
vasarlas   1  0.147   36.355      4     25 4.438e-10 ***
Residuals 28                                            
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 
4.27. R-eredmény.

A 4.28. R-forráskóddal megkaphatjuk a diszkriminancia-analízis eredményeit.

diszkr<-lda(vasarlas~ertek+attitud+fizetes+kor, data=d)
print(diszkr, digits=1)
4.28. R-forráskód

A 4.28. R-eredmény alapján az elemzés elején a három vásárlási gyakoriság valószínűsége egyenlő (0,333).  Ha a csoportátlagokat vizsgáljuk akkor láthatjuk, hogy mind az értékek, mind az attitűd változójának tekintetében az 1-es csoport (akik soha sem vásárolnak ilyen termékeket) átlaga a legalacsonyabb (3 mindkét változó esetében), az időnként bio termékeket vásárló 2-es csoport átlaga középen helyezkedik el mind a két változó esetében (5 és 6), és a gyakran vásárlók átlaga a legmagasabb (8 és 9). Életkor tekintetében egy kissé másképpen alakulnak a csoportok. A legidősebbek szinte sohasem vásárolnak bio termékeket, a legfiatalabbak pedig igen gyakran vásárolnak. Fizetés tekintetében nem figyelhető meg jól magyarázható összefüggés: a legalacsonyabb fizetésűek gyakran, míg a közepes fizetésűek szinte soha sem vásárolnak bio termékeket.

A két kanonikus diszkriminancia-egyenlet a következőképpen alakul:

Z1 = 0,278 * ertek + 0,578 * attitud - 0,019 * kor - 0,004 *fizetes

Z2 = -0,175 * ertek + 0,066 * attitud + 0,004 * kor - 0,032 *fizetes

Call:
lda(vasarlas ~ ertek + attitud + fizetes + kor, data = d) 
Prior probabilities of groups: 1 2 3 0.3 0.3 0.3
Group means: ertek attitud fizetes kor 1 3 3 87 44 2 5 6 107 35 3 8 9 71 27
Coefficients of linear discriminants: LD1 LD2 ertek 0.278 -0.175 attitud 0.578 0.066 fizetes -0.004 -0.032 kor -0.019 0.004
Proportion of trace: LD1 LD2 0.97 0.03
4.28. R-eredmény.

csoport<-predict(diszkr,method="plug-in")$class
table<-table(csoport,d$vasarlas)
table
4.29. R-forráskód

csoport 1 2 3
      1 9 1 0
      2 1 7 1
      3 0 2 9 
4.29. R-eredmény.

n<-length(csoport)
helyes<-table[1]+table[5]+table[9]
print(szazalek, digits=3)
4.30. R-forráskód

 [1] 95
4.30. R-eredmény.

Utolsó lépésként az analízis értékelésére van még szükség. Ezt a 4.29. és a 4.30. R-forráskóddal tehetjük meg. A 4.29. R-eredményen láthatjuk, hogy a valódi és a modell alapján becsült csoporttagságok mátrixában a legtöbb adat a főátlóban helyezkedik el. Ez arra utal, hogy a becsült csoporttagságok nagyjából lefedik az eredetit. A 4.30. R-eredmény mutatja, hogy ez az arány 95%.

Az utolsó probléma körében a bio termékek vásárlásának gyakoriságát vizsgáltuk. A kapott eredményeink alapján azok, akik gyakran vásárolnak ilyen termékeket, pozitívabbak értékelik és pozitívabb attitűdökkel rendelkeznek a bio termékek irányában, fiatalabbak, fizetésük viszont alacsonyabb.

   
 
Münnich Á., Nagy Á., Abari K. (2006). Többváltozós statisztika pszichológus hallgatók számára. v1.1.