4.7.4 probléma: Kik vásárolnak gyakran bio termékeket?
Utolsó példánk a marketingkutatás területére kalauzol minket. Azt próbáljuk megvizsgálni, hogy főként kik vásárolnak bio termékeket. A bio termékek a modernkori egészséges táplálkozás mozgalmának találmánya. Általában a termék természetes eredetét, vegyszer- és génkezelés-mentességét jelölik vele. A termékek fogyasztása manapság igen „divatos”.
Az elemzéshez használt adatbázis a 4.26. R-forráskóddal hívható elő és a 4.8.7 mellékletben tekinthető meg.
d<-read.csv("c:/adat/bio.csv")
|
|
4.26. R-forráskód
|
Az adatbázisban a „vasarlas” változó mutatja a biotermékek vásárlásának gyakoriságát. Az 1-es kód azt jelenti, hogy a személy szinte soha nem vesz ilyen termékeket. A 2-es azt jelenti, hogy időnként, míg a 3-as azt, hogy gyakran. A vásárlás gyakoriságát a következő változókkal próbáljuk előre jelezni: milyen értékeket tulajdonít ezeknek a termékeknek („ertek” változó, minél nagyobb pontszámot kap a skálán, annál jobban értékeli a személy a bio termékeket); az „attitud” skála a termékek iránti attitűdöt méri, a magasabb értékek itt is kedvezőbb atttitűdöt jeleznek; ezen túl szerepel még a személy életkora („kor” változó) és a fizetése is („fizetes”).
A diszkriminancia-analízisben az első lépésében megvizsgáljuk, vajon valóban szét lehet-e választani a bio termékeket vásárlók három csoportját az adott változók alapján. Ehhez a Wilks-lambda tesztet használjuk a többváltozós variancia-analízis keretein belül (4.27. R-forráskód).
A 4.27 R-eredmény tesztstatisztikájának szignifikanciaszintje azt mutatja, hogy a csoportok közötti különbségek szignifikánsak, vagyis valóban van különbség a három csoport között az adott változókat vizsgálva.
DA<-manova(cbind(ertek,attitud,fizetes,kor)~vasarlas, data=d)
DA<-summary(DA, test="Wilks")
print(DA, digits=3)
|
|
4.27. R-forráskód
|
Df Wilks approx F num Df den Df Pr(>F)
vasarlas 1 0.147 36.355 4 25 4.438e-10 ***
Residuals 28
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
|
|
4.27. R-eredmény.
|
A 4.28. R-forráskóddal megkaphatjuk a diszkriminancia-analízis eredményeit.
diszkr<-lda(vasarlas~ertek+attitud+fizetes+kor, data=d)
print(diszkr, digits=1)
|
|
4.28. R-forráskód
|
A 4.28. R-eredmény alapján az elemzés elején a három vásárlási gyakoriság valószínűsége egyenlő (0,333). Ha a csoportátlagokat vizsgáljuk akkor láthatjuk, hogy mind az értékek, mind az attitűd változójának tekintetében az 1-es csoport (akik soha sem vásárolnak ilyen termékeket) átlaga a legalacsonyabb (3 mindkét változó esetében), az időnként bio termékeket vásárló 2-es csoport átlaga középen helyezkedik el mind a két változó esetében (5 és 6), és a gyakran vásárlók átlaga a legmagasabb (8 és 9). Életkor tekintetében egy kissé másképpen alakulnak a csoportok. A legidősebbek szinte sohasem vásárolnak bio termékeket, a legfiatalabbak pedig igen gyakran vásárolnak. Fizetés tekintetében nem figyelhető meg jól magyarázható összefüggés: a legalacsonyabb fizetésűek gyakran, míg a közepes fizetésűek szinte soha sem vásárolnak bio termékeket.
A két kanonikus diszkriminancia-egyenlet a következőképpen alakul:
Z1 = 0,278 * ertek + 0,578 * attitud - 0,019 * kor - 0,004 *fizetes
Z2 = -0,175 * ertek + 0,066 * attitud + 0,004 * kor - 0,032 *fizetes
Call:
lda(vasarlas ~ ertek + attitud + fizetes + kor, data = d)
Prior probabilities of groups:
1 2 3
0.3 0.3 0.3
Group means:
ertek attitud fizetes kor
1 3 3 87 44
2 5 6 107 35
3 8 9 71 27
Coefficients of linear discriminants:
LD1 LD2
ertek 0.278 -0.175
attitud 0.578 0.066
fizetes -0.004 -0.032
kor -0.019 0.004
Proportion of trace:
LD1 LD2
0.97 0.03
|
|
4.28. R-eredmény.
|
csoport<-predict(diszkr,method="plug-in")$class
table<-table(csoport,d$vasarlas)
table
|
|
4.29. R-forráskód
|
csoport 1 2 3
1 9 1 0
2 1 7 1
3 0 2 9
|
|
4.29. R-eredmény.
|
n<-length(csoport)
helyes<-table[1]+table[5]+table[9]
print(szazalek, digits=3)
|
|
4.30. R-forráskód
|
Utolsó lépésként az analízis értékelésére van még szükség. Ezt a 4.29. és a 4.30. R-forráskóddal tehetjük meg. A 4.29. R-eredményen láthatjuk, hogy a valódi és a modell alapján becsült csoporttagságok mátrixában a legtöbb adat a főátlóban helyezkedik el. Ez arra utal, hogy a becsült csoporttagságok nagyjából lefedik az eredetit. A 4.30. R-eredmény mutatja, hogy ez az arány 95%.
Az utolsó probléma körében a bio termékek vásárlásának gyakoriságát vizsgáltuk. A kapott eredményeink alapján azok, akik gyakran vásárolnak ilyen termékeket, pozitívabbak értékelik és pozitívabb attitűdökkel rendelkeznek a bio termékek irányában, fiatalabbak, fizetésük viszont alacsonyabb.
|