Nem hierarchikus klaszterelemzés az SPSS-ben Petrovics Petra Doktorandusz
Klaszteranalízis folyamata 1. A probléma megfogalmazása (Kutatási probléma, hipotézis, vizsgálandó elemek nagysága, stb.) 2. Feltételek vizsgálata Pl: kiugró értékek, reprezentatív minta, skálázás 3. Hasonlósági és távolságmérték meghatározása (Ahol kisebb a távolság, azok a megfigyelési értékek hasonlóbbak) 4. Klasztermódszer kiválasztása Hierarchikus vs. nem hierarchikus 5. Klaszterek száma Hány csoport? Mi alapján? 6. Klaszterek értelmezése, jellemzése Elnevezés, értékelés 7. Klaszterelemzés érvényességének ellenőrzése
Nem hierarchikus módszer az SPSS-ben Nem hierarchikus módszer K-Means Two Steps Előnye Segít a klaszterszám meghatározásában Ha változtatjuk a klaszterszámot, a korábban létrehozott klaszterek összetétele nem változik Számtalan távolságmérték Standardizálható változók Dendogram A mintavételi egységek száma magas Kevésbé függ kiugró értékektől Kevésbé függ távolságmértékektől Kevésbé függ attól, hogy került-e az elemzésbe irreleváns változó Leggyorsabb Nominális és metrikus ismérvek kombinálhatósága Ideális klaszterszámot „javasol” Kiszűri az outliereket Alapértelmezés szerint standardizál Hátránya Érzékeny a kiugró értékekre Hosszadalmas megtalálni az ideális kombinációt Nominális és metrikus ismérvek nem kombinálhatók A klaszterek számát előre kell meghatározni Klaszterközéppont kiválasztása Függ a megfigyelések sorrendjétől Más klaszterszám esetében teljesen más összetételű klaszterek jönnek létre
Lakhely: 1- Budapest, 2- megyeszékhely, 3-egyéb Név Főzős Házias Nem Lakhely Kereset 1 Béla 3 3000 2 Jenő 1500 Bea 5 2000 4 Marci 1000 Ubul 7000 6 Zsuzsa 7 8000 Rita 8 Zoli 9 Dávid 5000 10 Robi 11 Kriszti 12 Zsófi 4000 13 Géza 14 Éva 15 Dóra 16 Vera 6000 Nem: 1-férfi, 2-nő Lakhely: 1- Budapest, 2- megyeszékhely, 3-egyéb TK/286. oldal (Sajtos-Mitev)
Klaszterelemzés érvényességének ellenőrzése 7. Klaszterelemzés érvényességének ellenőrzése K-közép (K-Means) eljárás Analyze / Classify / K-Means Cluster Kezdeti klaszterközéppont meghatározása
Output 3 klaszter – 3 klaszterközéppont
Összehasonlítás = Hierarchikus módszer Nem hierarchikus módszer 7. Összehasonlítás Megbízható = Hierarchikus módszer Nem hierarchikus módszer K-Means
Feladat Fogyasztók csoportosítása vásárlási attitűdjeik szerint: 1-7-ig terjedő skálán értékelik a következő állításokat: V1: A vásárlás szórakozás. V2: A vásárlás nem tesz jót a pénztárcának. V3: A vásárlást gyakran összekötöm étteremlátogatással. V4: Vásárláskor megpróbálom a legjobb vételt csinálni. V5: Nem érdekel a vásárlás. V6: Az árak összehasonlításával rengeteg pénzt lehet megtakarítani. Malhotra [2005]: Marketingkutatás 703.o.
Sorszám V1 V2 V3 V4 V5 V6 1 6 4 7 3 2 5 8 9 10 11 12 13 14 15 16 17 18 19 20
Output
Köszönöm a figyelmet!