Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Pécsi Tudományegyetem Pollack Mihály Műszaki Kar Műszaki Informatika Szak Data Mining 12. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens PTE-PMMK Számítástechnika.

Hasonló előadás


Az előadások a következő témára: "Pécsi Tudományegyetem Pollack Mihály Műszaki Kar Műszaki Informatika Szak Data Mining 12. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens PTE-PMMK Számítástechnika."— Előadás másolata:

1

2 Pécsi Tudományegyetem Pollack Mihály Műszaki Kar Műszaki Informatika Szak Data Mining 12. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens PTE-PMMK Számítástechnika Tanszék Iroda: Boszorkány u., B épület 101 Tel: 72/503-650/3725 E-mail: gjpauler@acsu.buffalo.edu gjpauler@acsu.buffalo.edu

3 A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS-ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

4 Számítógépes alkalmazás egyutas variancia analízishez Excelben 1 A EgyUtasANOVA.xls fájl Excelben mutat példát:EgyUtasANOVA.xls A csoportosított változók átlagainak vizuális megjelenítésére, Az átlagok különbségének egyutas variancia analízisssel történő tesztelésére. A rendszer max. 1000 megfigyelést, max. 35 változót, és max. 8 csoportot kezel Jelenleg a 2003-as OTKA Romakutatás 1000 fős, az egész ország területére (kor, nem, jövedelem, iskolai végzettség, foglalkozás, településtípus) szerint reprezetatív mintája van a rendszerbe betöltve Ebben a mintában korábban már – csoportosító módszerekkel végzett vizsgálatok eredményeképp – 4 életstílus és 7 vásárlási csoportba sorolták a romákat Mi most a 7 vásárlási csoportba tartozás, mint független változó hatását szeretnénk elemezni 35 darab függő háttérváltozóra, amelyeket a csoportok jellemzésére használunk. Ezek közt van: –3 életstílust leíró változó –6 vásárlási magatartást leíró változó –8 korábbi vásárlásokkal kapcsolatos változó (Ruha, Gyógyszer, stb.) –6 médiahasználat változó (Tv, Rádió, Napilap, stb.) –12 demográfiai változó (Kor, Nem, Iskolázottság, Jövedelem, stb.) A fájl több munkalapból áll:

5 Számítógépes alkalmazás egyutas variancia analízishez Excelben 2 Az AdatBazis munkalapra kell betölteni a kérdőívek tartalmát, a zöld cellákba oly módon, hogy: –A megfigyelések sorokban legyenek –A kérdésekre adott válaszok oszlopokban –Az első sor a változóneveket tartalmazza Az AdatSzotar munkalapon a zöld cellákban le kell írni: –A változók nevét –A változók skálatípusát –A változók címkéjét –Kategóraaváltózóknál a lehetséges értékeiket és azok jelentését A CsoportAtlagok munkalap egy Excel kimutatás (Pivot Table) segítségével kiszámítja a csoportok gyakoriságát és a háttérváltozók csoportátlagát. A csoportosító változó és a háttérváltozók sárga szinű legördülő menükből választhatók ki. A CsoportVarianciak munkalapon az előbbihez hasonló módon a háttérváltozók csoportokon belüli varianciái számíthatók ki Ügyeljünk, hogy kiválasztott változók a két utóbbi munkalap közt szinkronban legyenek!

6 Számítógépes alkalmazás egyutas variancia analízishez Excelben 3 Az EgyUtasANOVA munkalap kiszedi a zöld cellákba : A csoportneveket, -méreteket, A csoportátlagokat, -varianciákat a kimutatásokból és az adatszótárból. Minden háttérváltozóra egyutas ANOVA-t hajt végre: *-gal jelöli meg a változó nevét, ha  =5%- os szinten szignifikáns a csoportátlagok különbsége **-gal jelöli, ha  =1%-os szinten, vagyis nagyon erős a csoportosító változó hatása A csoportátlagokat először egy pókháló diagrammon (Radar Plot) jeleníti meg Itt jól összehasonlíthatók a csoportok átlagai az összes változó tekintetében Hogy a különböző változók szerinti átlagértékek könnyebben összehasonlíthatók legyenek, a diagrammon minden változót normalizálva (Normalization) mutatunk, vagyis 0 várható értékű, 1 szórású változóvá konvertáljuk őket: x Norm = (x – Átlag(x))/Szórás(x)(12.20) A pókháló diagramm hátránya, hogy a csoportok méretét és átlagaik közti távolságot nem tudja megmutatni. A vásárlási csoportoknak a Hitelre 5%-on szignifikáns hatása van

7 Számítógépes alkalmazás egyutas variancia analízishez Excelben 4 Ezért a csoportok átlagait egy buborékdiagrammon (Bubble Chart) is megjelenítjük: Ez mindig csak két háttérváltozót mutat, és ezek nincsenek normalizálva Viszont tanulmányozható a csoportok mérete és a csoport átlagok egymástól mért távolsága A zöld legördülő menükben beállíthatjuk, milyen háttérváltozókat mutasson az X és Y tengelyeken Igyekezzünk olyan változókat kiválasztani, melyek szerinti különbségek az ANOVA-ban szignifikánsnak bizonyultak. A diagrammot kijelölve, a szürke nyomógombot megnyomva, a buborékok címkéit készíti el A csoportméretek összehasonlítása korrekt módon a tortadiagrammon (Pie Chart) tehető meg

8 A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS-ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

9 Számítógépes alkalmazás egyutas varianciaanalízishez SPSS-ben Elemezzük a Romak.sav adatbázisban az életstílus és a fogyasztási csoportok kombinációiban a háttérváltozók átlagainak különbségeit többutas ANOVA-val!Romak.sav 4 csoportunk van az életstílusra: –Leszakadó, –Kényszergyorsító, –Középréteg, –Jobb módú 7 csoportunk van a fogyasztási- jövedelmi állapotra: –Szegény tradícionális roma, –Hitelbe élő elégedetlen, –Bp.-i sokgyerekes gettólakó, –Kölcsön nem kérő, –Hitelbe élő tétlen, –Asszimilálódott falusi, –Jó módú Mivel az SPSS nem tud többutas ANOVA-t, a 28 cellából előzetes kontingencia tábla elemzéssel kiválasztok 6 érdekeset, amelyek közt a 35 háttérváltozó átlagai szerinti jelentősebb különbségeket elemzem egyutas ANOVA-val: –3 életstílust leíró változó –6 vásárlási magatartást leíró változó –8 korábbi vásárlásokkal kapcsolatos változó (Ruha, Gyógyszer, stb.) –6 médiahasználat változó (Tv, Rádió, Napilap, stb.) –12 demográfiai változó (Kor, Nem, Iskolázottság, stb.)

10 A 6 kombinált csoport változója Ezt a lifshcl6 nevű változót a Transform|Compute menüben számoljuk ki: –Beállítjuk az új változó nevét, típusát, címkéjét –Felírjuk magunknak papíron az alábbi átszámító táblázatot –Az If... gombnál beállítjuk az eredeti változók első értékpárját, –A kifejezés mezőben a transzformált változóértéket –OK gombbal számoltatunk –A számítótáblázat minden sorára megismételjük Az új változót a táblaszerkesztő nézetben értékcímkékkel is ellátjuk: lifeclu4shclu7lifshcl6 115 124 243 462 331 376 katt

11 Egyutas ANOVA a transzformált csoportosító változóval Analyze|Compare means|One way ANOVA...: Csoportosító változó kijelölése Függő változók kijelölése Lineáris kontrasztokat kér A varianciák egyenlőségénél Bonferroni és Tukey tesztekkel ellenőrizünk Nemegyenlőségnél T2 és T3 teszttel. Átlag diagrammokat kér katt Futtatás OK gombbal

12 Az Output Window tartalma Az ANOVA táblában megadja a függő változók F-tesztjeit Látható, hogy a válogatott 6 csoport esetén a szignifikancia szintek a legtöbbször igen közeliek 0-hoz, vagyis jók, ezen csoportok átlagai a legtöbb változó szerint jól elkülönülnek! Az átlagokat megnézhetjük primitív kis vonaldiagrammokon:

13 A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS-ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

14 Az többutas variancia analízis fogalma Az többutas variancia analízis (Two-Way ANOVA) x 1 és x 2 csoportosító/független/faktorváltozók k = 1.. c 1, l = 1..c 2 kategóriáinak összes lehetséges kombinációja szerint j = 1..m kl elemű kezelési részcsoportokat, cellákat (Treatment, Cell) képez egy M elemű mintából. Megvizsgálja, van-e statisztikailag szignifikáns különbség: –a cellák legalább intervallum skálán mért y függő változó szerinti a kl k = 1.. c 1, l = 1..c 2 számtani átlagai közt –a k k = 1.. c 1, a l l = 1..c 2 változónkénti kategória átlagok közt Az alapfeltételezései: Az y függő változó alapsokasági és cellákon belüli eloszlása normális, A cellákon belüli szórások azonosak (F-próbákkal tesztelhető)

15 A kapcsolat erejének számítása 1 A kategóriaátlagok közti kategória-elemszámokkal súlyozott varianciával (Across-Category Weighted Variance) számszerűsítjük a kategóriaátlagok közti eltérések nagyságát: (12.21) (12.22) A cellaátlagok közti cella-elemszámokkal súlyozott varianciával (Across-Cell Weighted Variance) számszerűsítjük a cellaátlagok közti eltérések nagyságát: (12.23) A cellákonkon belüli varianciák cella-elemszámokkal súlyozott átlaga (Weighted Average of Within-Group Variances) azt számszerűsíti, hogy a minta önmagában, mindenféle csoporthatás nélkül, pusztán a véletlen hatására mennyire szóródik: (12.24) A teljes hatás (Main Effect) mutatóban a kategória- és cellatátlagok közti súlyozott variancia összegét összehasonlítjuk a cellákon belüli átlagos varianciával:  2 = (VK 1 + VK 2 + VC) / (VK 1 + VK 2 + VC + VB) (12.25) A teljes hatás tesztelésekor egy egy oldalú F-próba értéket számítunk a kategória- és cellatátlagok közti súlyozott variancia összege és a cellákon belüli átlagos variancia hányadosaként: F = ((VK 1 + VK 2 + VC) / VB)*((M-c 1 ×c 2 )/(c 1 ×c 2 -1))  x 0 (12.26) Ha ez adott  szignifikancia szinten az (c 1 ×c 2 -1,M-c 1 ×c 2 ) szabadságfokú F-eloszlás x 0 kritikus értéke alatt marad, akkor a cellaátlagok nem térnek el egymástól.

16 A kapcsolat erejének számítása 2 Lehetséges, hogy x 1 és x 2 független kategória változók nem is annyira függetlenek egymástól, ami eltorzíthatja az eredményeket. Ezt az interakciós próbával (Interaction of Independents Test) ellenőrzöm: F=(VC/VB)×((M-c 1 ×c 2 )/((c 1 -1)×(c 2 -1)))  x 0 (12.27) Ha ez adott  szignifikancia szinten az ((c 1 -1)×(c 2 -1), M-c 1 ×c 2 ) szabadságfokú F-eloszlás x 0 kritikus értéke alatt marad, akkor a független változók közt nincs interakció. Ha van interakció, akkor a cellaátlagokat meg kell jelenítenem egy 3D felület diagrammon (Area Chart), vagy 3D vonaldiagrammon (Line Chart). Innen tudom megmondani, milyen fajta az interakció. A következők az egyre súlyosabb esetei: –Kategória rangsort tartó –Kategória rangsort nem tartó, de nem keresztező –Kategória rangsort nem tartó, és keresztező

17 A kapcsolat erejének számítása 3 Gyakran a független változók elkülönített hatásait (Partial Effects of Independents Test) is ellenőrizzük, hogy érdemes-e bent tartani őket egyáltalán az elemzésben: F 1 = (VK 1 / VB)×((M-c 1 ×c 2 )/(c 1 -1))  x 0 (12.28) F 2 = (VK 2 / VB)×((M-c 1 ×c 2 )/(c 2 -1))  x 0 (12.29) Ha ezek adott  szignifikancia szinten az ((c 1 -1), M-c 1 ×c 2 ), illetve ((c 2 -1), M-c 1 ×c 2 ) szabadságfokú F-eloszlás x 0 kritikus értéke alatt maradnak, akkor az adott független változónak nincs igazi hatása: –Nyugodtan ki lehet hagyni, és egy utas ANOVA-t kell csinálni, –Vagy más alkalmasabb független változót kell bevonni.

18 A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS-ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

19 Számítógépes alkalmazás többutas ANOVA-hoz Excelben 1 Két nominális változó kapcsolatát eddig csak kereszttabulációval vizsgálhattuk Most azonban a kereszttabuláció cellagyakoriságait cellaátlagokként értelmezve kétutas ANOVA-t is futtathatunk Bonyolítja a helyzetet, hogy a felhasznált kérdések lehetnek egyszeres- vagy többszörös feleletválasztósak. Mintapéldaként egy 2005-ös, a fiatalkori dohányzási szokásokat kutató felmérés szolgál (kérdőívét lásd: DohanyzasKerdoiv.doc, az adatbázist lásd: Dohanyzas.sav), ahol korábbi vizsgálatokkal az 1254 válaszadót már besorolták 7 szocio-demográfiai csoport valamelyikébe. A csoporttagságot a demcu7 változó tárolja.DohanyzasKerdoiv.doc Dohanyzas.sav Egyrészt, arra vagyunk kíváncsiak, hogy a csoportbatartozás milyen kapcsolatban áll a dohányzás okozta károk megítélésével, mint háttérváltozóval (Egyszeres feleltválasztós kérdés, dohkarok változóban tárolódik): Másrészt, a csoportbatartozás és a dohányzás kipróbálása, mint háttérváltozó kapcsolatát kutatjuk (többszörös feleletválasztós kérdés, alternatívái a dohprob0..dohprob9 bináris változókban tárolódnak)

20 Számítógépes alkalmazás többutas ANOVA-hoz Excelben 2 A KetUtasANOVA.xls fájl példát mutat rá, hogy SPSS-ből az eredményeket a zöld cellákba másolva gyorsan elvégezzük a csoporttagság változó és egyszeres feleletválasztós (lásd: EgyszeresFelelValaszt munkalap), illetve többszörös feleletválasztós (lásd: TobbszorosFelValaszt munkalap) kérdések kereszttabulálásával kapcsolatos teszteket, és a menükiválasztás alapján a gyakoriságok, várt gyakoriságok, reziduumok, relatív rezidumok térképen történő megjelenítését, valamint az egy- és kétutas ANOVA-kat:KetUtasANOVA.xls

21 Az egyszeres feleletválasztós kereszttabulációk kezelése 1 Ha két egyszeres feleletválasztós kérdést kereszttabulálunk: Indítsuk el az SPSS-t File|Open menüvel nyissuk meg a Dohanyzas.sav fájltDohanyzas.sav Az Analyze|Descriptive Statistics|Crosstabs menüvel megnyitjuk a kereszttabuláció (Crosstabs) ablakot Kiválasztjuk a sor(Row) és oszlop(Column) változókat a változólistából. Általában a csoporttagság változót (defaclu7) szoktuk sorokba tenni, oszlopokba pedig a háttérváltozót (dohkarok) A gombbal tényleges gyakoriságokat (Observed Counts) kérünk Az gombbal indítjuk a számolást katt

22 Okozhat-e kárt neked a dohányzás? Total Igen, akkor is ha más dohányzi k elõttem igen, mert én is dohányz om Nem, mert csak keveset dohányz om Nem, mert alascony nikotin- és kátránytartal mú termékeket fo Nem mert nem tüdõzöm le Nem,mert ismerek dohányosoka t, akik magas kort éltek meg Nem mert erõs szervezet em van Demográfi a 7 csoport 4 demográfi ai faktoron Jólszituált61216 11 90 Vidéki leszakadók168125 1 186 Városi lázadó dohányos505341 31112 Városi leszakadó86411 11103 Értelmiségi hátterû17427 183 Pörgõs iskolarém dohányosok152333 81466 Vidéki lázadó dohányosok28451 1277 Total58216037421418817 Az egyszeres feleletválasztós kereszttabulációk kezelése 2 Az Output Window| Crosstabs-ban megjelenő kontingencia táblát átmásoljuk a vágólapon keresztül az EgyszeresFelelValaszt munkalap Cellaösszegek nevű táblázatának zöld színű celláiba A beillesztést a vágólapról a Szerkesztés| Irányított beillesztés| Csak szöveget (Edit| Paste special| Text only)menüvel tegyük, különben elrontjuk a munkalap formázásait Töltsük ki a sor/oszlop változók nevét A munkalapon az Egyszerű kereszttábla? kérdésre válaszoljunk Y-t! A sor/oszlop sorszámok arra valók, hogy a sorok/oszlopok térképen történő megjelenési sorrendjét szabályozzuk vele, a számítások eredményét nem befolyásoláják

23 Az egyszeres feleletválasztós kereszttabulációk kezelése 3 Olvassuk le a Cramer V mutató értékét (erős) A menüből válasszuk ki a megjeleníteni kívánt térképet a diagrammra A diagramm területet egérkattintással kijelölve, az alatta lévő adatforrás-cellákon behúzhatjuk egérrel az adatforrás kijelölő keretet, hogy kihagyjuk az éppen üres cellákat, így a diagramm jobban látható lesz. Ha a térképet egy word jelentésbe másoljuk vágólapon keresztül, akkor ne a diagrammot, hanem az alatta lévő cellákat válasszuk ki, és a vágólapról történő beillesztést a Szerkesztés| Irányított beillesztés...| Kép, metafájl menüvel végezzük, különben a jelmagyarázat nem megy át! katt húz A reziduális térképről látszik, hogy a Pörgős iskolarém dohányosok- nál egyedül nyomokban fellelhető a hit, hogy ők mindent kibírnak, ezért a dohányzás nem árt nekik

24 Az egyszeres feleletválasztós kereszttabulációk kezelése 4 Az ANOVA-k eredményei a következőképpen állnak elő: Sor/oszlop csoportok egyutas ANOVA-inak szignifikancia szintjei A két csoportosító változó közti kétutas ANOVA teljes hatás szignifikancia szintje A sor- és oszlopfaktorok elkülönített hatásainak szignifikancia szintjei A sor- és oszlopfaktorok közti kereszthatás szignifikancia szintje

25 A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS-ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

26 A többszörös feleletválasztós kereszttabulációk kezelése 1 Ha egy egyszeres felelet- választós kérdést kereszt- tabulálunk egy többszörös feleletválasztós kérdéssel: Az Analyze| Reports| Case summaries menüvel indítjuk a csoportosított adatok számítását (Summarize cases) A többszörös feleletválasztós kérdés bináris változóit (dohprob0..dohprob9) a ►gombra kattintva bevonjuk az elemzés változóinak (Variables) Csoportosító változónak (Grouping variable) a ►gombra kattintva kivá- lasztjuk a csoporttagságot leíró egysze- res feleletválasztós változót (defaclu7) Kikapcsoljuk az egyes esetek mutatását (Display Cases), mert csak összesítést kérünk A gombbal kinyitjuk a statisztikák számítását. A ►gombra kattintva beállítjuk, hogy összegeket (Sum) számoljon Az gombbal indítjuk a számításokat katt shift +húz shift +húz

27 A többszörös feleletválasztós kereszttabulációk kezelése 2 Az Output Window| Case summaries pontjára állunk Kimásoljuk belőle az összegeket, a kategóriák neveit a Tobbszoros FelelValaszt munkalap Cellaösszegek táblázatába, csak szövegként beillesztve Kitöltjük a sor/oszlop változók neveit A Simple crosstab? kérdésre beírjuk, hogy N Case Summaries Sum Demográfia 7 csoport 4 demográfiai faktoron Dohányz áspróba: Soha nem próbálná m ki Dohányz áspróba: Kíváncsi ság Dohányz áspróba: Saját döntés Dohányz áspróba: Szüleim dohányz ása miatt Dohányz áspróba: Szüleim/t anáraim tiltása miatt Dohányz áspróba: Barát/bar átnõ hatására Dohányz áspróba: Osztálytá rsak/hav erok hatása Dohányz áspróba: Kedvenc filmhõsö m/Tv szereplõ m miatt Dohányz áspróba: Cigaretta reklám hatására Dohányz áspróba: Cigarettá t áruló fiatalok miatt Jólszituált1864603738201 Vidéki leszakadók601841155856110 Városi lázadó dohányos11041215763230 Városi leszakadó38521402135000 Értelmiségi hátterû79110645051111 Pörgõs iskolarém dohányosok51046424 010 Vidéki lázadó dohányosok0431254339101 Total20164216719290306763

28 A többszörös feleletválasztós kereszttabulációk kezelése 3 Második körben gyakoriságokat (Number of Cases)-t számolunk az Anlyze| Reports| Case summaries-ben Az Output window| Case summaries-re állunk Az eredményt átmásoljuk a Tobb- szorosFeleletValaszt munkalap Cellába eső megfigyelések száma táblázatába Case Summaries N Demográfia 7 csoport 4 demográfiai faktoron Dohányzásp róba: Soha nem próbálnám ki Dohányzásp róba: Kíváncsiság Dohányzásp róba: Saját döntés Dohányzásp róba: Szüleim dohányzása miatt Dohányzásp róba: Szüleim/tan áraim tiltása miatt Dohányzásp róba: Barát/barátn õ hatására Dohányzásp róba: Osztálytársa k/haverok hatása Dohányzásp róba: Kedvenc filmhõsöm/T v szereplõm miatt Dohányzásp róba: Cigarettarekl ám hatására Dohányzásp róba: Cigarettát áruló fiatalok miatt Jólszituált90 Vidéki leszakadók186 Városi lázadó dohányos112 Városi leszakadó103 Értelmiségi hátterû183 Pörgõs iskolarém dohányosok66 Vidéki lázadó dohányosok77 Total817

29 Case Summaries Variance Demográfia 7 csoport 4 demográfiai faktoron Dohányz áspróba: Soha nem próbálná m ki Dohányzá spróba: Kíváncsis ág Dohányz áspróba: Saját döntés Dohányzá spróba: Szüleim dohányzá sa miatt Dohányzá spróba: Szüleim/t anáraim tiltása miatt Dohányz áspróba: Barát/bar átnõ hatására Dohányzá spróba: Osztálytár sak/haver ok hatása Dohányz áspróba: Kedvenc filmhõsö m/Tv szereplõ m miatt Dohányzá spróba: Cigarettar eklám hatására Dohányz áspróba: Cigarettá t áruló fiatalok miatt Jólszituált0.1620.0630.0430.0630.0000.2450.2470.0220.0000.011 Vidéki leszakadók0.2200.0880.0210.0560.0260.2160.2120.005 0.000 Városi lázadó dohányos0.0090.0820.0350.0970.0090.2520.2480.0180.0260.000 Városi leszakadó0.2350.0470.0190.1190.0000.1640.2270.000 Értelmiségi hátterû0.2470.0570.0000.0320.0210.2000.2020.005 Pörgõs iskolarém dohányosok0.0710.1310.0580.0840.0580.235 0.0000.0150.000 Vidéki lázadó dohányosok0.0000.0500.0380.1330.0620.2500.2530.0130.0000.013 Total0.1860.0720.0250.0750.0230.2290.2350.0090.0070.004 A többszörös feleletválasztós kereszttabulációk kezelése 4 Harmadik körben varianciákat (Variance)- t számolunk az Anlyze| Reports| Case summaries-ben Az Output window| Case summaries-re állunk Az eredményt átmásoljuk a Tobb- szorosFeleletValaszt munkalap Cellákba eső varianciák táblázatba

30 A többszörös feleletválasztós kereszttabulációk kezelése 5 Ezekután, leolvashatjuk az asszociáció erősségét jelző Cramer V-tesztet (gyenge) A menüben reziduumokat kérünk A reziduális térképet az egyszerű kereszttabulációnál tárgyaltakhoz hasonlóan kimásolhatjuk egy Word jelentésbe A reziduumokból látható, hogy a Városi lázadó dohányosok inkább az osztálytársak hatására, még a Vidéki lázadó dohányosok inkább barát/ barátnő hatására szoknak rá a dohányzásra

31 Többszörös feleletválasztós kereszttabulációk kezelése 5 Az ANOVA-k eredményei a következőképpen állnak elő: Sor/oszlop csoportok egyutas ANOVA-inak szignifikancia szintjei A két csoportosító változó közti kétutas ANOVA teljes hatás szignifikancia szintje A sor- és oszlopfaktorok elkülönített hatásainak szignifikancia szintjei A sor- és oszlopfaktorok közti kereszthatás

32 A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS- ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

33 12-1. Házi Feladat (2.5 pont) Az Autószobrászat Bt. adatbázisában (AdatbazisMinta.sav) 135 válaszadót 5 piaci szegmensbe osztottak. A szegmenstagságot a Segment változó tárolja.AdatbazisMinta.sav Elemezze az EgyUtasANOVA.xls egyutas ANOVA elemző rendszer segítségével, mely háttérváltozók szerint különböznek egymástól szignifikánsan a szegmensek:EgyUtasANOVA.xls –Att..... – autóvásárlási attitüd változók –Imp..... – autó termékjellemző fontosság változók –Dem..... – demográfiai változók Megoldás: 12-1Megoldas.xls12-1Megoldas.xls

34 12-2. Házi Feladat (2.5 pont) Az Autószobrászat Bt. adatbázisában ( AdatbazisMinta.sav ) elemezze a KetUtasANOVA.xls Kétutas ANOVA elemző rendszer segítségével, hogy a DemTown – településtipus és a DemIncome – jövedelem katgóriák kombinációinak van-e szignifikáns hatása az autóköltési költségvetésre (CarBudget) AdatbazisMinta.sav KetUtasANOVA.xls Megoldás: 12-2Megoldas.xls12-2Megoldas.xls


Letölteni ppt "Pécsi Tudományegyetem Pollack Mihály Műszaki Kar Műszaki Informatika Szak Data Mining 12. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens PTE-PMMK Számítástechnika."

Hasonló előadás


Google Hirdetések