Pécsi Tudományegyetem Pollack Mihály Műszaki Kar Műszaki Informatika Szak Data Mining 12. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens PTE-PMMK Számítástechnika.

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Egy faktor szerinti ANOVA
Összetett kísérleti tervek és kiértékelésük
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Feladat Egy új kísérleti készítmény hatását szeretnék vizsgálni egereken. 5 féle dózist adnak be 5 vizsgált egérnek, de nem sikerült mindegyik egérnek.
Táblázat kezelő programok
Két változó közötti összefüggés
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
A megoldás főbb lépései:
Általános lineáris modellek
Összefüggés vizsgálatok
Mérési pontosság (hőmérő)
Gazdaságelemzési és Statisztikai Tanszék
Adatbáziskezelés az MSAccess programmal Makány György 5. rész: Jelentések.
Adatbáziskezelés az MSAccess programmal Makány György 2. rész: Adattáblák létrehozása külső adatforrásból.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
A középérték mérőszámai
Cellák és tartalmak formázása táblázatkezelő programokban Készítette: Péter Tünde Felkészítő tanár: András Izabella Iskola: Gábor Áron Iskolaközpont,
Gazdasági informatikából megkaptuk a félévi feladatot!!! Mindenki nagy örömére… 0. hét.
Hasonlóságelemzés COCO használatával a MY-X elemzőben
Kimutatáskészítés Segédanyag a Felszámolási és vagyonfelügyeleti szakközgazdász valamint Felszámolási és vagyonfelügyeleti specialista szakirányú továbbképzés.
Regresszióanalízis 10. gyakorlat.
Varianciaanalízis 12. gyakorlat.
Összesítés és csoportosítás lekérdezésekben. Halmazműveletek.
SPSS leíró statisztika és kereszttábla elemzés (1-2. fejezet)
Microsoft Excel Diagramok.
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Nem-paraméteres eljárások, több csoport összehasonlítása
Kovarianciaanalízis Tételezzük fel, hogy a kvalitatív tényező(k) hatásának azonosítása után megmaradó szóródás egy részének eredete ismert, és nem lehet,
Térkép. Mi az adat? Minden információ, amit tárolni kell. Minden információ, amit tárolni kell.  szám  szöveg  dátum  hang  kép, stb.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Egytényezős variancia-analízis
Az F-próba szignifikáns
Alapszint 2.  Készíts makrót, ami a kijelölt cellákat egybenyitja, a tartalmat vízszintesen és függőlegesen középre igazítja és 12 pontos betűméretűre.
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Hipotézis vizsgálat (2)
Többváltozós adatelemzés
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Többtényezős ANOVA.
Adatleírás.
Többszempontos ANOVA (I
Statisztikai alapfogalmak
Turócziné Kiscsatári Nóra
Területmérlegre vonatkozó konzisztencia-vizsgálat Gazdasági Informatika Tanszék 2004/2005. tanév Utolsó frissítés:
A szóráselemzés gondolatmenete
Táblázatok.
Valószínűségszámítás II.
Számítógépes grafika I. AUTOCAD alapok
Gazdasági informatikus - Szövegszerkesztés 1 Bekezdések formázása 3.
Alapfogalmak, adatforrások, szűrés
Korreláció-számítás.
A számítógépes elemzés alapjai
Az SPSS programrendszer.
12. Előadás Dr. Pauler Gábor, Egyetemi Docens
Pécsi Tudományegyetem Pollack Mihály Műszaki Kar Műszaki Informatika Szak Data Mining 11. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens PTE-PMMK Számítástechnika.
Pécsi Tudományegyetem Pollack Mihály Műszaki Kar Műszaki Informatika Szak Data Mining 16. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens PTE-PMMK Számítástechnika.
Pécsi Tudományegyetem Pollack Mihály Műszaki Kar Műszaki Informatika Szak Data Mining 17. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens PTE-PMMK Számítástechnika.
A számítógépes elemzés alapjai
Kimutatás készítés 1..
Jelentések Jelentést akkor használunk, ha az adatbázisban letárolt adatokat szeretnénk kinyomtatni. A jelentésben szereplő adatok alapja egy tábla vagy.
Becsléselmélet - Konzultáció
Adatelemzési gyakorlatok
18. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens
Gazdaságinformatika MSc labor
Statisztika segédlet a Statistica programhoz Új verzióknál érdemes a View menüsor alatt a Classic menu-s verziót választani – ehhez készült a segédlet.
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
1.3. Hipotézisvizsgálat, statisztikai próbák
A normális eloszlásból származó eloszlások
Előadás másolata:

Pécsi Tudományegyetem Pollack Mihály Műszaki Kar Műszaki Informatika Szak Data Mining 12. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens PTE-PMMK Számítástechnika Tanszék Iroda: Boszorkány u., B épület 101 Tel: 72/ /

A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS-ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

Számítógépes alkalmazás egyutas variancia analízishez Excelben 1 A EgyUtasANOVA.xls fájl Excelben mutat példát:EgyUtasANOVA.xls A csoportosított változók átlagainak vizuális megjelenítésére, Az átlagok különbségének egyutas variancia analízisssel történő tesztelésére. A rendszer max megfigyelést, max. 35 változót, és max. 8 csoportot kezel Jelenleg a 2003-as OTKA Romakutatás 1000 fős, az egész ország területére (kor, nem, jövedelem, iskolai végzettség, foglalkozás, településtípus) szerint reprezetatív mintája van a rendszerbe betöltve Ebben a mintában korábban már – csoportosító módszerekkel végzett vizsgálatok eredményeképp – 4 életstílus és 7 vásárlási csoportba sorolták a romákat Mi most a 7 vásárlási csoportba tartozás, mint független változó hatását szeretnénk elemezni 35 darab függő háttérváltozóra, amelyeket a csoportok jellemzésére használunk. Ezek közt van: –3 életstílust leíró változó –6 vásárlási magatartást leíró változó –8 korábbi vásárlásokkal kapcsolatos változó (Ruha, Gyógyszer, stb.) –6 médiahasználat változó (Tv, Rádió, Napilap, stb.) –12 demográfiai változó (Kor, Nem, Iskolázottság, Jövedelem, stb.) A fájl több munkalapból áll:

Számítógépes alkalmazás egyutas variancia analízishez Excelben 2 Az AdatBazis munkalapra kell betölteni a kérdőívek tartalmát, a zöld cellákba oly módon, hogy: –A megfigyelések sorokban legyenek –A kérdésekre adott válaszok oszlopokban –Az első sor a változóneveket tartalmazza Az AdatSzotar munkalapon a zöld cellákban le kell írni: –A változók nevét –A változók skálatípusát –A változók címkéjét –Kategóraaváltózóknál a lehetséges értékeiket és azok jelentését A CsoportAtlagok munkalap egy Excel kimutatás (Pivot Table) segítségével kiszámítja a csoportok gyakoriságát és a háttérváltozók csoportátlagát. A csoportosító változó és a háttérváltozók sárga szinű legördülő menükből választhatók ki. A CsoportVarianciak munkalapon az előbbihez hasonló módon a háttérváltozók csoportokon belüli varianciái számíthatók ki Ügyeljünk, hogy kiválasztott változók a két utóbbi munkalap közt szinkronban legyenek!

Számítógépes alkalmazás egyutas variancia analízishez Excelben 3 Az EgyUtasANOVA munkalap kiszedi a zöld cellákba : A csoportneveket, -méreteket, A csoportátlagokat, -varianciákat a kimutatásokból és az adatszótárból. Minden háttérváltozóra egyutas ANOVA-t hajt végre: *-gal jelöli meg a változó nevét, ha  =5%- os szinten szignifikáns a csoportátlagok különbsége **-gal jelöli, ha  =1%-os szinten, vagyis nagyon erős a csoportosító változó hatása A csoportátlagokat először egy pókháló diagrammon (Radar Plot) jeleníti meg Itt jól összehasonlíthatók a csoportok átlagai az összes változó tekintetében Hogy a különböző változók szerinti átlagértékek könnyebben összehasonlíthatók legyenek, a diagrammon minden változót normalizálva (Normalization) mutatunk, vagyis 0 várható értékű, 1 szórású változóvá konvertáljuk őket: x Norm = (x – Átlag(x))/Szórás(x)(12.20) A pókháló diagramm hátránya, hogy a csoportok méretét és átlagaik közti távolságot nem tudja megmutatni. A vásárlási csoportoknak a Hitelre 5%-on szignifikáns hatása van

Számítógépes alkalmazás egyutas variancia analízishez Excelben 4 Ezért a csoportok átlagait egy buborékdiagrammon (Bubble Chart) is megjelenítjük: Ez mindig csak két háttérváltozót mutat, és ezek nincsenek normalizálva Viszont tanulmányozható a csoportok mérete és a csoport átlagok egymástól mért távolsága A zöld legördülő menükben beállíthatjuk, milyen háttérváltozókat mutasson az X és Y tengelyeken Igyekezzünk olyan változókat kiválasztani, melyek szerinti különbségek az ANOVA-ban szignifikánsnak bizonyultak. A diagrammot kijelölve, a szürke nyomógombot megnyomva, a buborékok címkéit készíti el A csoportméretek összehasonlítása korrekt módon a tortadiagrammon (Pie Chart) tehető meg

A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS-ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

Számítógépes alkalmazás egyutas varianciaanalízishez SPSS-ben Elemezzük a Romak.sav adatbázisban az életstílus és a fogyasztási csoportok kombinációiban a háttérváltozók átlagainak különbségeit többutas ANOVA-val!Romak.sav 4 csoportunk van az életstílusra: –Leszakadó, –Kényszergyorsító, –Középréteg, –Jobb módú 7 csoportunk van a fogyasztási- jövedelmi állapotra: –Szegény tradícionális roma, –Hitelbe élő elégedetlen, –Bp.-i sokgyerekes gettólakó, –Kölcsön nem kérő, –Hitelbe élő tétlen, –Asszimilálódott falusi, –Jó módú Mivel az SPSS nem tud többutas ANOVA-t, a 28 cellából előzetes kontingencia tábla elemzéssel kiválasztok 6 érdekeset, amelyek közt a 35 háttérváltozó átlagai szerinti jelentősebb különbségeket elemzem egyutas ANOVA-val: –3 életstílust leíró változó –6 vásárlási magatartást leíró változó –8 korábbi vásárlásokkal kapcsolatos változó (Ruha, Gyógyszer, stb.) –6 médiahasználat változó (Tv, Rádió, Napilap, stb.) –12 demográfiai változó (Kor, Nem, Iskolázottság, stb.)

A 6 kombinált csoport változója Ezt a lifshcl6 nevű változót a Transform|Compute menüben számoljuk ki: –Beállítjuk az új változó nevét, típusát, címkéjét –Felírjuk magunknak papíron az alábbi átszámító táblázatot –Az If... gombnál beállítjuk az eredeti változók első értékpárját, –A kifejezés mezőben a transzformált változóértéket –OK gombbal számoltatunk –A számítótáblázat minden sorára megismételjük Az új változót a táblaszerkesztő nézetben értékcímkékkel is ellátjuk: lifeclu4shclu7lifshcl katt

Egyutas ANOVA a transzformált csoportosító változóval Analyze|Compare means|One way ANOVA...: Csoportosító változó kijelölése Függő változók kijelölése Lineáris kontrasztokat kér A varianciák egyenlőségénél Bonferroni és Tukey tesztekkel ellenőrizünk Nemegyenlőségnél T2 és T3 teszttel. Átlag diagrammokat kér katt Futtatás OK gombbal

Az Output Window tartalma Az ANOVA táblában megadja a függő változók F-tesztjeit Látható, hogy a válogatott 6 csoport esetén a szignifikancia szintek a legtöbbször igen közeliek 0-hoz, vagyis jók, ezen csoportok átlagai a legtöbb változó szerint jól elkülönülnek! Az átlagokat megnézhetjük primitív kis vonaldiagrammokon:

A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS-ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

Az többutas variancia analízis fogalma Az többutas variancia analízis (Two-Way ANOVA) x 1 és x 2 csoportosító/független/faktorváltozók k = 1.. c 1, l = 1..c 2 kategóriáinak összes lehetséges kombinációja szerint j = 1..m kl elemű kezelési részcsoportokat, cellákat (Treatment, Cell) képez egy M elemű mintából. Megvizsgálja, van-e statisztikailag szignifikáns különbség: –a cellák legalább intervallum skálán mért y függő változó szerinti a kl k = 1.. c 1, l = 1..c 2 számtani átlagai közt –a k k = 1.. c 1, a l l = 1..c 2 változónkénti kategória átlagok közt Az alapfeltételezései: Az y függő változó alapsokasági és cellákon belüli eloszlása normális, A cellákon belüli szórások azonosak (F-próbákkal tesztelhető)

A kapcsolat erejének számítása 1 A kategóriaátlagok közti kategória-elemszámokkal súlyozott varianciával (Across-Category Weighted Variance) számszerűsítjük a kategóriaátlagok közti eltérések nagyságát: (12.21) (12.22) A cellaátlagok közti cella-elemszámokkal súlyozott varianciával (Across-Cell Weighted Variance) számszerűsítjük a cellaátlagok közti eltérések nagyságát: (12.23) A cellákonkon belüli varianciák cella-elemszámokkal súlyozott átlaga (Weighted Average of Within-Group Variances) azt számszerűsíti, hogy a minta önmagában, mindenféle csoporthatás nélkül, pusztán a véletlen hatására mennyire szóródik: (12.24) A teljes hatás (Main Effect) mutatóban a kategória- és cellatátlagok közti súlyozott variancia összegét összehasonlítjuk a cellákon belüli átlagos varianciával:  2 = (VK 1 + VK 2 + VC) / (VK 1 + VK 2 + VC + VB) (12.25) A teljes hatás tesztelésekor egy egy oldalú F-próba értéket számítunk a kategória- és cellatátlagok közti súlyozott variancia összege és a cellákon belüli átlagos variancia hányadosaként: F = ((VK 1 + VK 2 + VC) / VB)*((M-c 1 ×c 2 )/(c 1 ×c 2 -1))  x 0 (12.26) Ha ez adott  szignifikancia szinten az (c 1 ×c 2 -1,M-c 1 ×c 2 ) szabadságfokú F-eloszlás x 0 kritikus értéke alatt marad, akkor a cellaátlagok nem térnek el egymástól.

A kapcsolat erejének számítása 2 Lehetséges, hogy x 1 és x 2 független kategória változók nem is annyira függetlenek egymástól, ami eltorzíthatja az eredményeket. Ezt az interakciós próbával (Interaction of Independents Test) ellenőrzöm: F=(VC/VB)×((M-c 1 ×c 2 )/((c 1 -1)×(c 2 -1)))  x 0 (12.27) Ha ez adott  szignifikancia szinten az ((c 1 -1)×(c 2 -1), M-c 1 ×c 2 ) szabadságfokú F-eloszlás x 0 kritikus értéke alatt marad, akkor a független változók közt nincs interakció. Ha van interakció, akkor a cellaátlagokat meg kell jelenítenem egy 3D felület diagrammon (Area Chart), vagy 3D vonaldiagrammon (Line Chart). Innen tudom megmondani, milyen fajta az interakció. A következők az egyre súlyosabb esetei: –Kategória rangsort tartó –Kategória rangsort nem tartó, de nem keresztező –Kategória rangsort nem tartó, és keresztező

A kapcsolat erejének számítása 3 Gyakran a független változók elkülönített hatásait (Partial Effects of Independents Test) is ellenőrizzük, hogy érdemes-e bent tartani őket egyáltalán az elemzésben: F 1 = (VK 1 / VB)×((M-c 1 ×c 2 )/(c 1 -1))  x 0 (12.28) F 2 = (VK 2 / VB)×((M-c 1 ×c 2 )/(c 2 -1))  x 0 (12.29) Ha ezek adott  szignifikancia szinten az ((c 1 -1), M-c 1 ×c 2 ), illetve ((c 2 -1), M-c 1 ×c 2 ) szabadságfokú F-eloszlás x 0 kritikus értéke alatt maradnak, akkor az adott független változónak nincs igazi hatása: –Nyugodtan ki lehet hagyni, és egy utas ANOVA-t kell csinálni, –Vagy más alkalmasabb független változót kell bevonni.

A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS-ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

Számítógépes alkalmazás többutas ANOVA-hoz Excelben 1 Két nominális változó kapcsolatát eddig csak kereszttabulációval vizsgálhattuk Most azonban a kereszttabuláció cellagyakoriságait cellaátlagokként értelmezve kétutas ANOVA-t is futtathatunk Bonyolítja a helyzetet, hogy a felhasznált kérdések lehetnek egyszeres- vagy többszörös feleletválasztósak. Mintapéldaként egy 2005-ös, a fiatalkori dohányzási szokásokat kutató felmérés szolgál (kérdőívét lásd: DohanyzasKerdoiv.doc, az adatbázist lásd: Dohanyzas.sav), ahol korábbi vizsgálatokkal az 1254 válaszadót már besorolták 7 szocio-demográfiai csoport valamelyikébe. A csoporttagságot a demcu7 változó tárolja.DohanyzasKerdoiv.doc Dohanyzas.sav Egyrészt, arra vagyunk kíváncsiak, hogy a csoportbatartozás milyen kapcsolatban áll a dohányzás okozta károk megítélésével, mint háttérváltozóval (Egyszeres feleltválasztós kérdés, dohkarok változóban tárolódik): Másrészt, a csoportbatartozás és a dohányzás kipróbálása, mint háttérváltozó kapcsolatát kutatjuk (többszörös feleletválasztós kérdés, alternatívái a dohprob0..dohprob9 bináris változókban tárolódnak)

Számítógépes alkalmazás többutas ANOVA-hoz Excelben 2 A KetUtasANOVA.xls fájl példát mutat rá, hogy SPSS-ből az eredményeket a zöld cellákba másolva gyorsan elvégezzük a csoporttagság változó és egyszeres feleletválasztós (lásd: EgyszeresFelelValaszt munkalap), illetve többszörös feleletválasztós (lásd: TobbszorosFelValaszt munkalap) kérdések kereszttabulálásával kapcsolatos teszteket, és a menükiválasztás alapján a gyakoriságok, várt gyakoriságok, reziduumok, relatív rezidumok térképen történő megjelenítését, valamint az egy- és kétutas ANOVA-kat:KetUtasANOVA.xls

Az egyszeres feleletválasztós kereszttabulációk kezelése 1 Ha két egyszeres feleletválasztós kérdést kereszttabulálunk: Indítsuk el az SPSS-t File|Open menüvel nyissuk meg a Dohanyzas.sav fájltDohanyzas.sav Az Analyze|Descriptive Statistics|Crosstabs menüvel megnyitjuk a kereszttabuláció (Crosstabs) ablakot Kiválasztjuk a sor(Row) és oszlop(Column) változókat a változólistából. Általában a csoporttagság változót (defaclu7) szoktuk sorokba tenni, oszlopokba pedig a háttérváltozót (dohkarok) A gombbal tényleges gyakoriságokat (Observed Counts) kérünk Az gombbal indítjuk a számolást katt

Okozhat-e kárt neked a dohányzás? Total Igen, akkor is ha más dohányzi k elõttem igen, mert én is dohányz om Nem, mert csak keveset dohányz om Nem, mert alascony nikotin- és kátránytartal mú termékeket fo Nem mert nem tüdõzöm le Nem,mert ismerek dohányosoka t, akik magas kort éltek meg Nem mert erõs szervezet em van Demográfi a 7 csoport 4 demográfi ai faktoron Jólszituált Vidéki leszakadók Városi lázadó dohányos Városi leszakadó Értelmiségi hátterû Pörgõs iskolarém dohányosok Vidéki lázadó dohányosok Total Az egyszeres feleletválasztós kereszttabulációk kezelése 2 Az Output Window| Crosstabs-ban megjelenő kontingencia táblát átmásoljuk a vágólapon keresztül az EgyszeresFelelValaszt munkalap Cellaösszegek nevű táblázatának zöld színű celláiba A beillesztést a vágólapról a Szerkesztés| Irányított beillesztés| Csak szöveget (Edit| Paste special| Text only)menüvel tegyük, különben elrontjuk a munkalap formázásait Töltsük ki a sor/oszlop változók nevét A munkalapon az Egyszerű kereszttábla? kérdésre válaszoljunk Y-t! A sor/oszlop sorszámok arra valók, hogy a sorok/oszlopok térképen történő megjelenési sorrendjét szabályozzuk vele, a számítások eredményét nem befolyásoláják

Az egyszeres feleletválasztós kereszttabulációk kezelése 3 Olvassuk le a Cramer V mutató értékét (erős) A menüből válasszuk ki a megjeleníteni kívánt térképet a diagrammra A diagramm területet egérkattintással kijelölve, az alatta lévő adatforrás-cellákon behúzhatjuk egérrel az adatforrás kijelölő keretet, hogy kihagyjuk az éppen üres cellákat, így a diagramm jobban látható lesz. Ha a térképet egy word jelentésbe másoljuk vágólapon keresztül, akkor ne a diagrammot, hanem az alatta lévő cellákat válasszuk ki, és a vágólapról történő beillesztést a Szerkesztés| Irányított beillesztés...| Kép, metafájl menüvel végezzük, különben a jelmagyarázat nem megy át! katt húz A reziduális térképről látszik, hogy a Pörgős iskolarém dohányosok- nál egyedül nyomokban fellelhető a hit, hogy ők mindent kibírnak, ezért a dohányzás nem árt nekik

Az egyszeres feleletválasztós kereszttabulációk kezelése 4 Az ANOVA-k eredményei a következőképpen állnak elő: Sor/oszlop csoportok egyutas ANOVA-inak szignifikancia szintjei A két csoportosító változó közti kétutas ANOVA teljes hatás szignifikancia szintje A sor- és oszlopfaktorok elkülönített hatásainak szignifikancia szintjei A sor- és oszlopfaktorok közti kereszthatás szignifikancia szintje

A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS-ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

A többszörös feleletválasztós kereszttabulációk kezelése 1 Ha egy egyszeres felelet- választós kérdést kereszt- tabulálunk egy többszörös feleletválasztós kérdéssel: Az Analyze| Reports| Case summaries menüvel indítjuk a csoportosított adatok számítását (Summarize cases) A többszörös feleletválasztós kérdés bináris változóit (dohprob0..dohprob9) a ►gombra kattintva bevonjuk az elemzés változóinak (Variables) Csoportosító változónak (Grouping variable) a ►gombra kattintva kivá- lasztjuk a csoporttagságot leíró egysze- res feleletválasztós változót (defaclu7) Kikapcsoljuk az egyes esetek mutatását (Display Cases), mert csak összesítést kérünk A gombbal kinyitjuk a statisztikák számítását. A ►gombra kattintva beállítjuk, hogy összegeket (Sum) számoljon Az gombbal indítjuk a számításokat katt shift +húz shift +húz

A többszörös feleletválasztós kereszttabulációk kezelése 2 Az Output Window| Case summaries pontjára állunk Kimásoljuk belőle az összegeket, a kategóriák neveit a Tobbszoros FelelValaszt munkalap Cellaösszegek táblázatába, csak szövegként beillesztve Kitöltjük a sor/oszlop változók neveit A Simple crosstab? kérdésre beírjuk, hogy N Case Summaries Sum Demográfia 7 csoport 4 demográfiai faktoron Dohányz áspróba: Soha nem próbálná m ki Dohányz áspróba: Kíváncsi ság Dohányz áspróba: Saját döntés Dohányz áspróba: Szüleim dohányz ása miatt Dohányz áspróba: Szüleim/t anáraim tiltása miatt Dohányz áspróba: Barát/bar átnõ hatására Dohányz áspróba: Osztálytá rsak/hav erok hatása Dohányz áspróba: Kedvenc filmhõsö m/Tv szereplõ m miatt Dohányz áspróba: Cigaretta reklám hatására Dohányz áspróba: Cigarettá t áruló fiatalok miatt Jólszituált Vidéki leszakadók Városi lázadó dohányos Városi leszakadó Értelmiségi hátterû Pörgõs iskolarém dohányosok Vidéki lázadó dohányosok Total

A többszörös feleletválasztós kereszttabulációk kezelése 3 Második körben gyakoriságokat (Number of Cases)-t számolunk az Anlyze| Reports| Case summaries-ben Az Output window| Case summaries-re állunk Az eredményt átmásoljuk a Tobb- szorosFeleletValaszt munkalap Cellába eső megfigyelések száma táblázatába Case Summaries N Demográfia 7 csoport 4 demográfiai faktoron Dohányzásp róba: Soha nem próbálnám ki Dohányzásp róba: Kíváncsiság Dohányzásp róba: Saját döntés Dohányzásp róba: Szüleim dohányzása miatt Dohányzásp róba: Szüleim/tan áraim tiltása miatt Dohányzásp róba: Barát/barátn õ hatására Dohányzásp róba: Osztálytársa k/haverok hatása Dohányzásp róba: Kedvenc filmhõsöm/T v szereplõm miatt Dohányzásp róba: Cigarettarekl ám hatására Dohányzásp róba: Cigarettát áruló fiatalok miatt Jólszituált90 Vidéki leszakadók186 Városi lázadó dohányos112 Városi leszakadó103 Értelmiségi hátterû183 Pörgõs iskolarém dohányosok66 Vidéki lázadó dohányosok77 Total817

Case Summaries Variance Demográfia 7 csoport 4 demográfiai faktoron Dohányz áspróba: Soha nem próbálná m ki Dohányzá spróba: Kíváncsis ág Dohányz áspróba: Saját döntés Dohányzá spróba: Szüleim dohányzá sa miatt Dohányzá spróba: Szüleim/t anáraim tiltása miatt Dohányz áspróba: Barát/bar átnõ hatására Dohányzá spróba: Osztálytár sak/haver ok hatása Dohányz áspróba: Kedvenc filmhõsö m/Tv szereplõ m miatt Dohányzá spróba: Cigarettar eklám hatására Dohányz áspróba: Cigarettá t áruló fiatalok miatt Jólszituált Vidéki leszakadók Városi lázadó dohányos Városi leszakadó Értelmiségi hátterû Pörgõs iskolarém dohányosok Vidéki lázadó dohányosok Total A többszörös feleletválasztós kereszttabulációk kezelése 4 Harmadik körben varianciákat (Variance)- t számolunk az Anlyze| Reports| Case summaries-ben Az Output window| Case summaries-re állunk Az eredményt átmásoljuk a Tobb- szorosFeleletValaszt munkalap Cellákba eső varianciák táblázatba

A többszörös feleletválasztós kereszttabulációk kezelése 5 Ezekután, leolvashatjuk az asszociáció erősségét jelző Cramer V-tesztet (gyenge) A menüben reziduumokat kérünk A reziduális térképet az egyszerű kereszttabulációnál tárgyaltakhoz hasonlóan kimásolhatjuk egy Word jelentésbe A reziduumokból látható, hogy a Városi lázadó dohányosok inkább az osztálytársak hatására, még a Vidéki lázadó dohányosok inkább barát/ barátnő hatására szoknak rá a dohányzásra

Többszörös feleletválasztós kereszttabulációk kezelése 5 Az ANOVA-k eredményei a következőképpen állnak elő: Sor/oszlop csoportok egyutas ANOVA-inak szignifikancia szintjei A két csoportosító változó közti kétutas ANOVA teljes hatás szignifikancia szintje A sor- és oszlopfaktorok elkülönített hatásainak szignifikancia szintjei A sor- és oszlopfaktorok közti kereszthatás

A gyakorlat tartalma 11. Házi Feladat ellenőrzése: Fókuszcsoport Számítógépes alkalmazás egyutas variancia analízishez Számítógépes alkalmazás egyutas variancia analízishez Excelben Számítógépes alkalmazás egyutas variancia analízishez SPSS- ben Több csoportosító változó hatásának elemzése: többutas variancia analízis Teljes hatás tesztelése Független változók interakciójának tesztelése Egy független változó hatása Számítógépes alkalmazás többutas variancia-analízishez Excelben Mintapélda A KetutasANOVA.xls elemző szoftver használata –Egyszeres feleletválasztós kérdések vizsgálata –Többszörös feleletválasztós kérdések vizsgálata 12. Házi Feladat: Egy- és Kétutas ANOVA

12-1. Házi Feladat (2.5 pont) Az Autószobrászat Bt. adatbázisában (AdatbazisMinta.sav) 135 válaszadót 5 piaci szegmensbe osztottak. A szegmenstagságot a Segment változó tárolja.AdatbazisMinta.sav Elemezze az EgyUtasANOVA.xls egyutas ANOVA elemző rendszer segítségével, mely háttérváltozók szerint különböznek egymástól szignifikánsan a szegmensek:EgyUtasANOVA.xls –Att..... – autóvásárlási attitüd változók –Imp..... – autó termékjellemző fontosság változók –Dem..... – demográfiai változók Megoldás: 12-1Megoldas.xls12-1Megoldas.xls

12-2. Házi Feladat (2.5 pont) Az Autószobrászat Bt. adatbázisában ( AdatbazisMinta.sav ) elemezze a KetUtasANOVA.xls Kétutas ANOVA elemző rendszer segítségével, hogy a DemTown – településtipus és a DemIncome – jövedelem katgóriák kombinációinak van-e szignifikáns hatása az autóköltési költségvetésre (CarBudget) AdatbazisMinta.sav KetUtasANOVA.xls Megoldás: 12-2Megoldas.xls12-2Megoldas.xls