Varianciaanalízis- ANOVA (Analyze Of VAriance)
Alkalmazási területek Több független minta (csoport) esetében a várható értékek (átlagok) összehasonlítása, A csoportosító változók számának függvényében beszélhetünk egy-, két-, vagy többutas varianciaanalízisről. kategorikus->metrikus kapcsolat vizsgálata: vegyes kapcsolat II. Regressziós modellek illeszkedése, illetve a többszörös korrelációs együttható vizsgálata. (később)
Példák Befolyásolja-e a keresetek nagyságát a beosztás vagy a nem? Függ-e egy termék értékesítése a termék elhelyezésétől, csomagolásától? Kimutatható-e valamilyen területi és/vagy ágazati egyenlőtlenség a GDP-ben? Különböző fajtájú, de azonos növények termésátlagában van-e szignifikáns különbség? Egy adott termék átlagára szignifikánsan különbözik-e, az egyes településeken, és/vagy üzletláncoknál.
Egyutas varianciaanalízis Az elsőfajú hiba elkövetésének valószínűsége az összehasonlítások számának függvényében A két mintás t-próbák általánosításának tekinthető Miért nem „egyszerű” kétmintás próbákat alkalmazunk?
Hipotézisek H0: nincs kapcsolat a két változó között. Különbözőségvizsgálat szempontjából Kapcsolatvizsgálat szempontjából H0: ma=mb=...=mk (=m) (a k db csoportátlag megegyezik) ez hogyan tagadható? H1: Mit kellene vizsgálni? Csoportátlagok-főátlag különbőzőségét: variancia-dekompozíció H0: nincs kapcsolat a két változó között. H1: szignifikáns kapcsolat van a két változó között. Mit kellene vizsgálni? Ha nincs kapcsolat a két változó között, akkor a csoportátlagokban nincs eltérés -> Csoportátlagok-főátlag különbőzőségét kell vizsgálni: variancia-dekompozíció
Variancia-dekompozíció Háttér: Függetlenség esetén SSB=SST SSK=0 Determinisztikus kapcsolat esetén SSB=0 SSK=SST
Próbafüggvény Szórásnégyzetek becslése mintaalapján: Külső: SSK/(k-1) Belső: SSB/(n-k) Milyen tulajdonságai vannak a próbafüggvénynek? ET: [0;F1-a(k-1,n-k))
A próbafüggvény alkalmazási feltételei A metrikus változó normális eloszlású minden (k db) csoporton belül, azaz minden egyes csoportban vagy nagy elemszámú mintánk van, vagy 30 alatti elemszámú mintánk van és normális eloszlású a változó a csoporton belül vagy 30-100 közötti elemszámú mintánk van és a csoporton belül az aszimmetria mutató értéke +1 alatti. Varianciahomogenitás. (Ennek ellenőrzése itt is Levene teszttel történik) (Szórásazonosság) Ha ez teljesült: ANOVA Ha nem teljesül Welch-tesztet alkalmazunk Ez egy korrigált F-próba (=módosul a próbafüggvény) [papíron nem, CSAK SPSS-ben]
Vegyes kapcsolat jellemzése Magyarázóerő: Varianciahányados azt mutatja meg, hogy a csoportképző (kategoriális) ismérv a mennyiségi ismérv szórásnégyzetének mekkora részét ( százalékát) magyarázza meg. Kapcsolatmérő mutató H-mutató (h) 9
A varianciaanalízis végrehajtásának lépései Minták alapján Teljeskörű megfigyelés alapján Probléma felismerés Előfeltételek ellenőrzése Teszt végrehajtása az előfeltételek függvényében Amennyiben a kapcsolat szignifikáns: Milyen erős a kapcsolat, illetve mekkora a magyarázó erő? Miért bukott el a nulhipotézis? Post Hoc teszt Probléma felismerés Milyen erős a kapcsolat, illetve mekkora a magyarázó erő? Átlagok összehasonlítása diagrammal Anova_ea_f.doc
Post Hoc teszt Miért bukott el a vizsgálat nullhipotézise? Páronkénti összehasonlítás a várható értékek eltérésére az összehasonlítás számának figyelembe vételével -> korrigált próbafüggvénynek Nullhipotézis: Nincs szignifikáns eltérés Próbafüggvény Ha Varianciahomogenitás teljesül: Tukey-próba Ha Varianciahomogenitás NEM teljesül: T2-próba
ANOVA Excelben Előfeltételt nem ellenőrzi
ANOVA SPSS-ben Analyse/Compare Means/One-way Anova
Opciók Leíró statisztika Varianciahomogenitás ANOVA-táblázat Welch-teszt Means Plots Post Hoc teszt táblázata
Az SPSS egyutas varianciaanalízis elemzésének kimenete az alábbi részekből áll(hat). Leíró statisztika Varianciahomogenitás tesztje ANOVA-táblázat Welch-teszt Means Plots Post Hoc teszt táblázata (Ha a nullhipotézist elvetjük) Mint látható, a modell magyarázó ereje (varianciahányad) kiíratására nem volt lehetőségünk. Ennek megvalósítása Analyze/Means/Means eljárás kiválasztása után van lehetőségünk, ha az Option gombra kattintás után kiválasztjuk az Eta and Eta Square opciót (Ha a nullhipotézist elvetjük) Anova_ea_f.doc