3. Két független minta összehasonlítása
Tartalom Csoportosító változók Két független minta átlagának az összehasonlítása Két független minta összehasonlítása ordinális függő változó segítségével
Független minták
Hogyan juthatunk független mintákhoz? 1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket. 2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint vagy a nem szerint.
Csoportdefiniálás a ROPstatban Kódok segítségével, pl. 1 = férfi, 2 = nő 1 = alapfok, 2 = középfok, 3 = felsőfok Övezetek segítségével, pl. 18-35: fiatal 36-55: középkorú 56-70: idős 71-150: szépkorú GYAK
Férfiak és nők feminitása (n = 82)
Az apa érettségije és gyerekének matematika jegye (n = 3507)
Két független minta átlagának összehasonlítása Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két populációban? Nullhipotézis: H0: μ1 = μ2 Próbastatisztika: t = (y – x)/SEdif
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
Két példa CPI-Fem skála, Férfiak vs. Nők (N = 82): X-átlag = 12,1, Y-átlag = 14,0 t(80) = -2,95, p = 0,0041 (p < 0,01) Matek-jegy 8. végén, Érettségizett vs. nem érettségizett apák gyermekei (N = 3507): X-átlag = 4,06, Y-átlag = 3,82 t(3505) = 6,38, p = 0,000 (p < 0,001) GYAK
A kétmintás t-próba alkalmazási feltételei Különbségváltozó normalitása Elméleti szórások egyenlősége: σ1 = σ2 Szóráshomogenitás tesztelése: Levene-próba, O’Brien-próba Kétmintás t-próba robusztus alternatívája: Welch-féle d-próba
Példa CPI-Fem skála, Férfiak vs. Nők (N = 82): X-átlag: 12,1 (s=2,7), Y-átlag = 14,0 (s=2,0) Szóráshomogenitás tesztelése: Levene-próba: F(1; 14,6) = 3,409 (p = 0,0852)+ Átlagok összehasonlítása: Kétmintás t: t(80) = -2,95 (p = 0,0041)** Welch-féle d: d(13,1) = -2,37 (p = 0,0337)* GYAK
Kezelési hatás két független minta esetén Elméleti változás (különbség): m1 - m2 Cohen-féle delta (átlagok standardizált különbsége): D = (m1 - m2)/s Mintabeli becslés: d = (x1 - x2)/se Értelmezés: 0,2: gyenge, 0,5: közepes, 0,8: erős különbség GYAK
Két független minta összehasonlítása ordinális függő változóval
Hagyományos elemzési módszer Kvantitatív függő változó Nagyságszint mérése az átlaggal Két független minta átlagának összehasonlítása kétmintás t-próbával. Kétmintás t-próba alkalmazási feltételei: Normalitás Szóráshomogenitás
Ordinális megközelítés Ötlet: dominancia-arányok meghatározása Pl. fiúk és lányok összehasonlítása az IQ segítségével Fiú dom%: milyen gyakran fordul elő, hogy egy fiú nagyobb IQ-értékű, mint egy lány? Lány dom%: milyen gyakran fordul elő, hogy egy lány nagyobb IQ-értékű, mint egy fiú?
Sztochasztikus egyenlőség Fiú dominancia % = Lány dominancia % Más szavakkal: A fiúk adata ugyanolyan gyakran nagyobb a lányok adatánál, mint kisebb
Két populáció sztochasztikus összehasonlítása Fő kérdés: Ha két populációból vagy eloszlásból véletlenszerűen kiválasztunk 1-1 értéket, milyen gyakran fordul elő, hogy az egyik (X) nagyobb lesz, mint a másik (Y)? A sztochasztikus dominancia legegyszerűbb mértéke: p+ = P(X > Y)
Átlagok és p+ értékek a CPI-Feminitás Skála esetében (n = 82) 14,0 66% 12,1 24% Férfiak Nők Férfiak Nők
A Szondi teszt m1 képe
Átlagok és p+ értékek a Szondi m1 képváltozó esetében (N = 277) 2,95 50% 2,39 21% Férfiak Nők Férfiak Nők
A sztochasztikus egyenlőség (SZTE) matematikai jelölése X: vizsgált változó a P1 populációban Y: vizsgált változó a P2 populációban P1 sztochasztikusan egyenlő P2-vel, ha P(X > Y) = P(X < Y) P(X > Y): P1-beli fölény esélye (p+) P(X < Y): P2-beli fölény esélye (p-)
X-minta Y-minta 0 1 1 2 8 3 X > Y: (8; 1), (8; 2), (8; 3) 0 1 1 2 8 3 X > Y: (8; 1), (8; 2), (8; 3) X < Y: (0; 1), (0; 2), (0; 3), (1;2), (1; 3) n+ = 3 (X dominancia); arány: 3/9 = 33% n- = 5 (Y dominancia); arány: 5/9 = 56%
H0: Sztochasztikus egyenlőség Hagyományos próba: Mann-Whitney-próba (MW-próba) Alkalmazási feltétel: szóráshomogenitás Robusztus változatok: Brunner-Munzel-próba (BM-próba) FPW-próba
A MW-próba végrehajtása xi rang yj rang 0 1 1 2,5 1 2,5 2 4 8 6 3 5 R1 = 9,5 R2 = 11,5 (ta - tf): megtartási tartomány
Döntés a MW-próbában Kis minták: táblázat Nagy minták: normális közelítés (z)
A valószínűségi fölény A mutatója p+ pe p- A = p+ + pe/2 Fem/ffi 24% 10% 66% 0,24 + 0,05 = 0,29 Fem/nő 0,66 + 0,05 = 0,71 m1/ffi 21% 29% 50% 0,21 + 0,145 = 0,345 m1/nő 0,50 + 0,145 = 0,655
Sztochasztikus egyenlőség nullhipotézise H0: A12 = A21 = 0,5