3. Két független minta összehasonlítása

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

2. A következtetési statisztika alapfogalmai
Hipotézis-ellenőrzés (Statisztikai próbák)
4. Két összetartozó minta összehasonlítása
I. előadás.
Kvantitatív Módszerek
Összetett kísérleti tervek és kiértékelésük
Kvantitatív módszerek
Rangszám statisztikák
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Matematikai Statisztika VIK Doktori Iskola
Összefüggés vizsgálatok
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Környezeti statisztika Dr. Huzsvai László egyetemi docens Debrecen2008.
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
Dr. Gombos Tímea SE, III.sz. Belgyógyászati Klinika
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Nem-paraméteres eljárások, több csoport összehasonlítása
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Kvantitatív módszerek
Budapesti Műszaki és Gazdaságtudományi Egyetem
Matematikai alapok és valószínűségszámítás
Matematikai alapok és valószínűségszámítás
Nemparaméteres próbák Statisztika II., 5. alkalom.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Egytényezős variancia-analízis
A normális eloszlás mint modell
Kvantitatív Módszerek
6. Változók és csoportok összehasonlítása varianciaanalízissel
7. Csoportok és változók sztochasztikus összehasonlítása (összehasonlítások ordinális függő változók esetén)
Tartalom Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat 2-próbával) Arányok összehasonlítása összetartozó és független minták segítségével.
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika Hipotézisvizsgálatok Nemparaméteres próbák II. 17. előadás.
Gazdaságstatisztika 18. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Statisztikai módszerek áttekintése módszerválasztási tanácsok Makara Gábor.
Hipotézis-ellenőrzés (Folytatás)
Várhatóértékre vonatkozó próbák
Hipotézis vizsgálat.
Új kérdések a korrelációs együtthatóval kapcsolatban
t A kétoldalú statisztikai próba alapfogalmai

Diszkrét változók vizsgálata
Két kvantitatív változó kapcsolatának vizsgálata
Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek.
Paleobiológiai módszerek és modellek 4. hét
I. előadás.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
A szóráselemzés gondolatmenete
Vargha András KRE és ELTE, Pszichológiai Intézet
A számítógépes elemzés alapjai
Paraméteres próbák- gyakorlat
Hipotézisvizsgálatok Paraméteres próbák
Kiváltott agyi jelek informatikai feldolgozása 2016
Gazdaságstatisztika konzultáció
Kvantitatív módszerek
Nemparaméteres próbák
I. Előadás bgk. uni-obuda
III. zárthelyi dolgozat konzultáció
Hipotézisvizsgálatok Paraméteres próbák
Sztochasztikus kapcsolatok I. Asszociáció
Bevezetés a kvantitatív kutatásba
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
1.3. Hipotézisvizsgálat, statisztikai próbák
Előadás másolata:

3. Két független minta összehasonlítása

Tartalom Csoportosító változók Két független minta átlagának az összehasonlítása Két független minta összehasonlítása ordinális függő változó segítségével

Független minták

Hogyan juthatunk független mintákhoz? 1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket. 2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint vagy a nem szerint.

Csoportdefiniálás a ROPstatban Kódok segítségével, pl. 1 = férfi, 2 = nő 1 = alapfok, 2 = középfok, 3 = felsőfok Övezetek segítségével, pl. 18-35: fiatal 36-55: középkorú 56-70: idős 71-150: szépkorú GYAK

Férfiak és nők feminitása (n = 82)

Az apa érettségije és gyerekének matematika jegye (n = 3507)

Két független minta átlagának összehasonlítása Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két populációban? Nullhipotézis: H0: μ1 = μ2 Próbastatisztika: t = (y – x)/SEdif

Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t  p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.

Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t  p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.

Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t  p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.

Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t  p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.

Kétmintás t-próba Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t  p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.

Két példa CPI-Fem skála, Férfiak vs. Nők (N = 82): X-átlag = 12,1, Y-átlag = 14,0 t(80) = -2,95, p = 0,0041 (p < 0,01) Matek-jegy 8. végén, Érettségizett vs. nem érettségizett apák gyermekei (N = 3507): X-átlag = 4,06, Y-átlag = 3,82 t(3505) = 6,38, p = 0,000 (p < 0,001) GYAK

A kétmintás t-próba alkalmazási feltételei Különbségváltozó normalitása Elméleti szórások egyenlősége: σ1 = σ2 Szóráshomogenitás tesztelése: Levene-próba, O’Brien-próba Kétmintás t-próba robusztus alternatívája: Welch-féle d-próba

Példa CPI-Fem skála, Férfiak vs. Nők (N = 82): X-átlag: 12,1 (s=2,7), Y-átlag = 14,0 (s=2,0) Szóráshomogenitás tesztelése: Levene-próba: F(1; 14,6) = 3,409 (p = 0,0852)+ Átlagok összehasonlítása: Kétmintás t: t(80) = -2,95 (p = 0,0041)** Welch-féle d: d(13,1) = -2,37 (p = 0,0337)* GYAK

Kezelési hatás két független minta esetén Elméleti változás (különbség): m1 - m2 Cohen-féle delta (átlagok standardizált különbsége): D = (m1 - m2)/s Mintabeli becslés: d = (x1 - x2)/se Értelmezés: 0,2: gyenge, 0,5: közepes, 0,8: erős különbség GYAK

Két független minta összehasonlítása ordinális függő változóval

Hagyományos elemzési módszer Kvantitatív függő változó Nagyságszint mérése az átlaggal Két független minta átlagának összehasonlítása kétmintás t-próbával. Kétmintás t-próba alkalmazási feltételei: Normalitás Szóráshomogenitás

Ordinális megközelítés Ötlet: dominancia-arányok meghatározása Pl. fiúk és lányok összehasonlítása az IQ segítségével Fiú dom%: milyen gyakran fordul elő, hogy egy fiú nagyobb IQ-értékű, mint egy lány? Lány dom%: milyen gyakran fordul elő, hogy egy lány nagyobb IQ-értékű, mint egy fiú?

Sztochasztikus egyenlőség Fiú dominancia % = Lány dominancia % Más szavakkal: A fiúk adata ugyanolyan gyakran nagyobb a lányok adatánál, mint kisebb

Két populáció sztochasztikus összehasonlítása Fő kérdés: Ha két populációból vagy eloszlásból véletlenszerűen kiválasztunk 1-1 értéket, milyen gyakran fordul elő, hogy az egyik (X) nagyobb lesz, mint a másik (Y)? A sztochasztikus dominancia legegyszerűbb mértéke: p+ = P(X > Y)

Átlagok és p+ értékek a CPI-Feminitás Skála esetében (n = 82) 14,0 66% 12,1 24% Férfiak Nők Férfiak Nők

A Szondi teszt m1 képe

Átlagok és p+ értékek a Szondi m1 képváltozó esetében (N = 277) 2,95 50% 2,39 21% Férfiak Nők Férfiak Nők

A sztochasztikus egyenlőség (SZTE) matematikai jelölése X: vizsgált változó a P1 populációban Y: vizsgált változó a P2 populációban P1 sztochasztikusan egyenlő P2-vel, ha P(X > Y) = P(X < Y) P(X > Y): P1-beli fölény esélye (p+) P(X < Y): P2-beli fölény esélye (p-)

X-minta Y-minta 0 1 1 2 8 3 X > Y: (8; 1), (8; 2), (8; 3) 0 1 1 2 8 3 X > Y: (8; 1), (8; 2), (8; 3) X < Y: (0; 1), (0; 2), (0; 3), (1;2), (1; 3) n+ = 3 (X dominancia); arány: 3/9 = 33% n- = 5 (Y dominancia); arány: 5/9 = 56%

H0: Sztochasztikus egyenlőség Hagyományos próba: Mann-Whitney-próba (MW-próba) Alkalmazási feltétel: szóráshomogenitás Robusztus változatok: Brunner-Munzel-próba (BM-próba) FPW-próba

A MW-próba végrehajtása xi rang yj rang 0 1 1 2,5 1 2,5 2 4 8 6 3 5 R1 = 9,5 R2 = 11,5 (ta - tf): megtartási tartomány

Döntés a MW-próbában Kis minták: táblázat Nagy minták: normális közelítés (z)

A valószínűségi fölény A mutatója p+ pe p- A = p+ + pe/2 Fem/ffi 24% 10% 66% 0,24 + 0,05 = 0,29 Fem/nő 0,66 + 0,05 = 0,71 m1/ffi 21% 29% 50% 0,21 + 0,145 = 0,345 m1/nő 0,50 + 0,145 = 0,655

Sztochasztikus egyenlőség nullhipotézise H0: A12 = A21 = 0,5