Dichotóm változók vizsgálata Dichotóm (kétértékű) változók Személy neme (x1 = férfi, x2 = nő) Egyetért-e ... (x1 = igen, x2 = nem) Előfordul-e ... (x1 = igen, x2 = nem) Megoldotta-e ... (x1 = igen, x2 = nem) Beteg-e (x1 = igen, x2 = nem) Bináris változó: az a speciális eset, amikor x1 = 0 és x2 = 1
Dichotóm változók eloszlása Eloszlás: Az x1 és x2 érték előfordulási valószínűsége, azaz P(x1) és P(x2). Pl. a ‘Személy neme’ egy lehetséges eloszlása: {P(ffi) = 0,45, P(nő) = 0,55}. A ‘Személy neme’ változó szintén lehetséges eloszlása: {P(ffi) = 0,60, P(nő) = 0,40}. Mindig igaz: P(x1) + P(x2) = 1
Egy dichotóm változó vizsgálata egy populációban Példa: pszichológia szakra felvételizők között a fiú-lány arány ugyanakkora-e? Nullhipotézis: H0: P(ffi) = 0,5, P(nő) = 0,5 Egy valódi vizsgálat adatai: 1981-ben 94 felvételiző között 16 fiú és 78 lány volt (kapott gyakoriságok: ni) Ha H0 igaz lenne, 94-ből 47-47 fiúra és lányra számítanánk (várt/elméleti gyakoriságok: i)
Eloszlásvizsgálat khi-négyzet-próbával Minél nagyobb az eltérés a kapott (ni) és a várt (i) gyakoriságok között, annál valószínűbb, hogy a nullhipotézis nem igaz. Az eltérés egy lehetséges mértéke: 2 = (n1 - 1)2/1 + (n2 - 2)2/2 Ha igaz a H0 hipotézis, akkor ez khi-négyzet eloszlású, f=1 szabadságfokkal.
A fenti példa számításai 2 = (16 - )2/ + (78 - )2/ 2 2 (f=1) Emiatt a H0 hipotézist elutasítjuk, s azt mondjuk: A fiúk aránya szignifikánsan kisebb a lányokénál.
Egy másik példa Egy dobókockával 30-szor dobunk szabályosan. Összesen 10 hatost kapunk. Hamis a kocka? 2 = (10 - )2/ + (20 - )2/ 2 2 (f=1) Az eredmény tehát 5%-os szinten szignifikáns, vagyis a kocka 95%-os valószínűséggel hamis.
Khi-négyzet-próba Feltétel: i 5 H0: P(x1) = p1, P(x2) = p2 X-minta 0,6 f=1 0,4 (f = 1) 0,2 2 0,05 2 < 2 2 2 0,05 0,05 H0 HA: P(x1) p1, P(x2) p2
Két populáció összehasonlítása egy dichotóm változó segítségével Példa: Matematika és pszichológia szakra felvételizők között van-e különbség a nemi megoszlás tekintetében? Nullhipotézis: A két populációban a nemi megoszlás ugyanaz, vagyis P(fiú/matek) = P(fiú/pszich) és P(lány/matek) = P(lány/pszich)
Egy konkrét példa H0 igaz volta esetén a közös fiú-arány kb. 130/320, így a várt fiú-gyakoriság a matek és a pszich. szakon: 11= 80130/320 = 32,5 és 21= 240130/320 = 97,5 Hasonlóan a közös lány-arány kb. 190/320, így 12= 80190/320 = 47,5 és 22= 240190/320 = 142,5
A 2×2-es khi-négyzet-próba H0 igaz volta esetén a statisztikai mennyiség f = 1 szabadságfokú khi-négyzet-eloszlást követ, így 2 < 3,841 esetén H0-t megtartjuk, 2 3,841 esetén pedig H0-t 5%-os szignifikanciaszinten elutasítjuk (2 = 3,841). 0,05
Számolás: kontingenciatáblázatból Kapott gyakoriságok Várt gyakoriságok 58 22 32,5 47,5 72 168 97,5 142,5 2 44,92 6,6352 (f=1) Konklúzió: a különbség 1%-os szinten szignifikáns.
Alkalmazási feltétel: ij 5 Általános eset Minták X=x X=x Összesen 1 2 1. Minta n n n 11 12 1 ij= (nimj)/N 2. Minta n n n 21 22 2 Összesen m m N 1 2 (f = 1) Alkalmazási feltétel: ij 5
Két dichotóm változó eloszlásának összehasonlítása egy populációban Példa: Egy középiskolai osztályban előadást tartottak a dohányzás ártalmairól. Ezután 36 tanuló közül 8-an leszoktak, 3 tanuló pedig rászokott a dohányzásra. Volt-e hatása a felvilágosító előadásnak? Nullhipotézis: A dohányzás dichotóm változója eloszlása az előadás előtt és után ugyanaz. Különbségváltozó: x1= leszokik, x2 = rászokik Nullhipotézis: H0: P(x1) = P(x2)
Képlet és számolás: a McNemar-próba: Adattáblázat: Dohányzik? Utána igen Utána nem Előtte igen a b=8 Előtte nem c=3 d Képlet és számolás: a McNemar-próba: Alkalmazási feltétel: (b+c)/2 5, azaz b+c > 10
Egy példa 40 fős évfolyamon 12 kérdésből álló vizsgatesztet írattak. Az 1. feladatot 28-an, a 2. feladatot pedig 20-an oldották meg helyesen. Szignifikánsan nehezebbnek tekinthető-e a 2. feladat? A fenti kérdésre a megadott az adatok alapján nem lehet válaszolni. Hiányzik: n(1. jó, 2. rossz) és n(1. rossz, 2. jó)
Megfelelő adattáblázat: Megoldás 2. helyes 2. helytelen 1. helyes b 1. helytelen c A McNemar-próba képlete:
Két dichotóm változó kapcsolatának vizsgálata 15 éves lányok Könnyen teremt baráti kapcsolatokat Dohányzik Igen Nem Összesen Igen 105 17 122 Nem 469 340 809 Összesen 574 357 931 Függetlenségvizsgálat homogenitásvizsgálat
Sorösszegek szerinti százalékok táblázata 15 éves lányok Könnyen teremt baráti kapcsolatokat Dohányzik Igen Nem Összesen Igen 86,1% 13,9% 100% Nem 58,0% 42,0% 100% Összesen 61,7% 38,3% 100%
Oszlopösszegek szerinti százalékok táblázata 15 éves lányok Könnyen teremt baráti kapcsolatokat Dohányzik Igen Nem Összesen Igen 18,3% 5,0% 13,1% Nem 81,7% 95,0% 86,9% Összesen 100,0% 100,0% 100,0%
A 2-próba számolása 2×2-es kontingenciatáblázatból Formailag ugyanúgy végzendő, mint két csoport összehasonlítása esetén. A fenti példa esetében Mivel 2 > 6,635 (f=1), az eredmény p < 0,01 (azaz 1%-os) szinten szignifikáns.
A kapcsolat szorosságának mérése dichotóm változók esetén Kontingencia-együttható: Yule-féle asszociációs együttható:
Néhány összefüggés a kapcsolati mutatókra -1 1 -1 1 2 = 2/N A fenti gyakorisági táblázathoz kapcsolódóan j = , 195 és y = , 635