Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Tartalom Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat 2-próbával) Arányok összehasonlítása összetartozó és független minták segítségével.

Hasonló előadás


Az előadások a következő témára: "Tartalom Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat 2-próbával) Arányok összehasonlítása összetartozó és független minták segítségével."— Előadás másolata:

1 8. Gyakorisági táblázatok elemzése (statisztikai elemzések arányokkal, illetve diszkrét változókkal)

2 Tartalom Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat 2-próbával) Arányok összehasonlítása összetartozó és független minták segítségével Diszkrét változók kapcsolatvizsgálata

3 Diszkrét változók eloszlásában
Hol találkozunk arányokkal? Diszkrét változók eloszlásában

4 Példa diszkrét eloszlásra
Érték: 1 2 3 Arány: 0,20 0,35 0,40 0,05

5 Néhány példa diszkrét változóra
Személy neme (x1 = férfi, x2 = nő) Iskolázottsági szint (x1 = Alsófok, x2 = Középfok, x3 = Felsőfok) 5-fokú skálaváltozók Diagnózis (x1 = Neurózis, x2 = Szkizofrénia, ...) Kor (x1 = év, x2 = év, x3 = év)

6 Kiemelt fontosságú diszkrét változók
Változó típusa Kvantitatív Kvalitatív Arány Intervallum Ordinális Nominális

7 Statisztikai problématípusok arányok esetén

8 1. Eloszlásvizsgálatok Csoki nyuszitojást milyen színű papírban viszik (veszik) a leginkább? (piros, zöld ...) Fiúból, vagy lányból születik-e több? Szmogriadó esetén, ha csak a páratlan rendszámú autók közlekedhetnek: Kisebb-e a páros rendszámúak aránya? Kisebb-e 1/3-nál a páros rendszámúak aránya?

9 2a. Homogenitásvizsgálatok (Arányok összehasonlítása független minták segítségével)
Igaz-e, hogy a nők között több neurotikus van, mint a férfiak között? Ugyanolyan-e Bp.-en a Koronás, a Kádár- és a Kossuth-címer kedveltsége, mint vidéken?

10 2b. Homogenitásvizsgálatok (Arányok összehasonlítása összetartozó minták segítségével)
Változik-e a dohányosok aránya egy előadássorozat hatására különböző időpontokban? Változik-e a pártok kedveltségi aránya két vagy több időpont között?

11 3. Két diszkrét változó kapcsolatának vizsgálata (Kapcsolatvizsgálatok)
Függ-e a pártpreferencia az iskolázottságtól? Milyen szoros kapcsolatban van a fenti két változó egymással?

12 Problématípusok rendszere

13 1. Eloszlásvizsgálatok Példa: A Koronás, a Kádár és a Kossuth címer kedveltsége egy 939 fős mintában. Koronás címer Kádár-címer Kossuth-címer Összes személy 708 109 122 939

14 Százalékos megoszlási arányok

15 Lehetséges nullhipotézisek
a) H0: Koronás: 60%, Kádár: 20%, Kossuth: 20% b) H0: Koronás: 40%, Kádár: 20%, Kossuth: 40% c) H0: Koronás = Kádár = Kossuth = 33,3%

16 A khi-négyzet-próba alapötlete
A mintabeli kapott és a nullhipotézis igaz volta esetén várt gyakoriságok összehasonlítása és a köztük lévő különbségekből egy c2 próbastatisztika kiszámítása. Szabadságfok: f = g - 1

17 khi-négyzet-próbával
Eloszlásvizsgálat khi-négyzet-próbával Minél nagyobb az eltérés a kapott és a várt gyakoriságok között, annál valószínűbb, hogy H0 nem igaz. Az eltérés egyik mértéke a c2 próbastatisztika. Ha igaz H0, ez a mennyiség közelítőleg c2-eloszlású. Ha c2 elég nagy, akkor H0-t elutasítjuk.

18 A c2-próba végrehajtása
Kapott gyak. 708 109 122 S=939 Várt gyak. 313 313 313 S=939 c2 = ( )2/ = 892,09 > c20,01 = 9,21 (f = 2; p < 0,01 szignifikáns) Mivel a c2-érték elég nagy, a nullhipotézist elutasítjuk. ‘A 3 címert kedvelők aránya szignifikánsan különbözik.’

19 Másik példa: Választás 2010
Adatok: 1000 személy pártpreferencia értékei: melyik pártra szavazna? Értékek: FIDESZ, MDF, MSZP, SZDSZ, JOBBIK, Egyéb (más párt vagy nem válaszol) Kapott gyakoriságok: n1 = 515, n2 = 13, n3 = 145, n4 = 12, n5 = 115

20 Megválaszolandó kérdések
Bekerül-e a parlamentbe az SZDSZ? Nullhipotézis: P(SZDSZ) = 0,05 Adatok: n1 = 12, n2 = 790, várt gyak. = ? Győz-e az MSZP-vel szemben a FIDESZ? Nullhipotézis: P(FIDESZ) = P(MSZP) Adatok: n1 = 515, n2 = 145, várt gyak. = ?

21 2a. Két populáció összehasonlítása diszkrét változó segítségével
Kérdés: Budapestiek és vidékiek között van-e különbség a címerpreferencia tekintetében? Nullhipotézis: A két populációban a címerválasztási arányok ugyananazok

22 Kétszempontos gyakorisági táblázat
Koronás Kádár Kossuth Össz. Bpest 116 15 32 n1 =163 Vidék 592 94 90 n2 =776 Össz.: N =939

23 Arányok összehasonlítása (sorösszegek szerinti százalékok)
Koronás Kádár Kossuth Össz. Bpest 71,2% 9,2% 19,6% 100% Vidék 76,3% 12,1% 11,6% 100%

24 Általános khi-négyzet-próba
H0 igaz volta esetén a próbastatisztika c2-eloszlást követ. Szabadságfok: f = (sorok száma - 1)×(oszlopok száma - 1). c2 < c20,05: H0-t 5%-os szinten nem utasítjuk el. c2 ³ c20,05 : H0-t 5%-os szinten elutasítjuk.

25 A címeres példa eredménye
Sorok száma: g = 2 Oszlopok száma: h = 3 Szabadságfok: f = (2-1)×(3-1) = 1×2 = 2 Kritikus értékek: - c20,05 = 5, c20,01 = 9,210 Kiszámított khi-négyzet-érték: c2 = 8,144 Döntés: H0-t 5%-os szinten elutasítjuk.

26 A c2-próba alkalmazási feltétele
A várt gyakoriságok ne legyenek kb. 5-nél kisebbek. Engedmény: elég, ha 80%-ra teljesül. Például egy 22-es táblázatban 4 cella van, ezért ezekre mind teljesülnie kell.

27 Mit tehetünk, ha az alkalmazási feltétel nem teljesül?
Kis gyakoriságú sorok vagy oszlopok összevonása. Nagyobb minta választása. 22-es táblázat esetén a 22-es c2-próba helyett a Fisher-egzakt-próba.

28 Példa oszlopok összevonására
h6 változó értékei Isk. szint 1 2 3 4 Össz. Alsófok 16 10 24 55 Középfok 13 20 45 Felsőfok 17 5 42 8 43 28 60 142

29 Férfiak és nők feminitása (CPI)
százalék

30 Példa a Fisher-egzakt-próbára
Fem ≤ 11 Fem > 11 Férfi (n = 12) 6 6 Nő (n = 70) 7 63 2 = 12,286 (f = 1, p < 0,01), vártmin = 1,9 Fisher-egzakt-próba: p = 0,0027

31 2b. Összetartozó mintás homogenitásvizsgálatok
Két dichotóm változó összehasonlítása (McNemar-próba, Előjelpróba) Ketőnél több dichotóm változó összehasonlítása (Cochran-féle Q-próba) Két tetszőleges diszkrét változó összehasonlítása (Általános McNemar-próba, Bowker-féle szimmetria-próba)

32 Két helyzet vagy időpont összehasonlítása egy dichotóm változó segítségével
Példa: Középiskolai osztályban előadást tartanak a dohányzás ártalmáról. 36 tanuló közül 8 leszokik, 3 rászokik a dohányzásra. Hatásos-e az előadás? Nullhipotézis: A dohányzás változójának eloszlása az előadás előtt és után ugyanaz. Különbségváltozó: x1= leszokik, x2 = rászokik Nullhipotézis: H0: P(leszokás) = P(rászokás)

33 Képlet és számolás: McNemar-próba
Adattáblázat: Dohányzik? Utána igen Utána nem Előtte igen a b = 8 Előtte nem c = 3 d Képlet és számolás: McNemar-próba c 2 10 8 3 25 11 27 = - + < ( ) , b Alkalmazási feltétel: (b+c)/2 ³ 5 Hogyan lehetne itt az előjelpróbát alkalmazni?

34 1. általánosítás: X dichotóm, h számú összetartozó minta összehasonlítása
Nullhipotézis: A h számú dichotóm változó eloszlása ugyanaz

35 Szakmai példa: h számú tesztkérdés nehézségének az összehasonlítása
Személy item1 item2 item3 item4 1. 1 2. 3. 4. ... Megoldási arány 0,28 0,56 0,48 0,22

36 Másik szakmai példa: elvonó kúra után állapotrögzítés több időpontban
Személy 1. hónap 3. hónap 6. hónap 9. hónap 1. 1 2. 3. 4. ... Visszaesők aránya 0,18 0,26 0,32 0,30

37 Cochran-féle Q-próba Nullhipotézis: A h számú dichotóm változó eloszlása ugyanaz  az 1 (és úgyszintén a 0) érték elméleti arányai megegyeznek Alkalmazási feltétel: nh  24 n: személyek száma; h: változók száma Próbastatisztika: Q, mely H0 igaz volta esetén közelítőleg 2-eloszlást követ

38 2. általánosítás: X tetszőleges, de csak két összetartozó mintát hasonlítunk össze (változik-e X eloszlása az egyik helyzetről/időpontról a másikra?) Sima McNemar-próba általánosítása: Általános McNemar-próba (vagy Bowker-féle szimmetria-próba)

39 2 diszkrét változó kapcsolatának vizsgálata
15 éves lányok Könnyen teremt baráti kapcsolatokat Dohányzik Igen Nem Összesen Igen 105 17 122 Nem 469 340 809 Összesen 574 357 931 Kapcsolatvizsgálat  homogenitásvizsgálat

40 Sorösszegek szerinti százalékok táblázata
15 éves lányok Könnyen teremt baráti kapcsolatokat Dohányzik Igen Nem Összesen Igen 86,1 13,9 100 Nem 58,0 42,0 100 Összesen 61,7 38,3 100

41 A pártpreferencia függése az életkortól és a nemtől
A pártpreferencia nem függ a kortól, ha a pártpreferencia eloszlása különböző életkori szinteken ugyanaz. A pártpreferencia nem függ a nemtől, ha a pártpreferencia eloszlása férfiaknál és nőknél ugyanaz.

42 Iskolázottság és szimpátia
Függ-e ennek a személynek a kedveltsége az iskolai végzettségtől?

43 Eloszlás a 3 iskolázottsági szinten

44 X és Y függetlensége X független Y-tól, ha Y eloszlása ugyanaz X minden értéke mellett Y független X-től, ha X eloszlása ugyanaz Y minden értéke mellett A függetlenség kölcsönös

45 A kapcsolat szorosságának mérése diszkrét változók esetén
Cramér-féle V kontingencia-együttható: Ha X és Y független, V = 0. 0 ≤ V ≤ 1.

46 A kapcsolat szorosságának mérése dichotóm változók esetén
Dichotóm (kétértékű) változók esetén V  φ kontingencia együttható, |φ| = V -1 ≤ φ ≤ 1 φ = Pearson-féle r korrelációs együttható a sor- és az oszlopváltozó között

47 A kapcsolat szorosságának mérése dichotóm változók esetén
Kontingencia-együttható (φ) Pearson korreláció a numerikusan kódolt dichotóm változók között Yule-féle asszociációs együttható (, Y) Kendall-féle gamma dichotóm változókkal Alfa esélyhányados

48 Az alfa esélyhányados Alfa = (b/a) : (d/c)
X= „-” X=„+” Y = férfi a b Y = nő c d Alfa = (b/a) : (d/c) Ha alfa = 1, nincs különbség a 2 csoport között Ha alfa nagyon kicsi vagy nagyon nagy, komoly különbség van a 2 csoport között

49 A φ együttható jelentése
Kódoljuk X értékeit az 1 és a 2 számmal (pl. 1 = férfi, 2 = nő). Kódoljuk Y értékeit ugyancsak az 1 és a 2 számmal (pl. 1 = igen, 2 = nem). φ a Pearson-féle korrelációs együttható X és Y között

50 A  együttható jelentése
Kódoljuk X értékeit az 1 és a 2 számmal (pl. 1 = férfi, 2 = nő). Kódoljuk Y értékeit ugyancsak az 1 és a 2 számmal (pl. 1 = igen, 2 = nem).  a pozitív és a negatív együttjárás %-os arányának különbsége (Kendall-féle Γ)

51 A kapcsolat szorosságának mérése ordinális változók esetén
Ordinális skálájú változók esetén: Kendall-féle G monotonitási (asszociációs) együttható. Jelentés: pozitív kapcsolat relatív fölénye a negatívval szemben: (Poz-Neg)/(Poz+Neg) Egyirányú függés mérése: Somers-féle monotonitási mérőszámok


Letölteni ppt "Tartalom Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat 2-próbával) Arányok összehasonlítása összetartozó és független minták segítségével."

Hasonló előadás


Google Hirdetések