Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaKristóf Nemes Megváltozta több, mint 10 éve
1
8. Gyakorisági táblázatok elemzése (statisztikai elemzések arányokkal, illetve diszkrét változókkal)
2
Tartalom Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat 2-próbával) Arányok összehasonlítása összetartozó és független minták segítségével Diszkrét változók kapcsolatvizsgálata
3
Diszkrét változók eloszlásában
Hol találkozunk arányokkal? Diszkrét változók eloszlásában
4
Példa diszkrét eloszlásra
Érték: 1 2 3 Arány: 0,20 0,35 0,40 0,05
5
Néhány példa diszkrét változóra
Személy neme (x1 = férfi, x2 = nő) Iskolázottsági szint (x1 = Alsófok, x2 = Középfok, x3 = Felsőfok) 5-fokú skálaváltozók Diagnózis (x1 = Neurózis, x2 = Szkizofrénia, ...) Kor (x1 = év, x2 = év, x3 = év)
6
Kiemelt fontosságú diszkrét változók
Változó típusa Kvantitatív Kvalitatív Arány Intervallum Ordinális Nominális
7
Statisztikai problématípusok arányok esetén
8
1. Eloszlásvizsgálatok Csoki nyuszitojást milyen színű papírban viszik (veszik) a leginkább? (piros, zöld ...) Fiúból, vagy lányból születik-e több? Szmogriadó esetén, ha csak a páratlan rendszámú autók közlekedhetnek: Kisebb-e a páros rendszámúak aránya? Kisebb-e 1/3-nál a páros rendszámúak aránya?
9
2a. Homogenitásvizsgálatok (Arányok összehasonlítása független minták segítségével)
Igaz-e, hogy a nők között több neurotikus van, mint a férfiak között? Ugyanolyan-e Bp.-en a Koronás, a Kádár- és a Kossuth-címer kedveltsége, mint vidéken?
10
2b. Homogenitásvizsgálatok (Arányok összehasonlítása összetartozó minták segítségével)
Változik-e a dohányosok aránya egy előadássorozat hatására különböző időpontokban? Változik-e a pártok kedveltségi aránya két vagy több időpont között?
11
3. Két diszkrét változó kapcsolatának vizsgálata (Kapcsolatvizsgálatok)
Függ-e a pártpreferencia az iskolázottságtól? Milyen szoros kapcsolatban van a fenti két változó egymással?
12
Problématípusok rendszere
13
1. Eloszlásvizsgálatok Példa: A Koronás, a Kádár és a Kossuth címer kedveltsége egy 939 fős mintában. Koronás címer Kádár-címer Kossuth-címer Összes személy 708 109 122 939
14
Százalékos megoszlási arányok
15
Lehetséges nullhipotézisek
a) H0: Koronás: 60%, Kádár: 20%, Kossuth: 20% b) H0: Koronás: 40%, Kádár: 20%, Kossuth: 40% c) H0: Koronás = Kádár = Kossuth = 33,3%
16
A khi-négyzet-próba alapötlete
A mintabeli kapott és a nullhipotézis igaz volta esetén várt gyakoriságok összehasonlítása és a köztük lévő különbségekből egy c2 próbastatisztika kiszámítása. Szabadságfok: f = g - 1
17
khi-négyzet-próbával
Eloszlásvizsgálat khi-négyzet-próbával Minél nagyobb az eltérés a kapott és a várt gyakoriságok között, annál valószínűbb, hogy H0 nem igaz. Az eltérés egyik mértéke a c2 próbastatisztika. Ha igaz H0, ez a mennyiség közelítőleg c2-eloszlású. Ha c2 elég nagy, akkor H0-t elutasítjuk.
18
A c2-próba végrehajtása
Kapott gyak. 708 109 122 S=939 Várt gyak. 313 313 313 S=939 c2 = ( )2/ = 892,09 > c20,01 = 9,21 (f = 2; p < 0,01 szignifikáns) Mivel a c2-érték elég nagy, a nullhipotézist elutasítjuk. ‘A 3 címert kedvelők aránya szignifikánsan különbözik.’
19
Másik példa: Választás 2010
Adatok: 1000 személy pártpreferencia értékei: melyik pártra szavazna? Értékek: FIDESZ, MDF, MSZP, SZDSZ, JOBBIK, Egyéb (más párt vagy nem válaszol) Kapott gyakoriságok: n1 = 515, n2 = 13, n3 = 145, n4 = 12, n5 = 115
20
Megválaszolandó kérdések
Bekerül-e a parlamentbe az SZDSZ? Nullhipotézis: P(SZDSZ) = 0,05 Adatok: n1 = 12, n2 = 790, várt gyak. = ? Győz-e az MSZP-vel szemben a FIDESZ? Nullhipotézis: P(FIDESZ) = P(MSZP) Adatok: n1 = 515, n2 = 145, várt gyak. = ?
21
2a. Két populáció összehasonlítása diszkrét változó segítségével
Kérdés: Budapestiek és vidékiek között van-e különbség a címerpreferencia tekintetében? Nullhipotézis: A két populációban a címerválasztási arányok ugyananazok
22
Kétszempontos gyakorisági táblázat
Koronás Kádár Kossuth Össz. Bpest 116 15 32 n1 =163 Vidék 592 94 90 n2 =776 Össz.: N =939
23
Arányok összehasonlítása (sorösszegek szerinti százalékok)
Koronás Kádár Kossuth Össz. Bpest 71,2% 9,2% 19,6% 100% Vidék 76,3% 12,1% 11,6% 100%
24
Általános khi-négyzet-próba
H0 igaz volta esetén a próbastatisztika c2-eloszlást követ. Szabadságfok: f = (sorok száma - 1)×(oszlopok száma - 1). c2 < c20,05: H0-t 5%-os szinten nem utasítjuk el. c2 ³ c20,05 : H0-t 5%-os szinten elutasítjuk.
25
A címeres példa eredménye
Sorok száma: g = 2 Oszlopok száma: h = 3 Szabadságfok: f = (2-1)×(3-1) = 1×2 = 2 Kritikus értékek: - c20,05 = 5, c20,01 = 9,210 Kiszámított khi-négyzet-érték: c2 = 8,144 Döntés: H0-t 5%-os szinten elutasítjuk.
26
A c2-próba alkalmazási feltétele
A várt gyakoriságok ne legyenek kb. 5-nél kisebbek. Engedmény: elég, ha 80%-ra teljesül. Például egy 22-es táblázatban 4 cella van, ezért ezekre mind teljesülnie kell.
27
Mit tehetünk, ha az alkalmazási feltétel nem teljesül?
Kis gyakoriságú sorok vagy oszlopok összevonása. Nagyobb minta választása. 22-es táblázat esetén a 22-es c2-próba helyett a Fisher-egzakt-próba.
28
Példa oszlopok összevonására
h6 változó értékei Isk. szint 1 2 3 4 Össz. Alsófok 16 10 24 55 Középfok 13 20 45 Felsőfok 17 5 42 8 43 28 60 142
29
Férfiak és nők feminitása (CPI)
százalék
30
Példa a Fisher-egzakt-próbára
Fem ≤ 11 Fem > 11 Férfi (n = 12) 6 6 Nő (n = 70) 7 63 2 = 12,286 (f = 1, p < 0,01), vártmin = 1,9 Fisher-egzakt-próba: p = 0,0027
31
2b. Összetartozó mintás homogenitásvizsgálatok
Két dichotóm változó összehasonlítása (McNemar-próba, Előjelpróba) Ketőnél több dichotóm változó összehasonlítása (Cochran-féle Q-próba) Két tetszőleges diszkrét változó összehasonlítása (Általános McNemar-próba, Bowker-féle szimmetria-próba)
32
Két helyzet vagy időpont összehasonlítása egy dichotóm változó segítségével
Példa: Középiskolai osztályban előadást tartanak a dohányzás ártalmáról. 36 tanuló közül 8 leszokik, 3 rászokik a dohányzásra. Hatásos-e az előadás? Nullhipotézis: A dohányzás változójának eloszlása az előadás előtt és után ugyanaz. Különbségváltozó: x1= leszokik, x2 = rászokik Nullhipotézis: H0: P(leszokás) = P(rászokás)
33
Képlet és számolás: McNemar-próba
Adattáblázat: Dohányzik? Utána igen Utána nem Előtte igen a b = 8 Előtte nem c = 3 d Képlet és számolás: McNemar-próba c 2 10 8 3 25 11 27 = - + < ( ) , b Alkalmazási feltétel: (b+c)/2 ³ 5 Hogyan lehetne itt az előjelpróbát alkalmazni?
34
1. általánosítás: X dichotóm, h számú összetartozó minta összehasonlítása
Nullhipotézis: A h számú dichotóm változó eloszlása ugyanaz
35
Szakmai példa: h számú tesztkérdés nehézségének az összehasonlítása
Személy item1 item2 item3 item4 1. 1 2. 3. 4. ... Megoldási arány 0,28 0,56 0,48 0,22
36
Másik szakmai példa: elvonó kúra után állapotrögzítés több időpontban
Személy 1. hónap 3. hónap 6. hónap 9. hónap 1. 1 2. 3. 4. ... Visszaesők aránya 0,18 0,26 0,32 0,30
37
Cochran-féle Q-próba Nullhipotézis: A h számú dichotóm változó eloszlása ugyanaz az 1 (és úgyszintén a 0) érték elméleti arányai megegyeznek Alkalmazási feltétel: nh 24 n: személyek száma; h: változók száma Próbastatisztika: Q, mely H0 igaz volta esetén közelítőleg 2-eloszlást követ
38
2. általánosítás: X tetszőleges, de csak két összetartozó mintát hasonlítunk össze (változik-e X eloszlása az egyik helyzetről/időpontról a másikra?) Sima McNemar-próba általánosítása: Általános McNemar-próba (vagy Bowker-féle szimmetria-próba)
39
2 diszkrét változó kapcsolatának vizsgálata
15 éves lányok Könnyen teremt baráti kapcsolatokat Dohányzik Igen Nem Összesen Igen 105 17 122 Nem 469 340 809 Összesen 574 357 931 Kapcsolatvizsgálat homogenitásvizsgálat
40
Sorösszegek szerinti százalékok táblázata
15 éves lányok Könnyen teremt baráti kapcsolatokat Dohányzik Igen Nem Összesen Igen 86,1 13,9 100 Nem 58,0 42,0 100 Összesen 61,7 38,3 100
41
A pártpreferencia függése az életkortól és a nemtől
A pártpreferencia nem függ a kortól, ha a pártpreferencia eloszlása különböző életkori szinteken ugyanaz. A pártpreferencia nem függ a nemtől, ha a pártpreferencia eloszlása férfiaknál és nőknél ugyanaz.
42
Iskolázottság és szimpátia
Függ-e ennek a személynek a kedveltsége az iskolai végzettségtől?
43
Eloszlás a 3 iskolázottsági szinten
44
X és Y függetlensége X független Y-tól, ha Y eloszlása ugyanaz X minden értéke mellett Y független X-től, ha X eloszlása ugyanaz Y minden értéke mellett A függetlenség kölcsönös
45
A kapcsolat szorosságának mérése diszkrét változók esetén
Cramér-féle V kontingencia-együttható: Ha X és Y független, V = 0. 0 ≤ V ≤ 1.
46
A kapcsolat szorosságának mérése dichotóm változók esetén
Dichotóm (kétértékű) változók esetén V φ kontingencia együttható, |φ| = V -1 ≤ φ ≤ 1 φ = Pearson-féle r korrelációs együttható a sor- és az oszlopváltozó között
47
A kapcsolat szorosságának mérése dichotóm változók esetén
Kontingencia-együttható (φ) Pearson korreláció a numerikusan kódolt dichotóm változók között Yule-féle asszociációs együttható (, Y) Kendall-féle gamma dichotóm változókkal Alfa esélyhányados
48
Az alfa esélyhányados Alfa = (b/a) : (d/c)
X= „-” X=„+” Y = férfi a b Y = nő c d Alfa = (b/a) : (d/c) Ha alfa = 1, nincs különbség a 2 csoport között Ha alfa nagyon kicsi vagy nagyon nagy, komoly különbség van a 2 csoport között
49
A φ együttható jelentése
Kódoljuk X értékeit az 1 és a 2 számmal (pl. 1 = férfi, 2 = nő). Kódoljuk Y értékeit ugyancsak az 1 és a 2 számmal (pl. 1 = igen, 2 = nem). φ a Pearson-féle korrelációs együttható X és Y között
50
A együttható jelentése
Kódoljuk X értékeit az 1 és a 2 számmal (pl. 1 = férfi, 2 = nő). Kódoljuk Y értékeit ugyancsak az 1 és a 2 számmal (pl. 1 = igen, 2 = nem). a pozitív és a negatív együttjárás %-os arányának különbsége (Kendall-féle Γ)
51
A kapcsolat szorosságának mérése ordinális változók esetén
Ordinális skálájú változók esetén: Kendall-féle G monotonitási (asszociációs) együttható. Jelentés: pozitív kapcsolat relatív fölénye a negatívval szemben: (Poz-Neg)/(Poz+Neg) Egyirányú függés mérése: Somers-féle monotonitási mérőszámok
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.