Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

 8. Gyakorisági táblázatok elemzése (statisztikai elemzések arányokkal, illetve diszkrét változókkal)

Hasonló előadás


Az előadások a következő témára: " 8. Gyakorisági táblázatok elemzése (statisztikai elemzések arányokkal, illetve diszkrét változókkal)"— Előadás másolata:

1  8. Gyakorisági táblázatok elemzése (statisztikai elemzések arányokkal, illetve diszkrét változókkal)

2   Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat  2 -próbával)  Arányok összehasonlítása összetartozó és független minták segítségével  Diszkrét változók kapcsolatvizsgálata Tartalom

3  Diszkrét változók eloszlásában Hol találkozunk arányokkal?

4  Példa diszkrét eloszlásra 0123 Arány:0,200,350,400,05 Érték:

5  Néhány példa diszkrét változóra l Személy neme (x 1 = férfi, x 2 = nő) l Iskolázottsági szint (x 1 = Alsófok, x 2 = Középfok, x 3 = Felsőfok) l 5-fokú skálaváltozók l Diagnózis (x 1 = Neurózis, x 2 = Szkizofrénia,...) Kor ( x 1 = év, x 2 = év, x 3 = év)

6  Kvantitatív Ordinális Nominális Kvalitatív Változó típusa ArányIntervallum Kiemelt fontosságú diszkrét változók

7  Statisztikai problématípusok arányok esetén

8  –Csoki nyuszitojást milyen színű papírban viszik (veszik) a leginkább? (piros, zöld...) –Fiúból, vagy lányból születik-e több? –Szmogriadó esetén, ha csak a páratlan rendszámú autók közlekedhetnek: u Kisebb-e a páros rendszámúak aránya? u Kisebb-e 1/3-nál a páros rendszámúak aránya? 1. Eloszlásvizsgálatok

9  –Igaz-e, hogy a nők között több neurotikus van, mint a férfiak között? –Ugyanolyan-e Bp.-en a Koronás, a Kádár- és a Kossuth-címer kedveltsége, mint vidéken? 2a. Homogenitásvizsgálatok (Arányok összehasonlítása független minták segítségével)

10  –Változik-e a dohányosok aránya egy előadássorozat hatására különböző időpontokban? –Változik-e a pártok kedveltségi aránya két vagy több időpont között? 2b. Homogenitásvizsgálatok (Arányok összehasonlítása összetartozó minták segítségével)

11  –Függ-e a pártpreferencia az iskolázottságtól? –Milyen szoros kapcsolatban van a fenti két változó egymással? 3. Két diszkrét változó kapcsolatának vizsgálata (Kapcsolatvizsgálatok)

12  Problématípusok rendszere Statisztikai probléma típusa EloszlásvizsgálatHomogenitásvizsgálat Független mintákÖsszetartozó minták Kapcsolatvizsgálat

13  Példa: A Koronás, a Kádár és a Kossuth címer kedveltsége egy 939 fős mintában. 1. Eloszlásvizsgálatok Koronás címer Kádár- címer Kossuth- címer Összes személy

14  Százalékos megoszlási arányok

15  a) H 0 : Koronás: 60%, Kádár: 20%, Kossuth: 20% b) H 0 : Koronás: 40%, Kádár: 20%, Kossuth: 40% c) H 0 : Koronás = Kádár = Kossuth = 33,3% Lehetséges nullhipotézisek

16  A mintabeli kapott és a nullhipotézis igaz volta esetén várt gyakoriságok összehasonlítása és a köztük lévő különbségekből egy  2 próbastatisztika kiszámítása. Szabadságfok: f = g - 1 A khi-négyzet-próba alapötlete

17  l Minél nagyobb az eltérés a kapott és a várt gyakoriságok között, annál valószínűbb, hogy H 0 nem igaz. Az eltérés egyik mértéke a  2 próbastatisztika. Ha igaz H 0, ez a mennyiség közelítőleg  2 -eloszlású. Ha  2 elég nagy, akkor H 0 -t elutasítjuk. Eloszlásvizsgálat khi-négyzet-próbával

18  A  2 -próba végrehajtása  2 = (708-  ) 2 /  +...  2 0,01  (f = 2; p < 0,01 szignifikáns) Mivel a  2 -érték elég nagy, a nullhipotézist elutasítjuk. ‘A 3 címert kedvelők aránya szignifikánsan különbözik.’  =939 Várt gyak. 313 Kapott gyak.  =939

19  l Adatok: 1000 személy pártpreferencia értékei: melyik pártra szavazna? l Értékek: FIDESZ, MDF, MSZP, SZDSZ, JOBBIK, Egyéb (más párt vagy nem válaszol) l Kapott gyakoriságok: n 1 = 515, n 2 = 13, n 3 = 145, n 4 = 12, n 5 = 115 Másik példa: Választás 2010

20  l Bekerül-e a parlamentbe az SZDSZ? – Nullhipotézis: P(SZDSZ) = 0,05 – Adatok: n 1 = 12, n 2 = 790, várt gyak. = ? l Győz-e az MSZP-vel szemben a FIDESZ? – Nullhipotézis: P(FIDESZ) = P(MSZP) – Adatok: n 1 = 515, n 2 = 145, várt gyak. = ? Megválaszolandó kérdések

21  2a. Két populáció összehasonlítása diszkrét változó segítségével l Kérdés: Budapestiek és vidékiek között van-e különbség a címerpreferencia tekintetében? l Nullhipotézis: A két populációban a címerválasztási arányok ugyananazok

22  n 1 =163 Vidék Bpest n 2 =776 Kétszempontos gyakorisági táblázat Koronás Kádár Kossuth Össz. Össz.: N =939

23  Arányok összehasonlítása (sorösszegek szerinti százalékok) 71,2%9,2%19,6% 100% Vidék 76,3%12,1%11,6% Bpest 100% Koronás Kádár Kossuth Össz.

24  H 0 igaz volta esetén a próbastatisztika  2 -eloszlást követ. Szabadságfok: f = (sorok száma - 1)  (oszlopok száma - 1).  2 <  2 0,05 : H 0 -t 5%-os szinten nem utasítjuk el.  2  2 0,05 : H 0 -t 5%-os szinten elutasítjuk. Általános khi-négyzet-próba

25  A címeres példa eredménye Sorok száma: g = 2 Oszlopok száma: h = 3 Szabadságfok: f = (2-1)  (3-1) = 1  2 = 2 Kritikus értékek: -  2 0,05 = 5,991 -  2 0,01 = 9,210 Kiszámított khi-négyzet-érték:  2 = 8,144 Döntés: H 0 -t 5%-os szinten elutasítjuk.

26  l A várt gyakoriságok ne legyenek kb. 5-nél kisebbek. l Engedmény: elég, ha 80%-ra teljesül. l Például egy 2  2-es táblázatban 4 cella van, ezért ezekre mind teljesülnie kell. A  2 -próba alkalmazási feltétele

27  l Kis gyakoriságú sorok vagy oszlopok összevonása. l Nagyobb minta választása. 2  2-es táblázat esetén a 2  2-es  2 -próba helyett a Fisher-egzakt-próba. Mit tehetünk, ha az alkalmazási feltétel nem teljesül?

28  Példa oszlopok összevonására Isk. szint01234Össz. Alsófok Középfok Felsőfok Össz h6 változó értékei

29  Férfiak és nők feminitása (CPI) százalék

30  Fem ≤ 11Fem > 11 Férfi (n = 12) 66 Nő (n = 70) 763 l  2 = 12,286 (f = 1, p < 0,01), várt min = 1,9 l Fisher-egzakt-próba: p = 0,0027 Példa a Fisher-egzakt-próbára

31  –Két dichotóm változó összehasonlítása (McNemar-próba, Előjelpróba) –Ketőnél több dichotóm változó összehasonlítása (Cochran-féle Q-próba) –Két tetszőleges diszkrét változó összehasonlítása (Általános McNemar-próba, Bowker-féle szimmetria-próba) 2b. Összetartozó mintás homogenitásvizsgálatok

32  Két helyzet vagy időpont összehasonlítása egy dichotóm változó segítségével l Példa: Középiskolai osztályban előadást tartanak a dohányzás ártalmáról. 36 tanuló közül 8 leszokik, 3 rászokik a dohányzásra. Hatásos-e az előadás? l Nullhipotézis: A dohányzás változójának eloszlása az előadás előtt és után ugyanaz. –Különbségváltozó: x 1 = leszokik, x 2 = rászokik –Nullhipotézis: H 0 : P(leszokás) = P(rászokás)

33  l Adattáblázat: l Képlet és számolás: McNemar-próba Alkalmazási feltétel: (b+c)/2  5 l Hogyan lehetne itt az előjelpróbát alkalmazni? Dohányzik?Utána igenUtána nem Előtte igenab = 8 Előtte nemc = 3d                     bc bc

34  1. általánosítás: X dichotóm, h számú összetartozó minta összehasonlítása Nullhipotézis: A h számú dichotóm változó eloszlása ugyanaz

35  Szakmai példa: h számú tesztkérdés nehézségének az összehasonlítása Személyitem1item2item3item Megoldási arány0,280,560,480,22

36  Másik szakmai példa: elvonó kúra után állapotrögzítés több időpontban Személy1. hónap3. hónap6. hónap9. hónap Visszaesők aránya0,180,260,320,30

37  Cochran-féle Q-próba l Nullhipotézis: A h számú dichotóm változó eloszlása ugyanaz  az 1 (és úgyszintén a 0) érték elméleti arányai megegyeznek l Alkalmazási feltétel: n  h  24 –n: személyek száma; h: változók száma l Próbastatisztika: Q, mely H 0 igaz volta esetén közelítőleg  2 -eloszlást követ

38  2. általánosítás: X tetszőleges, de csak két összetartozó mintát hasonlítunk össze (változik-e X eloszlása az egyik helyzetről/időpontról a másikra?) Sima McNemar-próba általánosítása: Általános McNemar-próba (vagy Bowker- féle szimmetria-próba)

39  2 diszkrét változó kapcsolatának vizsgálata Könnyen teremt baráti kapcsolatokat 15 éves lányok Kapcsolatvizsgálat  homogenitásvizsgálat DohányzikIgenNemÖsszesen Igen Nem Összesen

40  Sorösszegek szerinti százalékok táblázata Könnyen teremt baráti kapcsolatokat 15 éves lányok DohányzikIgenNemÖsszesen Igen86,1 13,9100 Nem58,042,0100 Összesen61,738,3100

41  A pártpreferencia függése az életkortól és a nemtől A pártpreferencia nem függ a kortól, ha a pártpreferencia eloszlása különböző életkori szinteken ugyanaz. A pártpreferencia nem függ a nemtől, ha a pártpreferencia eloszlása férfiaknál és nőknél ugyanaz.

42  Függ-e ennek a személynek a kedveltsége az iskolai végzettségtől? Iskolázottság és szimpátia

43  Eloszlás a 3 iskolázottsági szinten

44  X és Y függetlensége X független Y-tól, ha Y eloszlása ugyanaz X minden értéke mellett Y független X-től, ha X eloszlása ugyanaz Y minden értéke mellett A függetlenség kölcsönös

45  A kapcsolat szorosságának mérése diszkrét változók esetén l Cramér-féle V kontingencia-együttható: l Ha X és Y független, V = 0. l 0 ≤ V ≤ 1.

46  A kapcsolat szorosságának mérése dichotóm változók esetén l Dichotóm (kétértékű) változók esetén V  φ kontingencia együttható, |φ| = V l -1 ≤ φ ≤ 1 l φ = Pearson-féle r korrelációs együttható a sor- és az oszlopváltozó között

47  A kapcsolat szorosságának mérése dichotóm változók esetén  Kontingencia-együttható (φ)  Pearson korreláció a numerikusan kódolt dichotóm változók között  Yule-féle asszociációs együttható ( , Y)  Kendall-féle gamma dichotóm változókkal  Alfa esélyhányados

48  Az alfa esélyhányados X= „  ” X=„+” Y = férfiab cd Y = nő  Alfa = (b/a) : (d/c)  Ha alfa = 1, nincs különbség a 2 csoport között  Ha alfa nagyon kicsi vagy nagyon nagy, komoly különbség van a 2 csoport között

49  A φ együttható jelentése l Kódoljuk X értékeit az 1 és a 2 számmal (pl. 1 = férfi, 2 = nő). l Kódoljuk Y értékeit ugyancsak az 1 és a 2 számmal (pl. 1 = igen, 2 = nem). l φ a Pearson-féle korrelációs együttható X és Y között

50  A  együttható jelentése l Kódoljuk X értékeit az 1 és a 2 számmal (pl. 1 = férfi, 2 = nő). Kódoljuk Y értékeit ugyancsak az 1 és a 2 számmal (pl. 1 = igen, 2 = nem).  a pozitív és a negatív együttjárás %-os arányának különbsége (Kendall-féle Γ)

51  A kapcsolat szorosságának mérése ordinális változók esetén Ordinális skálájú változók esetén: Kendall-féle  monotonitási (asszociációs) együttható. Jelentés: pozitív kapcsolat relatív fölénye a negatívval szemben: (Poz-Neg)/(Poz+Neg) l Egyirányú függés mérése: Somers-féle monotonitási mérőszámok


Letölteni ppt " 8. Gyakorisági táblázatok elemzése (statisztikai elemzések arányokkal, illetve diszkrét változókkal)"

Hasonló előadás


Google Hirdetések