Tartalom Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat 2-próbával) Arányok összehasonlítása összetartozó és független minták segítségével.

Slides:



Advertisements
Hasonló előadás
Hipotézis-ellenőrzés (Statisztikai próbák)
Advertisements

4. Két összetartozó minta összehasonlítása
Kvantitatív Módszerek
TÁRSADALOMSTATISZTIKA III. Sztochasztikus kapcsolatok I. Előadó: Prof. Dr. Besenyei Lajos.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Kvantitatív módszerek
3. Két független minta összehasonlítása
ASSZOCIÁCIÓS MÉRŐSZÁMOK
Két változó közötti összefüggés
Összefüggés vizsgálatok
Gazdaságelemzési és Statisztikai Tanszék
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
III. előadás.
Növényökológia terepgyakorlat Fajok asszociáltságának vizsgálata I.) Az egyes esetek TAPASZTALT gyakorisága 1. táblázat A faj B faj+- +aba+b.
Növényökológia gyakorlat Fajok asszociáltságának vizsgálata I.) Az egyes esetek TAPASZTALT gyakorisága 1. táblázat A faj B faj+- +aba+b -cdc+d.
III. Sz. Belgyógyászati Klinika
Hipotézisvizsgálat (1. rész) Kontingencia táblák
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Nem-paraméteres eljárások, több csoport összehasonlítása
ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.
Kvantitatív módszerek
Matematikai alapok és valószínűségszámítás
Asszociációs együtthatók
Fisher-féle egzakt próba Asszociációs mérőszámok
Nemparaméteres próbák Statisztika II., 5. alkalom.
Nemparaméteres próbák
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
STATISZTIKA II. 6. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
3. előadás Heterogén sokaságok Szórásnégyzet-felbontás
Kvantitatív Módszerek
PEDAGÓGIAI KÍSÉRLET KOOPERATÍV MÓDSZEREK ALAKAMAZÁSA II. OSZTÁLYBAN A MATEMATIKA TANÍTÁSÁBAN ARI LÁSZLÓ II. év- távoktatás.
INTEGRÁCIÓ A FEJEKBEN? A romákkal kapcsolatos lakossági attitűdök Magyarországon Bernát Anikó TARKI Társadalomkutatási Intézet október 25.
6. Változók és csoportok összehasonlítása varianciaanalízissel
7. Csoportok és változók sztochasztikus összehasonlítása (összehasonlítások ordinális függő változók esetén)
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika Hipotézisvizsgálatok Nemparaméteres próbák II. 17. előadás.
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Statisztikai módszerek áttekintése módszerválasztási tanácsok Makara Gábor.
Következtető statisztika 9.
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Hipotézis vizsgálat.
Adatleírás.
t A kétoldalú statisztikai próba alapfogalmai


Diszkrét változók vizsgálata
Két kvantitatív változó kapcsolatának vizsgálata
Paleobiológiai módszerek és modellek 4. hét
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
A kombinációs táblák (sztochasztikus kapcsolatok) elemzése
Vargha András KRE és ELTE, Pszichológiai Intézet
3. hét Asszociáció.
Korreláció-számítás.
A számítógépes elemzés alapjai
Kapcsolat vizsgálat II: kontingencia táblák jelentősége és használata az epidemiológiában, diagnosztikában: RR, OR. Dr. Prohászka Zoltán Az MTA doktora.
A számítógépes elemzés alapjai
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
Adatelemzési gyakorlatok
Sztochasztikus kapcsolatok I. Asszociáció
Dr. Varga Beatrix egyetemi docens
Nemparaméteres próbák
Gazdaságinformatika MSc labor
Statisztika segédlet a Statistica programhoz Új verzióknál érdemes a View menüsor alatt a Classic menu-s verziót választani – ehhez készült a segédlet.
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
1.3. Hipotézisvizsgálat, statisztikai próbák
Előadás másolata:

8. Gyakorisági táblázatok elemzése (statisztikai elemzések arányokkal, illetve diszkrét változókkal)

Tartalom Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat 2-próbával) Arányok összehasonlítása összetartozó és független minták segítségével Diszkrét változók kapcsolatvizsgálata

Diszkrét változók eloszlásában Hol találkozunk arányokkal? Diszkrét változók eloszlásában

Példa diszkrét eloszlásra Érték: 1 2 3 Arány: 0,20 0,35 0,40 0,05

Néhány példa diszkrét változóra Személy neme (x1 = férfi, x2 = nő) Iskolázottsági szint (x1 = Alsófok, x2 = Középfok, x3 = Felsőfok) 5-fokú skálaváltozók Diagnózis (x1 = Neurózis, x2 = Szkizofrénia, ...) Kor (x1 = 18-35 év, x2 = 36-55 év, x3 = 56-99 év)

Kiemelt fontosságú diszkrét változók Változó típusa Kvantitatív Kvalitatív Arány Intervallum Ordinális Nominális

Statisztikai problématípusok arányok esetén

1. Eloszlásvizsgálatok Csoki nyuszitojást milyen színű papírban viszik (veszik) a leginkább? (piros, zöld ...) Fiúból, vagy lányból születik-e több? Szmogriadó esetén, ha csak a páratlan rendszámú autók közlekedhetnek: Kisebb-e a páros rendszámúak aránya? Kisebb-e 1/3-nál a páros rendszámúak aránya?

2a. Homogenitásvizsgálatok (Arányok összehasonlítása független minták segítségével) Igaz-e, hogy a nők között több neurotikus van, mint a férfiak között? Ugyanolyan-e Bp.-en a Koronás, a Kádár- és a Kossuth-címer kedveltsége, mint vidéken?

2b. Homogenitásvizsgálatok (Arányok összehasonlítása összetartozó minták segítségével) Változik-e a dohányosok aránya egy előadássorozat hatására különböző időpontokban? Változik-e a pártok kedveltségi aránya két vagy több időpont között?

3. Két diszkrét változó kapcsolatának vizsgálata (Kapcsolatvizsgálatok) Függ-e a pártpreferencia az iskolázottságtól? Milyen szoros kapcsolatban van a fenti két változó egymással?

Problématípusok rendszere

1. Eloszlásvizsgálatok Példa: A Koronás, a Kádár és a Kossuth címer kedveltsége egy 939 fős mintában. Koronás címer Kádár-címer Kossuth-címer Összes személy 708 109 122 939

Százalékos megoszlási arányok

Lehetséges nullhipotézisek a) H0: Koronás: 60%, Kádár: 20%, Kossuth: 20% b) H0: Koronás: 40%, Kádár: 20%, Kossuth: 40% c) H0: Koronás = Kádár = Kossuth = 33,3%

A khi-négyzet-próba alapötlete A mintabeli kapott és a nullhipotézis igaz volta esetén várt gyakoriságok összehasonlítása és a köztük lévő különbségekből egy c2 próbastatisztika kiszámítása. Szabadságfok: f = g - 1

khi-négyzet-próbával Eloszlásvizsgálat khi-négyzet-próbával Minél nagyobb az eltérés a kapott és a várt gyakoriságok között, annál valószínűbb, hogy H0 nem igaz. Az eltérés egyik mértéke a c2 próbastatisztika. Ha igaz H0, ez a mennyiség közelítőleg c2-eloszlású. Ha c2 elég nagy, akkor H0-t elutasítjuk.

A c2-próba végrehajtása Kapott gyak. 708 109 122 S=939 Várt gyak. 313 313 313 S=939 c2 = (708-313)2/313 + ... = 892,09 > c20,01 = 9,21 (f = 2; p < 0,01 szignifikáns) Mivel a c2-érték elég nagy, a nullhipotézist elutasítjuk. ‘A 3 címert kedvelők aránya szignifikánsan különbözik.’

Másik példa: Választás 2010 Adatok: 1000 személy pártpreferencia értékei: melyik pártra szavazna? Értékek: FIDESZ, MDF, MSZP, SZDSZ, JOBBIK, Egyéb (más párt vagy nem válaszol) Kapott gyakoriságok: n1 = 515, n2 = 13, n3 = 145, n4 = 12, n5 = 115

Megválaszolandó kérdések Bekerül-e a parlamentbe az SZDSZ? Nullhipotézis: P(SZDSZ) = 0,05 Adatok: n1 = 12, n2 = 790, várt gyak. = ? Győz-e az MSZP-vel szemben a FIDESZ? Nullhipotézis: P(FIDESZ) = P(MSZP) Adatok: n1 = 515, n2 = 145, várt gyak. = ?

2a. Két populáció összehasonlítása diszkrét változó segítségével Kérdés: Budapestiek és vidékiek között van-e különbség a címerpreferencia tekintetében? Nullhipotézis: A két populációban a címerválasztási arányok ugyananazok

Kétszempontos gyakorisági táblázat Koronás Kádár Kossuth Össz. Bpest 116 15 32 n1 =163 Vidék 592 94 90 n2 =776 Össz.: 708 109 122 N =939

Arányok összehasonlítása (sorösszegek szerinti százalékok) Koronás Kádár Kossuth Össz. Bpest 71,2% 9,2% 19,6% 100% Vidék 76,3% 12,1% 11,6% 100%

Általános khi-négyzet-próba H0 igaz volta esetén a próbastatisztika c2-eloszlást követ. Szabadságfok: f = (sorok száma - 1)×(oszlopok száma - 1). c2 < c20,05: H0-t 5%-os szinten nem utasítjuk el. c2 ³ c20,05 : H0-t 5%-os szinten elutasítjuk.

A címeres példa eredménye Sorok száma: g = 2 Oszlopok száma: h = 3 Szabadságfok: f = (2-1)×(3-1) = 1×2 = 2 Kritikus értékek: - c20,05 = 5,991 - c20,01 = 9,210 Kiszámított khi-négyzet-érték: c2 = 8,144 Döntés: H0-t 5%-os szinten elutasítjuk.

A c2-próba alkalmazási feltétele A várt gyakoriságok ne legyenek kb. 5-nél kisebbek. Engedmény: elég, ha 80%-ra teljesül. Például egy 22-es táblázatban 4 cella van, ezért ezekre mind teljesülnie kell.

Mit tehetünk, ha az alkalmazási feltétel nem teljesül? Kis gyakoriságú sorok vagy oszlopok összevonása. Nagyobb minta választása. 22-es táblázat esetén a 22-es c2-próba helyett a Fisher-egzakt-próba.

Példa oszlopok összevonására h6 változó értékei Isk. szint 1 2 3 4 Össz. Alsófok 16 10 24 55 Középfok 13 20 45 Felsőfok 17 5 42 8 43 28 60 142

Férfiak és nők feminitása (CPI) százalék

Példa a Fisher-egzakt-próbára Fem ≤ 11 Fem > 11 Férfi (n = 12) 6 6 Nő (n = 70) 7 63 2 = 12,286 (f = 1, p < 0,01), vártmin = 1,9 Fisher-egzakt-próba: p = 0,0027

2b. Összetartozó mintás homogenitásvizsgálatok Két dichotóm változó összehasonlítása (McNemar-próba, Előjelpróba) Ketőnél több dichotóm változó összehasonlítása (Cochran-féle Q-próba) Két tetszőleges diszkrét változó összehasonlítása (Általános McNemar-próba, Bowker-féle szimmetria-próba)

Két helyzet vagy időpont összehasonlítása egy dichotóm változó segítségével Példa: Középiskolai osztályban előadást tartanak a dohányzás ártalmáról. 36 tanuló közül 8 leszokik, 3 rászokik a dohányzásra. Hatásos-e az előadás? Nullhipotézis: A dohányzás változójának eloszlása az előadás előtt és után ugyanaz. Különbségváltozó: x1= leszokik, x2 = rászokik Nullhipotézis: H0: P(leszokás) = P(rászokás)

Képlet és számolás: McNemar-próba Adattáblázat: Dohányzik? Utána igen Utána nem Előtte igen a b = 8 Előtte nem c = 3 d Képlet és számolás: McNemar-próba c 2 10 8 3 25 11 27 = - + < ( ) , b Alkalmazási feltétel: (b+c)/2 ³ 5 Hogyan lehetne itt az előjelpróbát alkalmazni?

1. általánosítás: X dichotóm, h számú összetartozó minta összehasonlítása Nullhipotézis: A h számú dichotóm változó eloszlása ugyanaz

Szakmai példa: h számú tesztkérdés nehézségének az összehasonlítása Személy item1 item2 item3 item4 1. 1 2. 3. 4. ... Megoldási arány 0,28 0,56 0,48 0,22

Másik szakmai példa: elvonó kúra után állapotrögzítés több időpontban Személy 1. hónap 3. hónap 6. hónap 9. hónap 1. 1 2. 3. 4. ... Visszaesők aránya 0,18 0,26 0,32 0,30

Cochran-féle Q-próba Nullhipotézis: A h számú dichotóm változó eloszlása ugyanaz  az 1 (és úgyszintén a 0) érték elméleti arányai megegyeznek Alkalmazási feltétel: nh  24 n: személyek száma; h: változók száma Próbastatisztika: Q, mely H0 igaz volta esetén közelítőleg 2-eloszlást követ

2. általánosítás: X tetszőleges, de csak két összetartozó mintát hasonlítunk össze (változik-e X eloszlása az egyik helyzetről/időpontról a másikra?) Sima McNemar-próba általánosítása: Általános McNemar-próba (vagy Bowker-féle szimmetria-próba)

2 diszkrét változó kapcsolatának vizsgálata 15 éves lányok Könnyen teremt baráti kapcsolatokat Dohányzik Igen Nem Összesen Igen 105 17 122 Nem 469 340 809 Összesen 574 357 931 Kapcsolatvizsgálat  homogenitásvizsgálat

Sorösszegek szerinti százalékok táblázata 15 éves lányok Könnyen teremt baráti kapcsolatokat Dohányzik Igen Nem Összesen Igen 86,1 13,9 100 Nem 58,0 42,0 100 Összesen 61,7 38,3 100

A pártpreferencia függése az életkortól és a nemtől A pártpreferencia nem függ a kortól, ha a pártpreferencia eloszlása különböző életkori szinteken ugyanaz. A pártpreferencia nem függ a nemtől, ha a pártpreferencia eloszlása férfiaknál és nőknél ugyanaz.

Iskolázottság és szimpátia Függ-e ennek a személynek a kedveltsége az iskolai végzettségtől?

Eloszlás a 3 iskolázottsági szinten

X és Y függetlensége X független Y-tól, ha Y eloszlása ugyanaz X minden értéke mellett Y független X-től, ha X eloszlása ugyanaz Y minden értéke mellett A függetlenség kölcsönös

A kapcsolat szorosságának mérése diszkrét változók esetén Cramér-féle V kontingencia-együttható: Ha X és Y független, V = 0. 0 ≤ V ≤ 1.

A kapcsolat szorosságának mérése dichotóm változók esetén Dichotóm (kétértékű) változók esetén V  φ kontingencia együttható, |φ| = V -1 ≤ φ ≤ 1 φ = Pearson-féle r korrelációs együttható a sor- és az oszlopváltozó között

A kapcsolat szorosságának mérése dichotóm változók esetén Kontingencia-együttható (φ) Pearson korreláció a numerikusan kódolt dichotóm változók között Yule-féle asszociációs együttható (, Y) Kendall-féle gamma dichotóm változókkal Alfa esélyhányados

Az alfa esélyhányados Alfa = (b/a) : (d/c) X= „-” X=„+” Y = férfi a b Y = nő c d Alfa = (b/a) : (d/c) Ha alfa = 1, nincs különbség a 2 csoport között Ha alfa nagyon kicsi vagy nagyon nagy, komoly különbség van a 2 csoport között

A φ együttható jelentése Kódoljuk X értékeit az 1 és a 2 számmal (pl. 1 = férfi, 2 = nő). Kódoljuk Y értékeit ugyancsak az 1 és a 2 számmal (pl. 1 = igen, 2 = nem). φ a Pearson-féle korrelációs együttható X és Y között

A  együttható jelentése Kódoljuk X értékeit az 1 és a 2 számmal (pl. 1 = férfi, 2 = nő). Kódoljuk Y értékeit ugyancsak az 1 és a 2 számmal (pl. 1 = igen, 2 = nem).  a pozitív és a negatív együttjárás %-os arányának különbsége (Kendall-féle Γ)

A kapcsolat szorosságának mérése ordinális változók esetén Ordinális skálájú változók esetén: Kendall-féle G monotonitási (asszociációs) együttható. Jelentés: pozitív kapcsolat relatív fölénye a negatívval szemben: (Poz-Neg)/(Poz+Neg) Egyirányú függés mérése: Somers-féle monotonitási mérőszámok