Két változó közötti összefüggés

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Gyakorlati probléma 20 különböző gyógyszert próbálunk ki, t-próbával összehasonlítva a kezelt és a kontrol csoportot A nullhipotézis elfogadásáról vagy.
Hipotézis-ellenőrzés (Statisztikai próbák)
I. előadás.
II. előadás.
2006. február 17. Valószínűségszámítás és statisztika II. Telefonos feladat Egy kalapban van két korong, az egyiknek mindkét oldala piros, a másiknak.
Kvantitatív módszerek
Rangszám statisztikák
A többszörös összehasonlítás gondolatmenete. Több mint két statisztikai döntés egy vizsgálatban? Mi történik az elsõ fajú hibával, ha két teljesen független.
Matematika II. 2. előadás Geodézia szakmérnöki szak 2012/2013. tanév Műszaki térinformatika ágazat őszi félév.
Feladat Egy új kísérleti készítmény hatását szeretnék vizsgálni egereken. 5 féle dózist adnak be 5 vizsgált egérnek, de nem sikerült mindegyik egérnek.
A tételek eljuttatása az iskolákba
ASSZOCIÁCIÓS MÉRŐSZÁMOK
Általános statisztika II.
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Statisztika II. V. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Valószínűségszámítás
Növényökológia terepgyakorlat Fajok asszociáltságának vizsgálata I.) Az egyes esetek TAPASZTALT gyakorisága 1. táblázat A faj B faj+- +aba+b.
III. Sz. Belgyógyászati Klinika
Hipotézisvizsgálat (1. rész) Kontingencia táblák
Nem-paraméteres eljárások, több csoport összehasonlítása
ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Készítette: Kosztyán Zsolt Tibor
Kvantitatív módszerek
Matematikai alapok és valószínűségszámítás
Matematikai alapok és valószínűségszámítás

A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
STATISZTIKA II. 6. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Kvantitatív Módszerek
Valószínűségszámítás
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Hipotézis vizsgálat.
t A kétoldalú statisztikai próba alapfogalmai

Diszkrét változók vizsgálata
Két kvantitatív változó kapcsolatának vizsgálata
Paleobiológiai módszerek és modellek 4. hét
I. előadás.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
A szóráselemzés gondolatmenete
Valószínűségszámítás II.
Többdimenziós valószínűségi eloszlások
Korreláció-számítás.
A számítógépes elemzés alapjai
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
A számítógépes elemzés alapjai
Konzultáció november 19. Nemparaméteres próbák, egymintás próbák
II. előadás.
Becsléselmélet - Konzultáció
I. Előadás bgk. uni-obuda
Sztochasztikus kapcsolatok I. Asszociáció
Kockázat és megbízhatóság
Gazdaságinformatika MSc labor
Előadás másolata:

Két változó közötti összefüggés Hipotézisvizsgálat (Statisztikai szignifikanciapróbák): A khi-négyzet Babbie, E. A társadalomtudományi kutatás gyakorlata, Balassi Kiadó 1995. 511-523.old.

Összefüggés két változó között a mintában Összefüggés az alapsokaságban

A dohányzás és az alkoholfogyasztás összefüggése az egyes táblák adatai szerint tábla: Minden dohányos alkoholizál, és minden alkoholfogyasztó dohányzik. Az összefüggés determinisztikus. Tábla: A dohányosok között éppen annyi az absztinens, mint az alkoholfogyasztó. A dohányzás NEM befolyásolja az alkoholfogyasztást, és fordítva. A két változó független.

A dohányzás és az alkoholfogyasztás összefüggése az egyes táblák adatai szerint 3. tábla: a dohányosok 60%-a iszik, 40%-a nem, az antinikotinisták 40%-a fogyaszt alkoholt, 60%-uk absztinens. Érdemes a dohánybolt-hálózatunkban szeszesital árusítási engedélyt kérni? (az engedély drága) Elég erős a 3. táblában az összefüggés, hogy érvényesnek tekintsük az alapsokaságra?

Mérőszám, amely az adott tábla gyakoriságainak és a „függet-lenségi tábla” gyakoriságainak eltéréseit méri A 3. tábla gyakoriságait nevezzük fm-nek, a 2. (függetlenségi)tábla gyakoriságait fe-nek. A létrehozandó mérőszám neve: khi-négyzet.

A khi-négyzet képlete

Példa1. Khi négyzet= (60-50)2/50+(40-50)2/50+(40-50)2/50+ +(60-50)2/50=4*100/50=8

A khi-négyzet mint valószínűségi változó Válasszunk a „N” elemszámú alapsokaságból minden lehetséges módon egyszerű véletlen módszerrel „n” elemszámú mintákat! A többszázmillió darab minta mindegyikében vessük össze 2 változó (pl. a dohányzás és alkoholfogyasztás) együttállását jelző fm-ket a függetlenséget jelentő fe-kkel! Számoljunk rengeteg sok khi-négyzetet!

A khi-négyzet eloszlás ábrája (15-ös szabadságfok)

Mekkora konkrét (képlettel kiszámolt) khi-négyzetek adódnak a rengeteg sok „n”- elemű mintából? Tegyük fel, hogy az alapsokaságban (melyből az „n” elemű mintákat választottuk) a dohányzás és az alkoholfogyasztás függetlenek. A minták jelentős részében az fm-k nagyon közel lesznek az fe-khez. A khi-négyzetek „kicsik” lesznek.

Előadódhatnak olyan minták, amelyekhez „nagy” khi-négyzet-ek tartoznak? 5 % „kicsi” khi-négyzetek „nagy” khi-négyzetek

Ha egy olyan alapsokaságból, amelyben két változó független egymástól, minden lehetséges módon „n” elemű mintákat választunk véletlen módszerrel, a minták 5%-ában „nagy” khi-négyzetet kapunk. Tegyük fel, hogy az alapsokaságban a két változó független! (Null-hipotézis) Ha csak egyetlen mintát választunk, akkor mindössze 5 % annak a valószínűsége, hogy a mintában a 2 változó kapcsolatát egy „nagy” khi-négyzet jellemzi, hiszen az alapsokaságban a két változó független egymástól. Határozzuk el, hogy minden olyan esetben, ha(a 2 változó kapcsolatát jellemzendő) „nagy” khi-négyzetet számolunk ki egy mintában, akkor ebből azt a következtetést vonjuk le, hogy az alapsokaságban nem független egymástól a két változó. Elvetjük a null-hipotézist. Azt mondjuk, hogy a két változó az alapsokaságban (is) összefügg egymással. MIT KOCKÁZTATUNK? 5% annak a valószínűsége, hogy tévedünk. Ez az 5% annak a hibának (elsőfajú hiba) a valószínűsége, hogy egy igaz hipotézist (null-hipotézis) hamisnak ítélünk.

Null-hipotézis: az alapsokaságban a 2 változó független Mire következtetünk, ha egy adott mintában 2 változó kapcsolatát „kicsi” khi-négyzet jellemzi? Ebből arra következtetünk, hogy az alapsokaságban független egymástól a két változó. Megtartjuk a null-hipotézist (Miért nem nulla ilyenkor a khi-négyzet értéke?) Mit kockáztatunk? Egy hamis hipotézist tartottunk meg (másodfajú hiba). Mekkora lehet a másodfajú hiba elkövetésének valószínűsége?

Mikor „nagy” és mikor ”kicsi” a khi-négyzet értéke? Szabadságfok: (oszlopok száma -1)*(sorok száma – 1) Khi-négyzet-eloszlás táblázata Oszlopokban: szignifikanciák, Sorokban: szabadságfokok Táblázatban: khi-négyzet „küszöbérték”

A dohányzás----alkoholfogyasztás egy 2*2-es táblában Számított khi-négyzet értéke:8 A táblázat szabadságfoka: (2-1)*(2-1)=1 A khi-négyzet küszöbértéke (5 %-os szignifikanciánál):3,84

A számított khi-négyzet és a khi-négyzet küszöbértéke „kicsi” khi-négyzetek 3,84 „nagy” khi-négyzetek

Példa 2.

Khi-négyzet= (80-126)2/126+(54-87)2/87+ +(227-148)2/148+(78-89)2/89+(80-61)2/61+ +(96-104)2/104+(132-94)2/94+(78-65)2/65+ +(60-111)2/111+(60-40)2/40+(28-28)2/28+ +(27-47)2/47=138,47 Egy 4*3-as kereszttáblához tartozó khi-négyzet szabadságfoka: 3*2=6 A khi-négyzet küszöbértéke:12,59 Következtetés?

Mitől függ a (számított) khi-négyzet értéke?

Ha kétszer akkora mintát veszünk:

A 200 fős és a 400 fős minta számított khi-négyzete Következtetés? A 400 fős minta számított khi-négyzete A 200 fős minta számított khi-négyzete 3,84 4,00 2,00

A khi-négyzet elemszámérzékeny (2-szer akkora mintában 2-szeresére nő a számított khi-négyzet értéke, pedig a kereszttábla gyakoriságai azonos „szerkezetűek” Hipotézisvizsgálat 1. Null-hipotézis (az alapsokaságban a 2 változó függyetlen) 2. Szignifikancia „választás”, elsőfajú hiba elkövetésének valószínűsége (5%) 3. A kereszttábla szabadságfoka 4. A khi-négyzet küszöbértékének „kikeresése” 5. A függetlenségi tábla gyakoriságainak kiszámítása 6. A khi-négyzet kiszámítása 5. Következtetés: a számított khi-négyzet és a khi-négyzet küszöbértékének összevetése: ha a számított khi-négyzet nagyobb a küszöbértéknél, a nullhipotézist elvetjük, kisebb a küszöbértéknél, a nullhipotézist megtartjuk.