Hipotézis vizsgálat.

Slides:



Advertisements
Hasonló előadás
Gyakorlati probléma 20 különböző gyógyszert próbálunk ki, t-próbával összehasonlítva a kezelt és a kontrol csoportot A nullhipotézis elfogadásáról vagy.
Advertisements

Hipotézis-ellenőrzés (Statisztikai próbák)
4. Két összetartozó minta összehasonlítása
I. előadás.
II. előadás.
3. Két független minta összehasonlítása
Rangszám statisztikák
A többszörös összehasonlítás gondolatmenete. Több mint két statisztikai döntés egy vizsgálatban? Mi történik az elsõ fajú hibával, ha két teljesen független.
Két változó közötti összefüggés
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Statisztika II. V. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
Mintavételes eljárások
III. előadás.
Regresszióanalízis 10. gyakorlat.
Hipotézisvizsgálat (1. rész) Kontingencia táblák
Nem-paraméteres eljárások, több csoport összehasonlítása
ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Kvantitatív módszerek
Kvantitatív módszerek 8. Hipotézisvizsgálatok I. Nemparaméteres próbák Dr. Kövesi János.
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
Matematikai alapok és valószínűségszámítás
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Egytényezős variancia-analízis
STATISZTIKA II. 6. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Kvantitatív Módszerek
Kvantitatív módszerek
Valószínűségszámítás
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Illeszkedés vizsgálat
Többtényezős ANOVA.
avagy Négy halálos lórugás egy év alatt! Mit tesz a kormány?
Hipergeometriai eloszlás. Sir Ronald A. Fisher és Ms Bristol esete a teával és a tejjel Első felvonás.
t A kétoldalú statisztikai próba alapfogalmai

Diszkrét változók vizsgálata
Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek.
Paleobiológiai módszerek és modellek 4. hét
I. előadás.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Mintavételes Eljárások.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Korreláció-számítás.

Kapcsolat vizsgálat II: kontingencia táblák jelentősége és használata az epidemiológiában, diagnosztikában: RR, OR. Dr. Prohászka Zoltán Az MTA doktora.
Kvantitatív módszerek
Konzultáció november 19. Nemparaméteres próbák, egymintás próbák
Nemparaméteres próbák
Statisztikai áttekintés (I.)
Kiváltott agyi jelek informatikai feldolgozása 2016
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
II. előadás.
Gazdaságstatisztika konzultáció
Kvantitatív módszerek
I. Előadás bgk. uni-obuda
Hipotézisvizsgálatok Paraméteres próbák
Sztochasztikus kapcsolatok I. Asszociáció
Nemparaméteres próbák
1.3. Hipotézisvizsgálat, statisztikai próbák
Előadás másolata:

Hipotézis vizsgálat

Sir Ronald A. Fisher és Ms Bristol esete a teával és a tejjel Második felvonás

Mi a valószínűsége, hogy véletlenül 0, 1, 2, 3, 4 jó csészét választ? P(Y=0) = 1.43% P(Y=1) = 22.86% P(Y=2) = 51.43% P(Y=3) = 22.86% P(Y=4) = 1.43%

Mit gondolunk, ha 4 jó csészét választ? Nagyon valószínűtlen (1.43%), hogy ez véletlenül történt  elhisszük, hogy meg tudja különböztetni a két féle teát Mi a valószínűsége, hogy Ms Bristol igazat mondott és meg tudja különböztetni a kétféle teát?

Ms Bristol csak három jó csészét választott! Ez könnyen lehet véletlen is  nem hisszük el, hogy meg tudja különböztetni a két féle teát Mi a valószínűsége, hogy mégis igazat mondott, csak egyszer véletlenül mellényúlt?

Mindig két hipotézis közül választunk! Null-hipotézis (H0): a megfigyelt értékeket véletlenül is kaphattuk véletlenül választott Ms Bristol 3 jó csészét a két becsült érték közötti különbséget a véletlen hatások okozzák a két eloszlás azonos, a megfigyelt gyakoriságok közötti különbség csak a véletlen hatásoknak köszönhetőek Alternatív hipotézis (H1): a megfigyelt értékeket nem kaphattuk véletlenül, van valamilyen szisztematikus hatás (eltérés)

A hipotézisvizsgálat lehetséges kimenetelei

Az egyes kimenetelek valószínűségei

Egy kis bűnügyi kitérő Egy - a gyanúsított elitélésével zárult - gyilkossági ügyet elemzünk, amit 1973 őszén tárgyalt a wuppertali eküdtbíróság Az F. házaspárt megtámadják az erdőben, először rálőnek a férfira (a lövés nem halálos), majd megerőszakolják és megölik az asszonyt A rendőrség W. urat gyanúsította a tett elkövetésével

Egy kis bűnügyi kitérő 2. F. asszony körme alatt W. úréval megegyező vércsoportba tartozó vérnyomokat találtak. Az orvosszakértő véleménye szerint annak a valószínűsége, hogy ez csak véletlen egyezés 0.173 W. úr ruháján vérnyomokat találtak, amelyek vércsoportja, megegyezik F.-né vércsoportjával. A szakértő szerint a véletlen vércsoportegyezés valószínűsége 0.157

Egy kis bűnügyi kitérő 3. A szakértő így összegezte a véleményét: 0.173*0.157=0.027 a valószínűsége, hogy véletlenül esnek egybe a vércsoportok, vagyis, hogy W. úr ártatlan 1-0.027=0.973 valószínűséggel viszont W. úr követte el a gyilkosságot. Biztos, hogy mindenben helyes a szakértő érvelése? Ti ez alapján elitélnétek W. urat?

A próba menete szoftverrel előre megállapítom az elsőfajú hiba valószínűségének még megengedhető szintjét (a), vagyis a szignifikancia szintet (általában 5%) kiszámítom a próbastatisztika értékét kiszámítom az első fajú hiba valószínűségét ha Paa elvetem a nullhipotézist, egyébként nem.

A próba menete hagyományosan előre megállapítom az elsőfajú hiba valószínűségének még megengedhető szintjét (a), vagyis a szignifikancia szintet (általában 5%) kiszámítom a próbastatisztika értékét (pl. S) táblázatból kikeresem az a szinthez tartozó kritikus értéket (Scrit), vagyis azt az értéket, amelynél az első fajú hiba valószínűsége pont a lenne ha Scrit  S elvetem a nullhipotézist, egyébként nem.

Előjel teszt

A teszt célja a minta alapján becsült medián összehasonlítása egy elméleti értékkel

A teszt elméleti háttere A mediánnál nagyobb (vagy kisebb) értéket 50%-os valószínűséggel kapunk A mediánnál nagyobb értékek száma binomiális eloszlású valószínűségi változó, amelynek paraméterei: n = a minta elemszáma, p = 0.5 ha az elméleti érték megegyezik a mediánnal, akkor a nála nagyobb értékek száma ugyanilyen eloszlást követ a medián feltételezett elméleti értékénél nagyobb mintaelemek számának várhatóértéke, ha a nullhipotézis igaz, n/2

Egy konkrét példa a 10 elemű mintában 8 elem nagyobb, mint nulla. H0: az alapsokaság mediánja = 0 H1: az alapsokaság mediánja  0 Mekkora a valószínűsége, hogy hibázunk, ha elvetjük a nullhipotézist? Ha az Y=8 értéknél elvetjük a nullhipotézist, akkor még milyen értékeknél kell elvetnünk?

P(Y=0) = 0,1% P(Y=1) = 0,98% P(Y=2) = 4,39% P(Y=3) = 11,72% P(Y=4) = 20,51% P(Y=5) = 24,61% P(Y=10) = 0,1% P(Y=9) = 0,98% P(Y=8) = 4,39% P(Y=7) = 11,72% P(Y=6) = 20,51%

Egy- és kétoldali alternatív hipotézis Nullhipotézis: H0: az alapsokaság mediánja = 0 Kétoldali alternatív hipotézis: H1: az alapsokaság mediánja  0 Egyoldali alternatív hipotézis I.: H1: az alapsokaság mediánja > 0 ha Y=8-nál elvetem a nullhipotézist, akkor Y>8-nál is el kell vetnem Egyoldali alternatív hipotézis II.: H1: az alapsokaság mediánja < 0 ha Y=8-nál elvetem a nullhipotézist, akkor Y<8-nál is el kell vetnem

Mikor használható az egyoldali alternatív hipotézis? Ha a próba során használt adatoktól független forrásból származó információk alapján feltételezem, hogy csak az egyik irányú eltérés várható Független forrás lehet: elméletek (pl. vérnyomáscsökkentő gyógyszernél nem számítunk vérnyomás emelkedésre), mások korábbi vizsgálatai, saját elővizsgálataim, más adatokon (esetleg a gyűjtött adatok másik felén) végzett adatfeltárás.

Egymintás u próba

A próba célja az alapsokaság várhatóértékének az összehasonlítása egy elméleti értékkel a mintaátlag (az alapsokaság várhatóértékének becslése) alapján

A próba feltételei a valószínűségi változó normális eloszlású és ismert a szórása, vagyis a szórást nem a mintából becsüljük

A próba elméleti háttere Ha Y=N(m,s), akkor és

H0: m=m0 H1: mm0 Ha H0 igaz, akkor az valószínűségi változó standard normális eloszlású Az elsőfajú hiba valószínűsége:

Egy konrét példa Az adatok: 1.2; 3.6; 2.8; 0.7; 1.9 m0=2 s=1.2 Számítsátok ki az u statisztika értékét és a határozzátok meg az elsőfajú hiba valószínűségét! (R-script)

Mit jelent ha nem vetem el a nullhipotézist? ha a nullhipotézis igaz, akkor is kaphatok a próbastatisztikára ilyen nagy értéket NEM JELENTI, hogy a nullhipotézis igaz, sem azt, hogy az alternatív hipotézis nem igaz

Másodfajú hiba Annak valószínűsége, hogy nem vetem el a nullhipotézis, amikor az nem igaz Elkövetésének valószínűsége függ: a szignifikancia szinttől: minél alacsonyabb a szign. szint, annál valószínűbb, hogy elkövetem a másodfajú hibát (Szkülla és Kharübdisz) a minta elemszámától a nullhipotézistől való eltérés mértékétől: minél kisebb az eltérés, annál nehezebb észrevenni

Mi a teendő, ha nem vetem el a nullhipotézist? 1. verzió: eldöntöm, hogy mekkora eltérés az, ami már szakmailag értelmes, amit már ki akarok mutatni kiszámítom a másodfajú hiba valószínűségét ekkora eltérésnél ha ez egy előre megállapított értéknél kisebb, akkor elfogadom a nullhipotézist, egyébként a vizsgálat inkonkluzív (=a nullhipotézist sem elvetni, sem elfogadni nem tudom) inkonkluzív vizsgálatnál érdemes kiszámolni azt a mintaméretet, aminél már konklúzív lenne a vizsgálat

Mi a teendő, ha nem vetem el a nullhipotézist? 2. verzió: előre megállapítom a másodfajú hiba még elfogadható maximális szintjét megállapítom, hogy mekkora az a minimális eltérés a nullhipotézistől, amelynél a másodfajú hiba valószínűsége nem nagyobb az előre megállapított értéknél ezt az eltérést is figyelembe veszem az eredmények interpretációjánál, pl. 5%-os szignifikancia szinten az alapsokaság várhatóértéke nem különbözik nullától. Ha a különbség 0.1 vagy annál nagyobb lenne, a másodfajú hiba valószínűsége 10% alatt lenne, tehát valószínűsíthető, hogy ha van is eltérés, az nem jelentős.

A másodfajú hiba kiszámítása Bonyolultabb, mint az elsőfajú hibáé, ezért a számítási részleteket a további próbáknál nem részletezzük Az egy mintás u próbánál még viszonylag egyszerű, ezért itt részletesebben is megnézzük

Másodfajú hiba valószínűsége az egy mintás u próbánál 1. Pb=P(- ucrit < u<ucritH1 igaz) Ha az alternatív hipotézis igaz, akkor

Másodfajú hiba valószínűsége az egy mintás u próbánál 2. Legyen az ilyen paraméterű normális eloszlás eloszlásfüggvénye F Pb=F( ucrit)-F(-ucrit) Határozzátok meg a másodfajú hiba valószínűségét az előző példában, ha m1=2.1, m1=3, illetve m1=4