Hipotézis vizsgálat
Sir Ronald A. Fisher és Ms Bristol esete a teával és a tejjel Második felvonás
Mi a valószínűsége, hogy véletlenül 0, 1, 2, 3, 4 jó csészét választ? P(Y=0) = 1.43% P(Y=1) = 22.86% P(Y=2) = 51.43% P(Y=3) = 22.86% P(Y=4) = 1.43%
Mit gondolunk, ha 4 jó csészét választ? Nagyon valószínűtlen (1.43%), hogy ez véletlenül történt elhisszük, hogy meg tudja különböztetni a két féle teát Mi a valószínűsége, hogy Ms Bristol igazat mondott és meg tudja különböztetni a kétféle teát?
Ms Bristol csak három jó csészét választott! Ez könnyen lehet véletlen is nem hisszük el, hogy meg tudja különböztetni a két féle teát Mi a valószínűsége, hogy mégis igazat mondott, csak egyszer véletlenül mellényúlt?
Mindig két hipotézis közül választunk! Null-hipotézis (H0): a megfigyelt értékeket véletlenül is kaphattuk véletlenül választott Ms Bristol 3 jó csészét a két becsült érték közötti különbséget a véletlen hatások okozzák a két eloszlás azonos, a megfigyelt gyakoriságok közötti különbség csak a véletlen hatásoknak köszönhetőek Alternatív hipotézis (H1): a megfigyelt értékeket nem kaphattuk véletlenül, van valamilyen szisztematikus hatás (eltérés)
A hipotézisvizsgálat lehetséges kimenetelei
Az egyes kimenetelek valószínűségei
Egy kis bűnügyi kitérő Egy - a gyanúsított elitélésével zárult - gyilkossági ügyet elemzünk, amit 1973 őszén tárgyalt a wuppertali eküdtbíróság Az F. házaspárt megtámadják az erdőben, először rálőnek a férfira (a lövés nem halálos), majd megerőszakolják és megölik az asszonyt A rendőrség W. urat gyanúsította a tett elkövetésével
Egy kis bűnügyi kitérő 2. F. asszony körme alatt W. úréval megegyező vércsoportba tartozó vérnyomokat találtak. Az orvosszakértő véleménye szerint annak a valószínűsége, hogy ez csak véletlen egyezés 0.173 W. úr ruháján vérnyomokat találtak, amelyek vércsoportja, megegyezik F.-né vércsoportjával. A szakértő szerint a véletlen vércsoportegyezés valószínűsége 0.157
Egy kis bűnügyi kitérő 3. A szakértő így összegezte a véleményét: 0.173*0.157=0.027 a valószínűsége, hogy véletlenül esnek egybe a vércsoportok, vagyis, hogy W. úr ártatlan 1-0.027=0.973 valószínűséggel viszont W. úr követte el a gyilkosságot. Biztos, hogy mindenben helyes a szakértő érvelése? Ti ez alapján elitélnétek W. urat?
A próba menete szoftverrel előre megállapítom az elsőfajú hiba valószínűségének még megengedhető szintjét (a), vagyis a szignifikancia szintet (általában 5%) kiszámítom a próbastatisztika értékét kiszámítom az első fajú hiba valószínűségét ha Paa elvetem a nullhipotézist, egyébként nem.
A próba menete hagyományosan előre megállapítom az elsőfajú hiba valószínűségének még megengedhető szintjét (a), vagyis a szignifikancia szintet (általában 5%) kiszámítom a próbastatisztika értékét (pl. S) táblázatból kikeresem az a szinthez tartozó kritikus értéket (Scrit), vagyis azt az értéket, amelynél az első fajú hiba valószínűsége pont a lenne ha Scrit S elvetem a nullhipotézist, egyébként nem.
Előjel teszt
A teszt célja a minta alapján becsült medián összehasonlítása egy elméleti értékkel
A teszt elméleti háttere A mediánnál nagyobb (vagy kisebb) értéket 50%-os valószínűséggel kapunk A mediánnál nagyobb értékek száma binomiális eloszlású valószínűségi változó, amelynek paraméterei: n = a minta elemszáma, p = 0.5 ha az elméleti érték megegyezik a mediánnal, akkor a nála nagyobb értékek száma ugyanilyen eloszlást követ a medián feltételezett elméleti értékénél nagyobb mintaelemek számának várhatóértéke, ha a nullhipotézis igaz, n/2
Egy konkrét példa a 10 elemű mintában 8 elem nagyobb, mint nulla. H0: az alapsokaság mediánja = 0 H1: az alapsokaság mediánja 0 Mekkora a valószínűsége, hogy hibázunk, ha elvetjük a nullhipotézist? Ha az Y=8 értéknél elvetjük a nullhipotézist, akkor még milyen értékeknél kell elvetnünk?
P(Y=0) = 0,1% P(Y=1) = 0,98% P(Y=2) = 4,39% P(Y=3) = 11,72% P(Y=4) = 20,51% P(Y=5) = 24,61% P(Y=10) = 0,1% P(Y=9) = 0,98% P(Y=8) = 4,39% P(Y=7) = 11,72% P(Y=6) = 20,51%
Egy- és kétoldali alternatív hipotézis Nullhipotézis: H0: az alapsokaság mediánja = 0 Kétoldali alternatív hipotézis: H1: az alapsokaság mediánja 0 Egyoldali alternatív hipotézis I.: H1: az alapsokaság mediánja > 0 ha Y=8-nál elvetem a nullhipotézist, akkor Y>8-nál is el kell vetnem Egyoldali alternatív hipotézis II.: H1: az alapsokaság mediánja < 0 ha Y=8-nál elvetem a nullhipotézist, akkor Y<8-nál is el kell vetnem
Mikor használható az egyoldali alternatív hipotézis? Ha a próba során használt adatoktól független forrásból származó információk alapján feltételezem, hogy csak az egyik irányú eltérés várható Független forrás lehet: elméletek (pl. vérnyomáscsökkentő gyógyszernél nem számítunk vérnyomás emelkedésre), mások korábbi vizsgálatai, saját elővizsgálataim, más adatokon (esetleg a gyűjtött adatok másik felén) végzett adatfeltárás.
Egymintás u próba
A próba célja az alapsokaság várhatóértékének az összehasonlítása egy elméleti értékkel a mintaátlag (az alapsokaság várhatóértékének becslése) alapján
A próba feltételei a valószínűségi változó normális eloszlású és ismert a szórása, vagyis a szórást nem a mintából becsüljük
A próba elméleti háttere Ha Y=N(m,s), akkor és
H0: m=m0 H1: mm0 Ha H0 igaz, akkor az valószínűségi változó standard normális eloszlású Az elsőfajú hiba valószínűsége:
Egy konrét példa Az adatok: 1.2; 3.6; 2.8; 0.7; 1.9 m0=2 s=1.2 Számítsátok ki az u statisztika értékét és a határozzátok meg az elsőfajú hiba valószínűségét! (R-script)
Mit jelent ha nem vetem el a nullhipotézist? ha a nullhipotézis igaz, akkor is kaphatok a próbastatisztikára ilyen nagy értéket NEM JELENTI, hogy a nullhipotézis igaz, sem azt, hogy az alternatív hipotézis nem igaz
Másodfajú hiba Annak valószínűsége, hogy nem vetem el a nullhipotézis, amikor az nem igaz Elkövetésének valószínűsége függ: a szignifikancia szinttől: minél alacsonyabb a szign. szint, annál valószínűbb, hogy elkövetem a másodfajú hibát (Szkülla és Kharübdisz) a minta elemszámától a nullhipotézistől való eltérés mértékétől: minél kisebb az eltérés, annál nehezebb észrevenni
Mi a teendő, ha nem vetem el a nullhipotézist? 1. verzió: eldöntöm, hogy mekkora eltérés az, ami már szakmailag értelmes, amit már ki akarok mutatni kiszámítom a másodfajú hiba valószínűségét ekkora eltérésnél ha ez egy előre megállapított értéknél kisebb, akkor elfogadom a nullhipotézist, egyébként a vizsgálat inkonkluzív (=a nullhipotézist sem elvetni, sem elfogadni nem tudom) inkonkluzív vizsgálatnál érdemes kiszámolni azt a mintaméretet, aminél már konklúzív lenne a vizsgálat
Mi a teendő, ha nem vetem el a nullhipotézist? 2. verzió: előre megállapítom a másodfajú hiba még elfogadható maximális szintjét megállapítom, hogy mekkora az a minimális eltérés a nullhipotézistől, amelynél a másodfajú hiba valószínűsége nem nagyobb az előre megállapított értéknél ezt az eltérést is figyelembe veszem az eredmények interpretációjánál, pl. 5%-os szignifikancia szinten az alapsokaság várhatóértéke nem különbözik nullától. Ha a különbség 0.1 vagy annál nagyobb lenne, a másodfajú hiba valószínűsége 10% alatt lenne, tehát valószínűsíthető, hogy ha van is eltérés, az nem jelentős.
A másodfajú hiba kiszámítása Bonyolultabb, mint az elsőfajú hibáé, ezért a számítási részleteket a további próbáknál nem részletezzük Az egy mintás u próbánál még viszonylag egyszerű, ezért itt részletesebben is megnézzük
Másodfajú hiba valószínűsége az egy mintás u próbánál 1. Pb=P(- ucrit < u<ucritH1 igaz) Ha az alternatív hipotézis igaz, akkor
Másodfajú hiba valószínűsége az egy mintás u próbánál 2. Legyen az ilyen paraméterű normális eloszlás eloszlásfüggvénye F Pb=F( ucrit)-F(-ucrit) Határozzátok meg a másodfajú hiba valószínűségét az előző példában, ha m1=2.1, m1=3, illetve m1=4