Hipotézis-ellenőrzés (Statisztikai próbák) Következtető statisztika 5. Hipotézis-ellenőrzés (Statisztikai próbák)
Hipotézis-vizsgálat Áttekintés Egymintás próbák Átlagra, arányra, Szórásra Egymintás nem paraméteres próbák Függetlenségvizsgálat Illeszkedésvizsgálat Egyenletes eloszlásra Normalitásra Kétmintás próbák: arányra (szórásra) Többmintás próba: ANOVA (Variancia-analízis)
Hipotézis-vizsgálat Bevezető példa: Eldöntendő kérdés (hipotézis): igaz-e, hogy az 50 g feliratú kávés zacskók átlagos tömege valóban 50 g? Mintavétel: n=100, mintaátlag 48 g, a minta (korrigált) szórása 3 g. Megoldás az átlag-becslés módszerével: Következtetés: A kapott intervallumba a hivatalos 50 g nem esik bele. A hipotézist nem fogadjuk el.
Megoldás a hipotézis-vizsgálat módszerével: 1) A hipotézisünk az, hogy a zacskók átlagos tömege 50 g. 2) Ha ez igaz, akkor a kifejezés értéke (jó közelítéssel) standard normál eloszlású. 3) Tehát a minta-átlag standardizált értékének 95 % valószínűséggel az [- 1,96; 1,96] intervallumba kellene esni. 4) A z függvény értéke Ez kívülesik a fenti [- 1,96; 1,96] intervallumon, tehát nagy valószínűséggel nem igaz a hipozézis!
A hipotézis-vizsgálat alapfogalmai a sokaság egy paraméterére vagy tulajdonságára vonatkozó feltevés, (amelynek a fennállását a minta alapján ellenőrizzük.) Null-hipotézis H0 Ellen-hipotézis (alternatív hipotézis) H1 Egyoldali és kétoldali próba Próba-fv: Olyan fv, amely a mintelemek értékéhez egy ismert eloszlású értéket (valószínűségi változót) rendel. (Azaz: egy mintából számolható olyan érték, amely mintáról mintára változik.)
Alapfogalmak (folyt.) Elfogadási tartomány: ha a nullhipotézis helytálló, akkor (adott megbízhatósági szinten) a próbafüggvény értéke ebbe a tartományba esik. Ha a próbafv értéke ide esik, akkor H0-t elfogadjuk. Elutasítási (kritikus tartomány): ha a próbafüggvény értéke ide esik, a nullhipotézist el kell vetnünk. Kritikus érték: az elfogadási és az elutasítási tartományt elválasztó érték (az elutasítási tartomány részének tekintjük).
Az egy- és kétoldali próba A null-hipotézis (H0) mindig egyenlőség Ha az alternatív hipotézis (H1) kétoldali próba nem egyenlő nagyobb jobboldali próba kisebb baloldali próba
Az átlagra vonatkozó hipotézis-ellenőrzés próbafüggvényei A sokaság NORM, A szórás ismert: Standard normális eloszlás t-eloszlású: (Szabadságfok: n-1 A sokaság Norm, A szórás nem ismert: Nagy n esetén a Student eloszlás helyett z eloszlás.
A statisztikai próba lépései és általános logikája A hipotézisek: H0 és H1 felállítása Próba-fv megválasztása és kiszámítása A kritikus érték(ek) meghatározása, és ezzel az elfogadási és elutasítási tartomány meghatározása adott a szignifikancia-szinten Ennek alapján döntés a hipotézisekről. Logika: Ha a 0-hipotézis igaz, akkor 95 % valószínűséggel a próba-fv értékének az elfogadási tartományba kell esnie. - Ha odaesik, nincs okunk kétségbe vonni a 0-hipotézist. - Ha nem esik bele, akkor viszont elutasítjuk a 0-hipotézist és az alternatíváját fogadjuk el.
A sokasági átlagra vonatkozó próba a) Hiptozésisek Vagy: Vagy: b) A próbafüggvény: Vagy: c) Kritikus érték (tábl.-ból): d) Következtetés:
PÉLDA A korábbi példa: Eldöntendő kérdés (hipotézis): igaz-e, hogy az 50 g feliratú kávés zacskók átlagos tömege valóban 50 g? Mintavétel: n=100, mintaátlag 48 g, a minta (korrigált) szórása 3 g.
Megoldás: Hipotézisek: H0: X = 50 H1: X ≠ 50 (Kétoldali) Próba-fv: Kritikus érték: a = 0,05 esetén za = - 1,96 és zf = 1,96 Következtetés: z értéke az elutasítási tartományba esett, H1-et fogadjuk el, H0-t elutasítjuk 5%-os szignifikancia szinten
Elkövethető hibák H0 hipotézist elfogadjuk elvetjük H0 hipotézis Igaz Helyes döntés Elsőfajú hiba Hamis Másodfajú hiba Márc.10 GM kersszt idáig. Zh idáig.
15. Példa Egy TV képcső típus átlagos élettartama a gyártó vállalat szerint 20 ezer óra. Az élettartam közelítőleg normáleloszlást követ. Egyszerű véletlen mintavétellel kiválasztott 25 képcső átlagos élettartama 19,4 ezer óra volt, az átlagtól való eltérés átlagosan 1,2 ezer óra. Állapítsa meg, van-e szignifikáns különbség a gyártó állítása és a megfigyelt élettartam között! (a = 0,05)
16. Példa Egy személygépkocsifajta átlagos fogyasztása a gyártó vállalat szerint 7 liter/100 km EV mintavétellel kiválasztott 25 gépkocsi átlagos fogyasztása 7,5 volt, az átlagtól való eltérés átlagosan 1,8 liter / 100 km volt. A sokasági eloszlás közelítőleg normálisnak tekinthető. Állapítsa meg, van-e szignifikáns különbség a gyártó állítása és a tényleges fogyasztás között! (a = 0,05)
Sokasági arányra vonatkozó próba Ha kisminta, akkor : Binomiális eloszlás Ha elég nagy a minta, és P és (1 – P) nem túl kicsi, akkor : Stand norm
A sokasági arányra vonatkozó próba a) Hiptozésisek Vagy: Vagy: b) A próbafüggvény: c) Kritikus érték (tábl.-ból): d) Következtetés:
17. Példa Egy új típusú TV készülékre vonatkozóan a fejlesztők és technológusok elvárása, hogy a készülékek maximum 10%-a fog garanciális javításra szorulni. Az új típus 300 kisérleti darabjából 26 db-ot kellett garanciális időszakban javítani. Ellenőrizze 5%-os szignifikancia szinten azt a hipotézist, hogy az új típusnál valóban 10% alatti a garanciális javítási arány!
18. Példa Egy mammut-cég dolgozóiból vett 400 fős mintából 140 fő válaszolta, hogy dohányzik. Az országos átlag 31 %. Ellenőrizze 5%-os szignifikancia szinten azt a hipotézist, hogy a cégnál a dohányosok aránya megegyezik az országos átlaggal! a cégnál a dohányosok aránya nagyobb, mint az országos átlag! Nincs-e ellentmondásban a két eredmény?
19. Példa Egy ember telepatikus képességét kell tesztelni. Azt állítja, hogy megérzi, hogy a szomszéd szobában fehér vagy feketeruhás egyén van. A kísérletet 100-szor elvégezve 60-szor talált. Elfogadjuk-e 2%-os szignifikancia szinten, hogy emberünk rendelkezik telepatikus képességgel? Elfogadjuk-e 5%-os szinten?
20. Példa Tesztelünk egy pénzérmét, szabályos-e 200-szor feldobtuk, 88-szor fej lett. Elfogadható-e az állítás, hogy szabályos az érme? 2008. Márc 31. idáig GM kerssztfélévesekkel
A szórásnégyzetre vonatkozó próba menete A Khi-négyzet próba feltétele: a sokasági eloszlás normális a) Hipotézisek: Szabadságfok: n -1 b) Próba-fv: c) Kritikus érték Jobboldali (táblázatból): Baloldali: Kétoldali: valószínűséghez tartozó érték d) Következtetés: …
Példa a szórásnégyzet tesztelésére Igaz-e, hogy a testmagasság sokasági szórása 15 cm? Véletlen minta, n = 100, s = 14 cm. A testmagasság normális eloszlású. a) Hipotézisek: b) Próba-fv: c) Kritikus érték (táblázatból): d) Következtetés:
Köszönöm a figyelmüket!