II. előadás
Konfidencia-intervallumok
Konfidencia-intervallumok Ha az alapsokaság egy ismeretlen paraméterére n elemű minta alapján becslést készítünk, akkor a valódi értéke csak közelítőleg lesz egyenlő a becsléssel ( pontbecslés ). Ha ismerjük, hogy a becsült milyen eloszlású, akkor meg tudunk adni olyan intervallumot, amely nagy valószínűséggel tartalmazza a valódi -t. Definíció. Az intervallumot az paraméter becslésére szolgáló (1 - )100 % megbízhatósági szintű konfidencia intervallumnak nevezzük, ha . Itt az 1 - magas 1-hez közeli valószínűséget jelent. Az meghatározásával intervallumbecslést adtunk -ra.
Konfidencia-intervallumok Tétel. Tegyük fel, hogy a normális eloszlású alapsokaság szórását ismerjük. Az alapsokaság m várható érétkét az n elemű minta átlagával becsüljük. Ekkor az m-re vonatkozó 1 - szintű konfidencia intervallum: , azaz , ahol N( 0, 1 ) eloszlású valószínűségi változó, amelyet a „t” eloszlás táblázatból is meghatározhatunk. ( , %) Példa: Kekszcsomagokat mérve a következőket kapjuk : 397,3; 399,6; 401,0; 392,9; 396,8; 400,0; 397,6; 392,1; 400,8; 400,6. Feltételezve , hogy a csomagokban található keksz tömege normális eloszlású σ = 10 szórással, határozza meg 95 %-os szignifikancia szinten a konfidencia intervallumot!
Konfidencia-intervallumok Tétel. Tegyük fel, hogy ismert egy normális eloszlású alapsokaságból vett n elemű minta átlaga és korrigált szórása. Ekkor az m-re vonatkozó 1 - valószínűségű konfidencia intervallum: , azaz , ahol Student eloszlású valószínűségi változó, amely nem csak az -tól, hanem a minta elemszámától ( pontosabban az f = n - 1 szabadsági foktól ) is függ. Adott n és esetén a értékét a Student-féle t eloszlás táblázatából kaphatjuk meg. Példa: Villanyégők élettartamát vizsgálva, azt normális eloszlásúnak találták. n = 15 égő élettartamát vizsgálva az élettartam átlaga órának, tapasztalati korrigált szórásnak óra adódott. 95%-os biztonsági szinten milyen konfidencia- intervallumba (megbízhatósági intervallumba) esik az egész sokaság várható értéke?
Statisztikai próbák
Statisztikai próbák Definíció. Egy vagy több valószínűség eloszlásra vonatkozó feltevést statisztikai hipotézisnek nevezünk. Definíció. Az olyan eljárást, amely alapján egy statisztikai hipotézisről döntünk, statisztikai próbának nevezzük. A statisztikai mintából a teljes statisztikai sokaságra különböző feltevéseket ( u. n. null hipotéziseket ) tehetünk. Például - feltehető-e a mintabeli becslés alapján, hogy a teljes sokaság egy paramétere valamely értéke, feltehető-e a mintabeli sűrűségfüggvény megszerkesztése alapján, hogy a teljes sokaság adott eloszlású, ... Ha a feltételezett hipotézis fennáll, akkor keresnünk kell olyan statisztikai függvényt ( próbastatisztikát ), amelynek az eloszlását ismerjük. Így az ismert eloszlásfüggvény alapján meghatározható egy olyan intervallum ( elfogadási tartomány ), amelybe (a hipotézis fennállása esetén ) a próbastatisztika nagy valószínűséggel beleesik, s amelyen kívüli intervallumba ( kritikus tartomány ) a statisztika csak igen kis valószínűséggel esik.
Statisztikai próbák Ezek alapján a statisztikai próba: - Ha a próbastatisztika mintából kapott értéke benne van az elfogadási tartományban, célszerű a hipotézis fennállását elfogadni, - ha a próbastatisztika mintából kapott értéke az elfogadási tartományon kívülre esik ( azaz a kritikus értékeken túl van ), célszerű a hipotézist elvetni. Kétféle módon tévedhetünk: - az igaz hipotézist elvetjük ( elsőfajú hiba ) - a hamis hipotézist elfogadjuk ( másodfajú hiba ) A döntési lehetőségek tehát:
Egymintás „t” próba Tétel. Ha egy normális eloszlású alapsokaságból vett n elemű minta átlagát és tapasztalati korrigált szórását ismerjük, ( de a teljes sokaság elméleti szórását nem ) akkor a teljes sokaság várható értékére vonatkozó hipotézisről az egymintás t-próbával a következőképpen döntünk. Ha , akkor az hipotézist elfogadjuk; egyébként elvetjük. A t Student eloszlású valószínűségi változó, így a kritikus értékét a Student-eloszlás táblázatából határozhatjuk meg, mégpedig az f = n - 1 szabadsági foknak megfelelő sorból és az általunk választott 1 - valószínűségi szintnek megfelelő oszlopból. Bizonyítás. Nincs.
Egymintás „t” próba Példa. Árammérőket úgy igazítanak be, hogy a mérőket együtt működtetik egy standard árammérővel. Beállítás után n = 10 árammérőt választottunk ki, és a szóban forgó árammérő egy jellemző paraméterét mértük. A standard árammérő paramétere 1. A mérési eredményeink: 0,895; 1,003; 0,996; 0,994; 1,002; 0,987; 0.993; 0,991; 1,004; 0,985. Kiszámítva a minta átlagát, 95% valószínűséggel véletlen az elméleti várható értéktől (m = 1) való eltérés, vagy szisztematikus? Megoldás: ; ; ; ; Mivel , ezért , azaz az eltérés nem szignifikáns!
Egymintás „u” próba Tétel. Tekintsünk egy normális eloszlású alapsokaságot, amelynek szórása . A sokaságból vett n elemű minta átlaga . Az hipotézist elfogadjuk, vagy elvetjük adott (1 - ) valószínűséggel, aszerint, hogy az , vagy , ahol -tól függő állandó. A kritikus értéket a normális eloszlás táblázatából, vagy a Student-féle t-eloszlás táblázatából ( ) kaphatjuk meg. Bizonyítás. Nincs.
Egymintás „u” próba Példa. Egy automata daraboló gép mm hosszú darabokat vág mm-es szórással. A hosszúság, mint valószínűségi változó normális eloszlású. Kiválasztunk véletlenszerűen n = 16 elemű mintát. A mintából kapott méretek: 1193, 1198, 1203, 1191, 1195, 1196, 1199, 1191, 1201, 1196, 1193, 1198, 1204, 1196, 1198, 1200. Elfogadható-e, hogy az eltérés nem jelentős ( nem szignifikáns ), vagyis az egész sokaságban a várható érték ? Megoldás. ; ; ; ; Mivel , ezért , azaz az eltérés szignifikáns.
Kétmintás F- és t-próba Ha két normális eloszlású alapsokaságból vett minta korrigált szórásait, valamint átlagait ismerjük, a következő kérdések merülhetnek fel: - Bár a minta korrigált szórásai nem egyeznek meg, , feltehető-e mégis, hogy a két teljes alapsokaságban a szórások megegyeznek, ? - Az ellenére feltételezhető-e mégis, hogy a teljes sokaságokban a várható érték megegyezik, ? Ezekre a kérdésekre ad választ a következő két tétel.
Kétmintás F- és t-próba Tétel. F-próba Két normális eloszlású alapsokaságból vett minta korrigált szórásai , átlagai . Ha a nagyobb empirikus szórásnégyzetet osztjuk a kisebb empirikus szórásnégyzettel, akkor az így kapott esetén a hipotézist elfogadjuk, különben elvetjük. A kritikus értéket az F-eloszlás táblázatából olvashatjuk ki, az ott leírt módon. A várható értékek egyezésének vizsgálatára csak az elméleti szórások egyezése esetén használhatjuk a következő próbát.
Kétmintás F- és t-próba Tétel. Kétmintás t-próba Az null hipotézis vizsgálatára tekintsük a következő próbastatisztikát: Ha , akkor az feltevést elfogadjuk, azaz eltérése nem szignifikáns, ellenkező esetben az feltevést elvetjük. Itt a kritikus értéket a Student-eloszlás táblázatában keressük, az szabadsági foknak megfelelő sorból, és az 1 - valószínűégi szinthez tartozó oszlopból.
Kétmintás F- és t-próba 1. Példa: Víz keménységi fokának megállapításához 2 különböző vizsgálatot végeztek. Az egyikben 11, a másikban 15 mintát vettek. Az eredmény a kalcium karbonát tartalom megadása volt, melynek varianciája az első esetben 94,6, a második méréssorozatnál pedig 36,8 volt. Az eltérés vajon szignifikáns-e? Megoldás. variancia = szórásnégyzet ( ) Mivel az , ezért Mivel .
Kétmintás F- és t-próba 2. Példa. Két gépsoron töltik a tejet zacskókba. Az egy óra alatt csomagolt mennyiségből 7 – 7- elemű mintát vettünk véletlenszerűen. A tej mennyiségét mértük a zacskókban. A kapott eredményeket mutatja a következő táblázat (mennyiség literben): Döntsük el, hogy nagy valószínűséggel (95%) van-e különbség a két gépsoron csomagolt zacskós tej zacskónkénti mennyisége között? Megoldás. Mivel , ezért az egész sokaságban a két szórás egyezése elfogadható.
Illeszkedésvizsgálat –próbával Azt, hogy az adott minta alapján az alapsokaság tekinthető-e ismert eloszlásúnak (normális, exponenciális stb. eloszlásúnak ), a tapasztalati és az elméleti sűrűségfüggvény összehasonlításával tudjuk eldönteni. A gyakorlati és az elméleti f sűrűségfüggvények illeszkedésére, vagyis annak eldöntésére, hogy tekinthető-e egy minta adott eloszlásúnak, szolgál az alábbi próba.
Illeszkedésvizsgálat –próbával diszkrét esetben Tétel. Egy n elemű minta alapján feltehető-e, hogy az egy adott eloszlásfüggvénnyel rendelkező eloszlásból származik? Null hipotézis: : ismeretlen ? Tekintsük a következő statisztikai függvényt: , ahol - az n megfigyelésből az érték előfordulási gyakorisága, - az érték bekövetkezési valószínűsége a feltételezett eloszlás alapján, r - a megfigyelt valószínűségi változó értékeinek száma. Csak akkor alkalmazható, ha minden i esetén ! Amennyiben , akkor a null hipotézist ( az eloszlás típusára tett feltevést) elfogadjuk, egyébként elvetjük. értékét táblázatból határozhatjuk meg:
Illeszkedésvizsgálat –próbával diszkrét esetben 1. Példa: Szabályos-e az a dobókocka, amellyel 600 dobást végezve a következő eredményeket kaptuk? Döntsünk 95% valószínűséggel! 2. Példa: 95% valószínűséggel származhatnak-e az alábbi adatok binomiális eloszlásból, ahol ? ( x az esemény, f a gyakoriság )
Illeszkedésvizsgálat –próbával diszkrét esetben Példa: 4 érmét 160-szor feldobva a „fej” dobások száma: fejek száma darabszám 0 5 1 35 2 67 3 41 4 12 Döntsük el, hogy 95% valószínűséggel szabályosak-e az érmék?
Illeszkedésvizsgálat –próbával folytonos esetben Tétel. Egy n elemű minta alapján feltehető-e, hogy az egy adott eloszlásfüggvénnyel rendelkező eloszlásból származik? Null hipotézis: : ismeretlen ? Tekintsük a következő statisztikai függvényt: , ahol - az i-edik intervallumba esés gyakorisága, - az i-edik intervallumba esés valószínűsége a feltételezett eloszlás alapján, r - a vizsgált intervallumok száma. Csak akkor alkalmazható, ha minden i esetén ! Amennyiben , akkor a null hipotézist ( az eloszlás típusára tett feltevést) elfogadjuk, egyébként elvetjük. értékét táblázatból határozhatjuk meg:
Illeszkedésvizsgálat –próbával folytonos esetben Példa: Egy automata egy heti termelését kívánjuk ellenőrizni. A legyártott 1500 db alkatrészt vizsgálva, az egyik méretének az elméleti mérettől való "x" eltérését mikronban az alábbi táblázat tartalmazza. Az előzetes mérések alapján a szórás 5 mikron. Vizsgáljuk meg, hogy a hiba eloszlása normális eloszlást követ-e?