II. előadás.

Slides:



Advertisements
Hasonló előadás
Hipotézis-ellenőrzés (Statisztikai próbák)
Advertisements

I. előadás.
BECSLÉS A sokasági átlag becslése
Kvantitatív módszerek
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Nem-paraméteres eljárások, több csoport összehasonlítása
ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Készítette: Kosztyán Zsolt Tibor
Kvantitatív módszerek
Kvantitatív módszerek 8. Hipotézisvizsgálatok I. Nemparaméteres próbák Dr. Kövesi János.
Nemparaméteres próbák Statisztika II., 5. alkalom.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Az F-próba szignifikáns
Kvantitatív Módszerek
Kvantitatív módszerek
Valószínűségszámítás
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 18. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 14. előadás.
Gazdaságstatisztika 13. előadás.
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Következtető statisztika 9.
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Hipotézis vizsgálat.
t A kétoldalú statisztikai próba alapfogalmai
Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek.
I. előadás.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Valószínűségszámítás II.
Többdimenziós valószínűségi eloszlások

Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Kvantitatív módszerek
Konzultáció november 19. Nemparaméteres próbák, egymintás próbák
Paraméteres próbák- gyakorlat
Hipotézisvizsgálatok Paraméteres próbák
Kiváltott agyi jelek informatikai feldolgozása 2016
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
II. előadás.
Kvantitatív módszerek MBA és Számvitel mesterszak
Becsléselmélet - Konzultáció
Gazdaságstatisztika konzultáció
Kvantitatív módszerek
Nemparaméteres próbák
I. Előadás bgk. uni-obuda
III. zárthelyi dolgozat konzultáció
Hipotézisvizsgálatok Paraméteres próbák
Nemparaméteres próbák
Gazdaságinformatikus MSc
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
1.3. Hipotézisvizsgálat, statisztikai próbák
3. Varianciaanalízis (ANOVA)
Előadás másolata:

II. előadás

Konfidencia-intervallumok

Konfidencia-intervallumok Ha az alapsokaság egy ismeretlen  paraméterére n elemű minta alapján becslést készítünk, akkor a  valódi értéke csak közelítőleg lesz egyenlő a becsléssel   ( pontbecslés ). Ha ismerjük, hogy a becsült milyen eloszlású, akkor meg tudunk adni olyan intervallumot, amely nagy valószínűséggel tartalmazza a valódi -t. Definíció. Az intervallumot az  paraméter becslésére szolgáló (1 - )100 % megbízhatósági szintű konfidencia intervallumnak nevezzük, ha . Itt az 1 -  magas 1-hez közeli valószínűséget jelent. Az meghatározásával intervallumbecslést adtunk -ra.  

Konfidencia-intervallumok Tétel. Tegyük fel, hogy a normális eloszlású alapsokaság  szórását ismerjük. Az alapsokaság m várható érétkét az n elemű minta átlagával becsüljük. Ekkor az m-re vonatkozó 1 -  szintű konfidencia intervallum: , azaz , ahol N( 0, 1 ) eloszlású valószínűségi változó, amelyet a „t” eloszlás táblázatból is meghatározhatunk. ( , %) Példa: Kekszcsomagokat mérve a következőket kapjuk : 397,3; 399,6; 401,0; 392,9; 396,8; 400,0; 397,6; 392,1; 400,8; 400,6. Feltételezve , hogy a csomagokban található keksz tömege normális eloszlású σ = 10 szórással, határozza meg 95 %-os szignifikancia szinten a konfidencia intervallumot!

Konfidencia-intervallumok Tétel. Tegyük fel, hogy ismert egy normális eloszlású alapsokaságból vett n elemű minta átlaga és korrigált szórása. Ekkor az m-re vonatkozó 1 -  valószínűségű konfidencia intervallum: , azaz , ahol Student eloszlású valószínűségi változó, amely nem csak az  -tól, hanem a minta elemszámától ( pontosabban az f = n - 1 szabadsági foktól ) is függ. Adott n és  esetén a értékét a Student-féle t eloszlás táblázatából kaphatjuk meg. Példa: Villanyégők élettartamát vizsgálva, azt normális eloszlásúnak találták. n = 15 égő élettartamát vizsgálva az élettartam átlaga órának, tapasztalati korrigált szórásnak óra adódott. 95%-os biztonsági szinten milyen konfidencia- intervallumba (megbízhatósági intervallumba) esik az egész sokaság várható értéke?

Statisztikai próbák

Statisztikai próbák Definíció. Egy vagy több valószínűség eloszlásra vonatkozó feltevést statisztikai hipotézisnek nevezünk.   Definíció. Az olyan eljárást, amely alapján egy statisztikai hipotézisről döntünk, statisztikai próbának nevezzük. A statisztikai mintából a teljes statisztikai sokaságra különböző feltevéseket ( u. n. null hipotéziseket ) tehetünk. Például - feltehető-e a mintabeli becslés alapján, hogy a teljes sokaság egy paramétere valamely értéke, feltehető-e a mintabeli sűrűségfüggvény megszerkesztése alapján, hogy a teljes sokaság adott eloszlású, ... Ha a feltételezett hipotézis fennáll, akkor keresnünk kell olyan statisztikai függvényt ( próbastatisztikát ), amelynek az eloszlását ismerjük. Így az ismert eloszlásfüggvény alapján meghatározható egy olyan intervallum ( elfogadási tartomány ), amelybe (a hipotézis fennállása esetén ) a próbastatisztika nagy valószínűséggel beleesik, s amelyen kívüli intervallumba ( kritikus tartomány ) a statisztika csak igen kis valószínűséggel esik.

Statisztikai próbák Ezek alapján a statisztikai próba: - Ha a próbastatisztika mintából kapott értéke benne van az elfogadási tartományban, célszerű a hipotézis fennállását elfogadni, - ha a próbastatisztika mintából kapott értéke az elfogadási tartományon kívülre esik ( azaz a kritikus értékeken túl van ), célszerű a hipotézist elvetni.   Kétféle módon tévedhetünk: - az igaz hipotézist elvetjük ( elsőfajú hiba ) - a hamis hipotézist elfogadjuk ( másodfajú hiba ) A döntési lehetőségek tehát:

Egymintás „t” próba Tétel. Ha egy normális eloszlású alapsokaságból vett n elemű minta átlagát és tapasztalati korrigált szórását ismerjük, ( de a teljes sokaság elméleti  szórását nem ) akkor a teljes sokaság várható értékére vonatkozó hipotézisről az egymintás t-próbával a következőképpen döntünk. Ha , akkor az hipotézist elfogadjuk; egyébként elvetjük. A t Student eloszlású valószínűségi változó, így a kritikus értékét a Student-eloszlás táblázatából határozhatjuk meg, mégpedig az f = n - 1 szabadsági foknak megfelelő sorból és az általunk választott 1 -  valószínűségi szintnek megfelelő oszlopból. Bizonyítás. Nincs.

Egymintás „t” próba Példa. Árammérőket úgy igazítanak be, hogy a mérőket együtt működtetik egy standard árammérővel. Beállítás után n = 10 árammérőt választottunk ki, és a szóban forgó árammérő egy jellemző paraméterét mértük. A standard árammérő paramétere 1. A mérési eredményeink: 0,895; 1,003; 0,996; 0,994; 1,002; 0,987; 0.993; 0,991; 1,004; 0,985. Kiszámítva a minta átlagát, 95% valószínűséggel véletlen az elméleti várható értéktől (m = 1) való eltérés, vagy szisztematikus? Megoldás: ; ; ; ; Mivel , ezért , azaz az eltérés nem szignifikáns!

Egymintás „u” próba Tétel. Tekintsünk egy normális eloszlású alapsokaságot, amelynek szórása . A sokaságból vett n elemű minta átlaga . Az hipotézist elfogadjuk, vagy elvetjük adott (1 -  ) valószínűséggel, aszerint, hogy az , vagy , ahol -tól függő állandó. A kritikus értéket a normális eloszlás táblázatából, vagy a Student-féle t-eloszlás táblázatából ( ) kaphatjuk meg. Bizonyítás. Nincs.

Egymintás „u” próba Példa. Egy automata daraboló gép mm hosszú darabokat vág mm-es szórással. A hosszúság, mint valószínűségi változó normális eloszlású. Kiválasztunk véletlenszerűen n = 16 elemű mintát. A mintából kapott méretek: 1193, 1198, 1203, 1191, 1195, 1196, 1199, 1191, 1201, 1196, 1193, 1198, 1204, 1196, 1198, 1200. Elfogadható-e, hogy az eltérés nem jelentős ( nem szignifikáns ), vagyis az egész sokaságban a várható érték ? Megoldás. ; ; ; ; Mivel , ezért , azaz az eltérés szignifikáns.

Kétmintás F- és t-próba Ha két normális eloszlású alapsokaságból vett minta korrigált szórásait, valamint átlagait ismerjük, a következő kérdések merülhetnek fel: - Bár a minta korrigált szórásai nem egyeznek meg, , feltehető-e mégis, hogy a két teljes alapsokaságban a szórások megegyeznek, ? - Az ellenére feltételezhető-e mégis, hogy a teljes sokaságokban a várható érték megegyezik, ? Ezekre a kérdésekre ad választ a következő két tétel.

Kétmintás F- és t-próba Tétel. F-próba   Két normális eloszlású alapsokaságból vett minta korrigált szórásai , átlagai . Ha a nagyobb empirikus szórásnégyzetet osztjuk a kisebb empirikus szórásnégyzettel, akkor az így kapott esetén a hipotézist elfogadjuk, különben elvetjük. A kritikus értéket az F-eloszlás táblázatából olvashatjuk ki, az ott leírt módon. A várható értékek egyezésének vizsgálatára csak az elméleti szórások egyezése esetén használhatjuk a következő próbát.

Kétmintás F- és t-próba Tétel. Kétmintás t-próba Az null hipotézis vizsgálatára tekintsük a következő próbastatisztikát: Ha , akkor az feltevést elfogadjuk, azaz eltérése nem szignifikáns, ellenkező esetben az feltevést elvetjük. Itt a kritikus értéket a Student-eloszlás táblázatában keressük, az szabadsági foknak megfelelő sorból, és az 1 -  valószínűégi szinthez tartozó oszlopból.

Kétmintás F- és t-próba 1. Példa: Víz keménységi fokának megállapításához 2 különböző vizsgálatot végeztek. Az egyikben 11, a másikban 15 mintát vettek. Az eredmény a kalcium karbonát tartalom megadása volt, melynek varianciája az első esetben 94,6, a második méréssorozatnál pedig 36,8 volt. Az eltérés vajon szignifikáns-e? Megoldás. variancia = szórásnégyzet ( ) Mivel az , ezért Mivel .

Kétmintás F- és t-próba 2. Példa. Két gépsoron töltik a tejet zacskókba. Az egy óra alatt csomagolt mennyiségből 7 – 7- elemű mintát vettünk véletlenszerűen. A tej mennyiségét mértük a zacskókban. A kapott eredményeket mutatja a következő táblázat (mennyiség literben): Döntsük el, hogy nagy valószínűséggel (95%) van-e különbség a két gépsoron csomagolt zacskós tej zacskónkénti mennyisége között? Megoldás. Mivel , ezért az egész sokaságban a két szórás egyezése elfogadható.

Illeszkedésvizsgálat –próbával Azt, hogy az adott minta alapján az alapsokaság tekinthető-e ismert eloszlásúnak (normális, exponenciális stb. eloszlásúnak ), a tapasztalati és az elméleti sűrűségfüggvény összehasonlításával tudjuk eldönteni. A gyakorlati és az elméleti f sűrűségfüggvények illeszkedésére, vagyis annak eldöntésére, hogy tekinthető-e egy minta adott eloszlásúnak, szolgál az alábbi próba.

Illeszkedésvizsgálat –próbával diszkrét esetben Tétel. Egy n elemű minta alapján feltehető-e, hogy az egy adott eloszlásfüggvénnyel rendelkező eloszlásból származik? Null hipotézis: : ismeretlen ? Tekintsük a következő statisztikai függvényt: , ahol - az n megfigyelésből az érték előfordulási gyakorisága, - az érték bekövetkezési valószínűsége a feltételezett eloszlás alapján, r - a megfigyelt valószínűségi változó értékeinek száma. Csak akkor alkalmazható, ha minden i esetén ! Amennyiben , akkor a null hipotézist ( az eloszlás típusára tett feltevést) elfogadjuk, egyébként elvetjük. értékét táblázatból határozhatjuk meg:

Illeszkedésvizsgálat –próbával diszkrét esetben 1. Példa: Szabályos-e az a dobókocka, amellyel 600 dobást végezve a következő eredményeket kaptuk? Döntsünk 95% valószínűséggel! 2. Példa: 95% valószínűséggel származhatnak-e az alábbi adatok binomiális eloszlásból, ahol ? ( x az esemény, f a gyakoriság )