Gazdaságinformatikus MSc Paraméteres próbák Gazdaságinformatikus MSc
Dr Ketskeméty László előadása Statisztikai próbák I. 2018.12.28. Dr Ketskeméty László előadása
Statisztikai próbák II. Döntési eljárást dolgozunk ki annak eldöntésére, hogy a nullhipotézis igaz-e. Ha úgy kell döntenünk, hogy a nullhipotézis nem igaz, automatikusan az alternatív hipotézist fogjuk elfogadni. A döntésünkhöz szignifikancia szintet fogunk rendelni, amivel jellemezzük, hogy a nullhipotézisünk melletti döntés milyen erős. 2018.12.28. Dr Ketskeméty László előadása
Statisztikai próbák III. Paraméteres esetben: 2018.12.28. Dr Ketskeméty László előadása
Statisztikai próbák IV. 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Statisztikai próbák V. Elfogadási tartomány: Kritikus tartomány: Döntés: 2018.12.28. Dr Ketskeméty László előadása
Statisztikai próbák VI. Elsőfajú hibavalószínűség: Másodfajú hibavalószínűség: Akkor követjük el, ha igaz a nullhipotézis, de a mintrealizáció mégis a kritikus tartományba esik, és a döntésünk elutasító! Az elsőfajú hibavalószínűség , amit mi állítunk be! Akkor követjük el, ha elfogadjuk a nullhipotézist, holott valójában nem igaz. Értéke nehezebben állapítható meg. 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása (VALÓSZÍNŰSÉGI) VÁLTOZÓ Absztrakcióval nyert fogalom pl. SALARY Absztrakcióval nyert fogalom: A változóval azonos eloszlású, független változók halmaza STATISZTIKAI MINTA A változóra vonatkozó megfigyeléssorozat pl. az adatmátrix egy oszlopa MINTAREALIZÁCIÓ Logikai állítás egy vagy több változóra vonatkozóan pl. SALARY normális eloszlású NULLHIPOTÉZIS (H0 :) ALTERNATÍV HIPOTÉZIS (H1 :) Egy a H0 -val ellentétes állítás, legtöbbször H0 logikai tagadása pl. SALARY nem normális eloszlású A vizsgált változókra eleve elfogadott tulajdonságok pl. SALARY normális eloszlású ELŐZETES FELTEVÉSEK 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása A mintából számolt változó, melynek eloszlása a H0 feltételezése mellett pontosan (vagy legalább aszimptotikusan) megadható PRÓBASTATISZTIKA A próbastatisztika felvett értéke az adott mintarealizáció mellett SZÁMÍTOTT ÉRTÉK A felhasználó által beállított korlát, amelytől a próbastatisztika igen nagy valószínűséggel kisebb értéket kell, hogy felvegyen, ha H0 igaz KRITIKUS ÉRTÉK SZIGNIFIKANCIA-SZINT Olyan 0 és 1 közé eső érték, amely a nullhipotézis elfogadhatóságának mértékét adja meg. Minél közelebb van értéke az 1-hez, annál bizonyosabb a nullhipotézis teljesedése. Megegyezik az elsőfajú hiba- valószínűséggel STATISZTIKAI DÖNTÉS H0 -t elfogadjuk, ha a számított érték kisebb a kritikus értéknél. Ellenkező esetben H1 -t fogadjuk el 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása HELYES DÖNTÉS MÁSODFAJÚ HIBA ELSŐFAJÚ HIBA H0 IGAZ H1 IGAZ H1-et Fogad- juk el H0-at Elfogad- juk Döntés Valóság 2018.12.28. Dr Ketskeméty László előadása
A statisztikai hipotézisvizsgálat Eloszlás a nullhipotézis mellett A valódi eloszlás p Az első fajú hibava-, lószínűség. Általában 5-10%-ra választjuk (0) (δ) 2018.12.28. Dr Ketskeméty László előadása Másodfajú hibavalószínűség
A statisztikai hipotézisvizsgálat Eloszlás a nullhipotézis mellett A valódi eloszlás p Az elsőfajú hibava- lószínűség (kisebbre választva) (0) (δ) 2018.12.28. Dr Ketskeméty László előadása A másodfajú hibavalószínűség
A statisztikai hipotézisvizsgálat Az eloszlás a nullhipotézis mellett A valódi eloszlás p Az elsőfajú hibava-lószínűség (még kisebbre választva) (0) (δ) 2018.12.28. Dr Ketskeméty László előadása A másodfajú hibavalószínűség
A statisztikai hipotézisvizsgálat Az eloszlás a nullhipotézis mellett (még az előzőnél is nagyobb minta alapján) A valódi eloszlás (még az előzőnél is nagyobb minta alapján) p Az elsőfajú hibavalószínűség (0) (δ) A másodfajú hibavalószínűség 2018.12.28. Dr Ketskeméty László előadása
A statisztikai hipotézisvizsgálat Az eloszlás a nullhipotézis mellett (még nagyobb minta alapján) A valódi eloszlás (még nagyobb minta alapján) p Az elsőfajú hibavalószínűség (0) (δ) 2018.12.28. Dr Ketskeméty László előadása A másodfajú hibavalószínűség
Dr Ketskeméty László előadása Paraméteres próbák Az elemzett változó eloszlását ismertnek tételezzük fel, és a hipotézisünket az eloszlás paramétereire fogalmazzuk meg. Az SPSS-ben a normális eloszlás várható értékére és a varianciájára vonatkozó alábbi paraméteres próbák hajthatók végre: varianciára várható értékre t-próbák Bartlett-Box F-próba Egyszeres osztályozás 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása t-PRÓBÁK A próbastatisztika Student- (t-) eloszlású, ha a nullhipotézis igaz Egymintás t-próba H0 : A változó várható értéke megegyezik a tesztértékkel Két független mintás t-próba Meg kell különböztetni azt a két alesetet, amikor a minták varianciái egyenlőek attól, amikor különböznek ! Egy változó eseteit két csoportba csoportosítjuk egy tördelő változó segítségével H0 : A két változó várható értéke egyenlő Két összetartozó mintás t-próba H0 : A két változó várható értéke egyenlő 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása A 2-eloszlás 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása A 2-eloszlás 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása A Student-eloszlás 2018.12.28. Dr Ketskeméty László előadása
A Student-eloszlás sűrűségfüggvények szabadságfokkal 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása A Student-eloszlás 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Az F-eloszlás . 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Az F-eloszlás 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Az F-eloszlás 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása A Lukács-tétel 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Egymintás u-próba Feltétel: a normális eloszlású mintának ismerjük a szórását. DÖNTÉS: 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Egymintás t-próba DÖNTÉS: 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása A kétmintás u-próba Adottak az és az egymástól független statisztikai minták. A minták független normális eloszlásúak, a szórásaik ismertek. 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása A kétmintás u-próba Ha feltesszük, hogy a nullhipotézis igaz, akkor DÖNTÉS: -t elfogadjuk 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Kétmintás t-próba (független minták) A minták szórásai egyenlőeknek tekintendők. Különben nem alkalmazható a próba. Ennek ellenőrzése F-próbával. DÖNTÉS: 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása F-próba X1,X2,…,Xn N(X,X ) és Y1,Y2,…Ym N(Y,Y) egymástól független normális eloszlású statisztikai minták, X és Y nem ismert . Ha feltesszük, hogy a nullhipotézis igaz, akkor igaz lesz, hogy 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása A Welch-próba I. Ha az F-próbát el kell vetnünk, nem alkalmazható a két független mintás t-próba a két minta várható értékei egyezésének ellenőrzésére. Erre az esetre dolgozta ki Welch a most ismertetendő robusztus próbát: X1,X2,…,Xn N(X,X ) és Y1,Y2,…Ym N(Y,Y) egymástól független normális eloszlású statisztikai minták, X és Y nem ismert . 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása A Welch-próba II. Megmutatható, hogy a nullhipotézis fennállása esetén a próbastatisztika közelítőleg Student-eloszlású [f] (egészrész f) szabadságfokkal, ahol 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Kétmintás t-próba (összetartozó minták) DÖNTÉS: 2018.12.28. Dr Ketskeméty László előadása
Példa egymintás t-próbára A world 95 állományban ellenőrizzük, hogy Magyarországon a nők és a férfiak várható életkora megfelel-e a világátlagnak, vagy annál alacsonyabb/magasabb-e! Magyarországon a várható élettartam a nőknél 76 a férfiaknál 67! 2018.12.28. Dr Ketskeméty László előadása
Példa egymintás t-próbára A magyar nők várható élettartamát állítjuk be tesztértéknek. 2018.12.28. Dr Ketskeméty László előadása
Példa egymintás t-próbára Magyarországot nem számítva az átlag 70,1 Mivel a világátlag-magyarországi élettartam különbség szignifikánsan negatív, megállapíthatjuk, hogy nálunk tovább élnek a nők, mint a világban átlagosan! A t-próba szignifikancia-szintje zérus, így elutasítjuk a nullhipotézist, hogy a világban átlagosan olyan hosszan élnek a nők, mint nálunk! 2018.12.28. Dr Ketskeméty László előadása
Példa egymintás t-próbára A férfiak esetében a várható élettartam csak 67. 2018.12.28. Dr Ketskeméty László előadása
Példa egymintás t-próbára Mivel a világátlag-magyarországi élettartam különbség szignifikánsan negatív, megállapíthatjuk, hogy nálunk tovább élnek a férfiak is, mint a világban átlagosan! Magyarországot nem számítva az átlag 64,9 A t-próba szignifikancia-szintje itt ugyan nem zérus, de így is elutasítjuk a nullhipotézist, hogy a világban átlagosan olyan hosszan élnek a férfiak, mint nálunk! 2018.12.28. Dr Ketskeméty László előadása
Példa független kétmintás t-próbára Hasonlítsuk össze az afrikai országok férfiainak várható élettartamát a dél-amerikai országok férfilakosainak várható élettartamával! Elfogadható-e az a nullhipotézis, hogy a két földrészen ugyanannyi ideig élnek a férfiak? 2018.12.28. Dr Ketskeméty László előadása
Példa független kétmintás t-próbára 2018.12.28. Dr Ketskeméty László előadása
Példa független kétmintás t-próbára A varianciák egyezésére vonatkozó tesztet elfogadjuk, tehát az első sort kell tekintenünk! 2018.12.28. Dr Ketskeméty László előadása
Példa független kétmintás t-próbára A szignifikancia-szit zérus, így a nullhipotézist el kell vetnünk! Mivel az afrikai élettartam a kisebb átlagosan 15 évvel, ezért megállapíthatjuk, hogy Latin Amerikában szignifikánsan tovább élnek a férfiak! 2018.12.28. Dr Ketskeméty László előadása
Példa párosított kétmintás t-próbára Vizsgáljuk meg, hogy a férfiak-nők várható élettartama és olvasottsága azonosnak tekinthető-e az adatok alapján! 2018.12.28. Dr Ketskeméty László előadása
Példa párosított kétmintás t-próbára 2018.12.28. Dr Ketskeméty László előadása
Példa párosított kétmintás t-próbára 2018.12.28. Dr Ketskeméty László előadása
Példa párosított kétmintás t-próbára Az átlagok különbsége az élettartam esetén a nők felé, olvasottság esetén a férfiak felé billen! 2018.12.28. Dr Ketskeméty László előadása
Példa párosított kétmintás t-próbára Mindkét elemzéskor el kell vetnünk a nullhipotézist! A nők szignifikánsabban tovább élnek a férfiaknál, viszont a férfiak olvasottsága szignifikánsabban magasabb a nőkénél! 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Egyszeres osztályozás (One-way ANOVA) Az egyes csoportok várható értékei különbségére konfidencia intervallum szerkeszthető. A különbség valódi értéke a beállított valószínűséggel ebbe az intervallumba esik. H0 : A változók várható értékei azonosak A mintarealizációt egy tördelő változó értékei szerint kettőnél több csoportra osztjuk. A módszer a független mintás t-próba kiterjesztése kettőnél nagyobb esetre. H1 : Van két olyan változó, melyek várható értékei különböznek Fisher-féle F-próba A próbastatisztika eloszlása a nullhipotézis fennállása esetén F-eloszlású. H0 : A változók varianciái egyenlőek Bartlett-Box-próba A próbastatisztika eloszlása a nullhipotézis fennállása esetén F-eloszlású. Az F-próba kiterjesztése. H0 : A kettőnél több változó varianciái egyenlőek Levene-próba Ez nem paraméteres próba! Nincs előzetes feltevés a változók normalitására vonatkozóan! H0 : A kettőnél több változó varianciái egyenlőek 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Egyszeres osztályozás X A dolgozó fizetése Y A dolgozó beosztása (tisztviselő, őrző-védő, menedzser) 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Egyszeres osztályozás Csoportátlagok: Négyzetösszegek: 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Egyszeres osztályozás F-eloszlású (2, n-3) Student (n-3) 2018.12.28. Dr Ketskeméty László előadása
Példa egyszeres osztályozásra Vizsgáljuk meg, hogy a férfi várható élettartamok egyenlőek-e a különböző régiókban! 2018.12.28. Dr Ketskeméty László előadása
Példa egyszeres osztályozásra 2018.12.28. Dr Ketskeméty László előadása
Példa egyszeres osztályozásra A régiókban a varianciák nem tekinthetők egyenlőnek! Az élettartamok egyezésére vonatkozó nullhipotézist el kell evtnünk! 2018.12.28. Dr Ketskeméty László előadása
Példa egyszeres osztályozásra A Levene-próba arra utalt, hogy a varianciák nem egyenlőek a régiók között! 2018.12.28. Dr Ketskeméty László előadása
Példa egyszeres osztályozásra A *-gal megjelölt pároknál van szignifikáns differencia! 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Bartlett-próba Adott p normális eloszlású minta, amik függetlenek egymástól. Az a nulhipotézisünk, hogy a minták szórásai nem különböznek egymástól: A próbastatisztika most: ahol Megmutatható, hogy ha H0 fennáll, akkor B eloszlása p-1 szabadságfokú 2- eloszlást (Chi-négyzet) követ. 2018.12.28. Dr Ketskeméty László előadása
Dr Ketskeméty László előadása Összefoglalás 2018.12.28. Dr Ketskeméty László előadása