Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaLídia Pappné Megváltozta több, mint 8 éve
1
Gazdaságstatisztika Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
2
Becslés vs hipotézisvizsgálat Következtető statisztikai eszközök Egy véletlen minta ismeretében hogyan lehet becslést adni annak a sokaságnak bizonyos jellemzőire, amelyből a minta származik. Várható érték becslése ismeretlen és ismert sokasági szórás esetén Sokasági variancia becslése Sokasági arány becslése De nem mindig erre van szükség: el kell döntenünk, hogy a rendelkezésre álló egy vagy több minta származhat-e meghatározott tulajdonságokkal rendelkező egy vagy több sokaságból vagy összehasonlítási célok mérlegelni kell, hogy a mintavétel eredménye alátámasztja vagy cáfolja a feltevésünket Kvantitatív módszerek
3
A hipotézisvizsgálat lényege A vizsgálandó sokaságra vonatkozó ismereteink gyakran hiányosak és/vagy bizonytalanok sejtésünket hipotézisként fogalmazzuk meg, amelynek igazságáról meg kell győződni Hipotézis: sokasággal (!!!) kapcsolatos feltevés, amely vonatkozhat A sokaság eloszlására A sokaság eloszlásának egy vagy több paraméterére Az állítások helyességéről kétféleképpen lehet meggyőződni: Teljes körű adatfelvételt végzünk Mintavétel eredményei alapján következtetünk MINTAVÉTELI INGADOZÁS, MINTAVÉTELI HIBA Hipotézisvizsgálat: a sokaságra vonatkozó feltevés mintavételi eredményekre támaszkodó vizsgálata. A hipotézisvizsgálat annak mérlegelése, hogy egy sokaságra vonatkozó állítás mennyire hihető a mintavétel eredményeinek tükrében.
4
1. lépés: a null- és alternatív hipotézisek megfogalmazása Nullhipotézis (H 0 ): az a sokaságra vonatkozó feltevés, amelynek igazságáról a hipotézisvizsgálat során közvetlenül meg kívánunk győződni. Alternatív (vagy ellen-) hipotézis (H 1 ): a nullhipotézissel együtt minden lehetőséget kimerítő, azzal egymást kölcsönösen kizáró hipotézis, amelynek helyességéről közvetetten döntünk a hipotézisvizsgálat során. A kettő közül azt fogjuk igaznak tekinteni, elfogadni, amelyik a mintavétel eredménye alapján hihetőbbnek tűnik a másiknál A hipotézisek megfogalmazásának szempontjai: Megválaszolható legyen a bennünket érdeklő kérdés Egymást kizárják Mindig a nullhipotézis helyességéről döntünk, de az arról való döntés egyben közvetett döntés az alternatív hipotézisről. A hipotézisvizsgálat lényeges kérdései
5
Példa Igaz-e, hogy egy őrölt kávét töltő gép az előírásoknak megfelelően átlagosan 1kg töltősúlyú csomagokat készít? A sokaság várható értékére vonatkozó feltevést szeretnénk vizsgálni A töltőtömeg némileg szóródik A töltés szisztematikusan nem tolódik-e el valamelyik irányba, mert az vagy veszteséget okoz a vállalatnak, vagy a vevőket károsítja meg A szórásról nem mond semmit! A nullhipotézis: H 0 : μ=1kg A lehetséges ellenhipotézisek: H 1 : (1) μ≠1kg; H 1 : (2) μ>1kg; H 1 : (3) μ<1kg
6
2. lépés: a próbafüggvény kiválasztása A hipotézisek vizsgálatára próbafüggvényt használunk: a mintából a sokaságra történő következtetést szolgálja A mintaelemek egy olyan függvénye, amelynek valószínűségi eloszlása a sokaság ismert tulajdonságait tekintetbe véve, a nullhipotézis igazságát feltételezve pontosan ismert. A próbafüggvényt eloszlásának ismerete teszi alkalmassá a nullhipotézis helyességének vizsgálatára: sokaság eloszlása, mintavétel módja, minta nagysága A próbafüggvények értékei mintáról mintára ingadozó jellemzők, azaz statisztikák. A próbafüggvények konstruálása elvi, matematikai feladat. A hipotézisvizsgálat lényeges kérdései
7
3. lépés: elfogadási és elutasítási (kritikus) tartomány kijelölése a próbafüggvény lehetséges értékeinek teljes tartományát két egymást át nem fedő részre bontjuk kritikus érték(ek) segítségével: elfogadási és elutasítási (kritikus) tartományra. A határt (a kritikus értékeket) úgy választjuk meg, hogy a próbafüggvény a nullhipotézis fennállása esetén előre megadott nagy ε valószínűséggel az elfogadási tartományba essen. Ha a próbafüggvénynek a rendelkezésünkre álló egy – esetleg több – minta adataiból számított értéke az elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist, ellenkező esetben elvetjük azt. A kritikus tartományba esés α valószínűségét szignifikancia szintnek nevezzük (1%-10% között) A hipotézisvizsgálat lényeges kérdései
8
Kritikus értékek: Az elfogadási és elutasítási tartományt egymástól elhatároló c a és c f értékeket alsó és felső kritikus értéknek szokás nevezni. A kritikus értékeket mindig a kritikus tartomány részének tekintjük. A kritikus tartomány kijelölésére kétoldali kritikus tartomány használata esetén két kritikus értékre, egyoldali kritikus tartomány esetén pedig egy kritikus értékre van szükség. A kritikus értékek a szignifikancia szint és a próbafüggvény eloszlásának ismeretében egyértelműen meghatározhatóak Speciális táblázatok Gazdaságstatisztika
9
Egyoldali kritikus tartomány Kritikus Elfogadási Kritikus érték α 1-α Bal oldali kritikus tartomány KritikusElfogadási Kritikus érték α 1-α Jobb oldali kritikus tartomány Bal vagy jobboldali kritikus tartomány kijelölése: eleve arra számítunk, hogy a valóság meghatározott irányú eltérést mutat egy általunk feltételezett helyzettől. ha csak valamilyen feltételezett vagy előírt állapottól való adott irányú eltérés igazán fontos a számunkra. A próbafüggvény mintából nyert értéke elég kicsi-e (elég nagy-e) ahhoz, hogy a nullhipotézis helyett az alternatív hipotézis fennállását legyen indokolt feltételezni. A teljes kritikus tartományt a próbafüggvény eloszlásának vagy csak a bal, vagy csak a jobb szélére tesszük.
10
Kétoldali kritikus tartomány kijelölése: csak a nullhipotézisben feltételezett helyzettől való eltérés ténye érdekel bennünket, és közömbös az eltérés iránya. A próbafüggvény értéke akár kisebb, akár nagyobb lehet, mint a nullhipotézis fennállásakor A kritikus tartományba esés teljes valószínűségét egyenlő arányban szokás megosztani a kritikus tartomány két része között. Kétoldali kritikus tartomány KritikusElfogadási Kritikus érték α/2 1-α Kritikus α/2 Kritikus érték Két oldali kritikus tartomány
11
1. A null- (H 0 ) és alternatív (H 1 ) hipotézisek megfogalmazása 2. Olyan próbafüggvény keresése, amelynek eloszlása a nullhipotézis helyességét feltételezve és a próba alkalmazási feltételeit figyelembe véve egyértelműen meghatározható. 3. A szignifikancia szint (α) megválasztása, és a próbafüggvény lehetséges értéktartományának felosztása elfogadási és elutasítási tartományra. 4. Mintavétel, ez alapján a próbafüggvény, mint valószínűségi változó számszerű értékének meghatározása. 5. Döntés a hipotézisek helyességéről: ha a próbafüggvény értéke az előre kijelölt elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist, Ha a próbafüggvény értéke az elutasítási tartományba esik, akkor elutasítjuk a nullhipotézist. A hipotézisvizsgálat lépései
12
Statisztikai próbák elve f( 2 ) 22 DF 2 krit 2 szám =1- P( 2 szám < 2 krit ( )|H 0 igaz) = 1- = DF 2
13
A hipotézisvizsgálat során elkövethető hibák Mintából következtetünk !!! Elsőfajú hiba ( ) Másodfajú hiba ( ) Minta-2 Minta-1 Minta-3 Hibát követhetünk el !!! H0H0 Döntés H 0 -ról a minta alapján Igaz Nem igaz Igaz Nem igaz Nincs hiba e Elsőfajú hiba A H 0 téves elvetése Másodfajú hiba A H 0 téves elfogadása Cél: a másodfajú hiba valószínűségének csökkentése (adott α mellett) Adott n mellett: ha α ↑ β ↓ ha α ↓ ↑ β ↑ Adott α mellett: ha n ↑ β ↓ ha próbafüggvény szórása ↓ β ↓
14
P-érték Az a legkisebb szignifikancia szint, amelyen a nullhipotézis épp elvethető az ellenhipotézissel szemben A próbafüggvény mintából nyert értékéhez tartozó szignifikancia szint. Ho-t elvetjük, ha a p≤α Ho-t elfogadjuk, ha a p>α
15
Példa Kávétöltési példa: a töltőgép normális eloszlás szerint tölti a csomagokat H 0 : μ=1kg H 1 : μ≠1kg Legyen egy n=16 elemű mintánk Gazdaságstatisztika
16
A próbák osztályozása Mi a nullhipotézisük tárgya: Paraméterre és eloszlásra irányuló próbák Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek: A paraméteres próbák alkalmazási feltételei között szerepelnek a sokasági eloszlás típusára, egyes paramétereire vonatkozó elvárások A nemparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásának folytonosságát követeli meg Hány és mekkora minta szükséges a végrehajtásukhoz: Egy, két vagy többmintás próbák Független és páros mintás próbák Kis- és nagymintás próbák (határ n=30)
17
Illeszkedésvizsgálat Arról döntünk, hogy valamely valószínűségi változó F (tapasztalati) eloszlása lehet-e adott F 0 (elméleti) eloszlásfüggvénnyel jellemzett eloszlás Minták száma: egymintás Alkalmazás feltétele: nagymintás, diszkrét és folytonos eloszlásokra egyaránt Hipotézisek: H 0 : F = F 0 H 1 : F ≠ F 0 A próbafüggvény: A próbafüggvény eloszlása: χ 2 eloszlás, DF=r-l-1 Típusai: tiszta és becsléses illeszkedésvizsgálat 17
18
Példa – diszkrét eloszlása A Tiszán egy adott időszakban levonuló árhullámok számát vizsgálva az elmúlt 68 év során az alábbi eredményeket kapták: 30 év volt, amikor nem volt árhullám, 25 olyan év volt, amikor 1 árhullám vonult le az adott időszakban, 9 év volt, amikor 2 és 4 olyan év volt, amikor 3 vagy több árhullám következett be. Feltehető-e, hogy a folyón levonuló árhullámok száma modellezhető Poisson-eloszlással? =? nem ismerjük a mintából kell becsülnünk Poisson-eloszlás esetén: M( )= (számtani átlaggal becsülhető) Mivel az elmúlt 68 év során a kérdéses időszakban összesen 55 árhullám volt: 55/68 0,8 Gazdaságstatisztika árhullámok száma 0123 v. több gyakoriság [db]302594
19
Nullhipotézis és alternatív hipotézis felállítása: H 0 = az árhullámok száma =0,8 paraméterű Poisson-eloszlású H 1 : az árhullámok száma nem =0,8 paraméterű Poisson-eloszlású Mintavétel, adatok feldolgozása, kritikus érték (elfogadási és elutasítási tartomány) meghatározása Poisson eloszlás táblázat =0,8 k=0 p 0 =0, 4493 k=1 p 1 =0,3595 k=2 p 2 =0,1438 k= 3 vagy annál több 1-(p 0 + p 1 + p 2 )=0,0474 Gazdaságstatisztika Példa – diszkrét eloszlása kf(k)pkpk 0300,4493 1250,3595 290,1438 3 v. több40,0474 681
20
Példa – diszkrét eloszlás Elméleti gyakoriságok meghatározása Kritikus érték: DF=r-l-1=4-1-1=2 =5% táblázatból: 2 elm. =5,99 Gazdaságstatisztika kf(k)pkpk 0300,4493 1250,3595 290,1438 3 v. több40,0474 681 kf(k)pkpk F(k) 0300,449330,55 1250,359524,45 290,14389,78 3 v. több40,04743,22 681
21
Példa – diszkrét eloszlás Számított érték: A számított és a kritikus érték összehasonlítása: 2 elm. =5,99 >> 2 sz =0,27 Döntés a nullhipotézisről: Mivel a számított érték az elfogadási tartományba esik –, ezért 95%-os megbízhatósági elfogadjuk a H 0 -t: a folyón levonuló árhullámok száma modellezhető =0,8 paraméterű Poisson-eloszlással. Gazdaságstatisztika kf(k)pkpk F(k) 0300,449330,55 1250,359524,45 290,14389,78 3 v. több40,04743,22 681
22
Példa – folytonos eloszlás A légi közlekedésben fontos figyelemmel kísérni az utasok átlagos testsúlyát, hogy egyrészt ne terheljék túl a gépet, másrészt ne utazzon a gép fölös kapacitással. Ezért időről időre ellenőrzik, hogy a felnőtt utasok testsúlya nem tér-e el a feltételezettől. A légitársaság a terhelést a 78kg-os átlagos testsúlyra és 11kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. 5%-os szignifikancia szint mellett teszteljük, hogy az utasok testsúlya normális eloszlású változó! A mintából kiszámított jellemzők: Megoldás: Becsléses illeszkedésvizsgálat Gazdaságstatisztika Testsúly (kg) Ügyfelek száma (fő) -607 60-7016 70-8032 80-9028 90-10013 100-4 Összesen100
23
Példa – folytonos eloszlás Hipotézisek: H 0 : az utasok tömege N(78,6;12,187) normális eloszlású H 1 : az utasok tömege nem N(78,6;12,187) normális eloszlású Mintavétel, adatok feldolgozása Gazdaságstatisztika Testsúly (kg) Ügyfelek száma (fő) - f i PiPi FiFi -607 60-7016 70-8032 80-9028 90-10013 100-4 Összesen100
24
Példa – folytonos eloszlás A P i valószínűségi értékek meghatározása Gazdaságstatisztika Testsúly (kg) Ügyfelek száma (fő) - f i PiPi FiFi -607 60-7016 70-8032 80-9028 90-10013 100-4 Összesen100 0,064255 0,1746 0,305 0,2826 0,1344 0,04 1
25
Példa – folytonos eloszlás Elméleti gyakoriságok meghatározása Gazdaságstatisztika Testsúly (kg) Ügyfelek száma (fő) - f i PiPi FiFi -607 0,064255 60-70160,1746 70-8032 0,305 80-9028 0,2826 90-10013 0,1344 100-4 0,04 Összesen100 ~1 6,4255 17,46 30,5 28,26 13,44 4 100
26
Példa – folytonos eloszlás A próbafüggvény értékének meghatározása: Gazdaságstatisztika Testsúly (kg) Ügyfelek száma (fő) - f i PiPi FiFi -6070,0642556,4255 60-70160,174617,46 70-80320,30530,5 80-90280,282628,26 90-100130,134413,44 100-40,044 Összesen100~1~100 0,0911 0,122 0,074 0,0024 0,0144 0 0,3038
27
Példa – folytonos eloszlás A kritikus érték meghatározása: DF=r-l-1=6-2-1=3 χ 2 krit =7,815 Számított és kritikus érték összevetése, döntés a nullhipotézisről: Mivel a számított érték (0,3038) kisebb, mint a kritikus érték (7,815), így a nullhipotézist 5%-os szignifikancia szinten elfogadjuk, azaz az utasok tömege N(78,6;12,187) normális eloszlású. Gazdaságstatisztika
28
Homogenitásvizsgálat Homogenitásvizsgálat segítségével eldönthetjük, hogy két valószínűségi változó azonos eloszlásúnak tekinthető-e. Minták száma: kétmintás Alkalmazás feltétele: nagymintás, a közösnek feltételezett eloszlásfüggvényre nincs kikötés Hipotézisek: H 0 : a vizsgált valószínűségi változók két sokaságon belüli eloszlása azonos H 1 : a vizsgált valószínűségi változók két sokaságon belüli eloszlása nem azonos A próbafüggvény: A próbafüggvény eloszlása: χ 2 eloszlás, DF=r-1 Eszköze: kontingencia táblázat
29
Kontingencia táblázat 29
30
Példa A személysérüléssel járó közúti balesetekre vonatkoznak az alábbi, mintavételből származó adatok 2003-ban. Hasonlítsuk össze a Budapesten és az ország többi részén történt balesetek idősávok szerinti eloszlását (α=1%)! Gazdaságstatisztika A baleset ideje a nap órái szerint Balesetek száma Budapesten Balesetek száma az ország többi részén 0-81427 8-122039 12-151934 15-182347 18-242453 Összesen100200
31
Példa Hipotézisek felállítása: H 0 : A balesetek idősávok szerinti eloszlása Budapesten és az ország többi részén megegyezik (H 0 : F BP = G egyéb ) H 1 : A balesetek idősávok szerinti eloszlása Budapesten és az ország többi részén nem egyezik (H 1 : F BP G egyéb ) Mintavétel, adatok feldolgozása: Kontingencia táblázat: Sor- és oszlopösszegek kiszámítása Elméleti gyakoriságok meghatározása Számított érték meghatározása Gazdaságstatisztika
32
Példa – kontingencia tábla A baleset ideje a nap órái szerint Balesetek száma Budapesten Balesetek száma az ország többi részén Peremgyakoriság (sorösszegek) 0-8 14 27 8-12 20 39 12-15 19 34 15-18 23 47 18-24 24 53 Peremgyakoriság (oszlopösszegek) Gazdaságstatisztika 100200 41 59 53 70 77 300 13,67 19,67 17,67 23,33 25,67 27,34 39,34 35,34 46,66 51,34
33
Példa Kritikus érték meghatározása: DF=r-1=5-1=4 α=1% χ 2 krit =13,277 Döntés a nullhipotézisről: Mivel a számított érték (0,29656) kisebb, mint a kritikus érték (13,277), így a nullhipotézist elfogadjuk, azaz 1%-os szignifikancia szinten elfogadható, hogy a balesetek óránkénti eloszlása Budapesten és az ország többi részén megegyezik. Gazdaságstatisztika
34
1. A null- (H 0 ) és alternatív (H 1 ) hipotézisek megfogalmazása 2. Olyan próbafüggvény keresése, amelynek eloszlása a nullhipotézis helyességét feltételezve és a próba alkalmazási feltételeit figyelembe véve egyértelműen meghatározható. 3. A szignifikancia szint (α) megválasztása, és a próbafüggvény lehetséges értéktartományának felosztása elfogadási és elutasítási tartományra. 4. Mintavétel, ez alapján a próbafüggvény, mint valószínűségi változó számszerű értékének meghatározása. 5. Döntés a hipotézisek helyességéről: ha a próbafüggvény értéke az előre kijelölt elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist, Ha a próbafüggvény értéke az elutasítási tartományba esik, akkor elutasítjuk a nullhipotézist. A hipotézisvizsgálat lépései
35
Hol tartunk? Nemparaméteres próbák: A sokaság eloszlásával kapcsolatos hipotézisek tesztelésére. 1. Illeszkedésvizsgálat: valamely valószínűségi változó F (tapasztalati) eloszlása lehet- e adott F 0 (elméleti) eloszlásfüggvénnyel jellemzett eloszlás 2. Homogenitásvizsgálat Homogenitásvizsgálat segítségével eldönthetjük, hogy két valószínűségi változó azonos eloszlásúnak tekinthető-e. 3. Függetlenségvizsgálat Gazdaságstatisztika
36
Függetlenségvizsgálat Két minőségi ismérv valamely adott sokaságon belül független-e egymástól. A minták száma: egymintás Alkalmazás feltétele: a kontingencia táblázat méretétől függően nagy minta Hipotézisek: H 0 : a két valószínűségi változó független egymástól (nincs sztochasztikus kapcsolat) H 1 : a két valószínűségi nem független egymástól (közöttük sztochasztikus vagy függvénykapcsolat van) A próbafüggvény: A próbafüggvény eloszlása: χ 2 eloszlás, DF=(r-1)(s-1) 36
37
Kontingencia táblázat 37
38
A minőségi ismérvek között kapcsolat szorossága a minőségi ismérvek közötti asszociációval vizsgálható Cramer-féle asszociációs együttható 0 és 1 közötti értéket vesz fel. Minél közelebb esik 1-hez, annál szorosabb a kapcsolat Minőségi ismérvek asszociációja q = min(r,s) 38
39
Példa Egy közvéleménykutatás során egyik gazdasági témájú TV- műsorról a következő kép alakult ki a diplomások körében: Tesztelje 5%-os szignifikancia szinten a foglalkozás jellege és a TV-műsor minősítése közötti kapcsolatot! Határozzuk meg az asszociációs együtthatót is, jellemezzük a kapcsolat szorosságát! Gazdaságstatisztika A nyilatkozó foglalkozása A műsor megítélése jómegfelelőrossz közgazdász100200100 jogász1006040 egyéb diplomás 1006040
40
Példa Hipotézisek felállítása: H 0 : A foglalkozás jellege és a TV-műsor minősítése független egymástól. H 1 : A foglalkozás jellege és a TV-műsor minősítése nem független egymástól. Mintavétel, adatfeldolgozás: Kontingencia táblázat elkészítése: Sor-, és oszlop peremgyakoriságok meghatározása Elméleti gyakoriságok kiszámítása Számított érték meghatározása Gazdaságstatisztika
41
Példa Gazdaságstatisztika A nyilatkozó foglalkozása A műsor megítélésePeremgyakori ságok (sorösszegek) jómegfelelőrossz közgazdász100200100 jogász1006040 egyéb diplomás1006040 Peremgyakoriságok (oszlopösszegek) 300 320 180 400 200 800 150 75 160 80 45 90
42
Példa Kritikus érték meghatározása: DF=(r-1)(s-1)=2∙2=4 α=5% χ 2 krit =9,488 Döntés a nullhipotézisről: Mivel a számított érték 55,53 nagyobb, mint a kritikus érték (9,488), így a nullhipotézist elutasítjuk, a foglalkozás és a TV műsor minősítése nem független egymástól. Gazdaságstatisztika
43
Példa Asszociációs együttható: n=800 2 szám =55,53 r=s=3 q=3 A diploma típusa és a TV-műsor megítélése, mint két minőségi ismérv között gyenge az asszociációs kapcsolat. Gazdaságstatisztika
44
Függetlenségvizsgálat PLUSZPONT SZERZÉSI LEHETŐSÉG – beadási lehetőség óra végén Közlekedésbiztonsági szervek 1000 személyi sérüléses közúti balesetet vizsgáltak meg aszerint, hogy milyen súlyos volt a baleset, és a sérült viselt-e biztonsági övet. A kapott eredmények: 1%-os szignifikancia szinten ellenőrizzük, hogy független-e a baleset kimenetele attól, hogy az illető viselt-e biztonsági övet! Gazdaságstatisztika BalesetÖvetÖsszesen viseltNem viselt Könnyű510120630 Súlyos120150270 Halálos7030100 Összesen7003001000 DF=(r-1)(s-1)
45
Gyakorló példa – Feladatgyűjtemény (23.) Egy termelési folyamatban 4 gép működik 3 műszakban. Véletlen mintát véve a hibás termékekből, gépek és műszakok szerint csoportosították azokat. Az eredményt az alábbi táblázat mutatja. Van-e kapcsolat a selejt nagysága szerint a gépek és műszakok között? (α=10%) Gazdaságstatisztika Műszak Gépek ABCD I.101189 II.1691311 III.129149
46
Megoldás Hipotézisek felállítása: H 0 : független egymástól a selejt nagysága szerint a gép és a műszak H 1 : nem független egymástól a selejt nagysága szerint a gép és a műszak Mintavétel, adatok feldolgozása: Kontingencia táblázat elkészítése Sor és oszlopösszegek (peremgyakoriságok számítása) Elméleti gyakoriságok számítása A próbafüggvény értékének kiszámítása Gazdaságstatisztika
47
Megoldás Gazdaságstatisztika Műszak Gépek Peremgyakoriság (sorösszeg) ABCD I. 10 1189 II. 16 91311 III. 12 9149 Perem- gyakoriságok (oszlopösszeg) 38 2935 29 38 49 44 131 11,023 14,21 12,76 8,41 10,85 9,74 11,76 13,1 10,15 10,85 9,74 8,41 χ 2 sz =0,095+0,7976+0,455+0,0414+0,2255+0,315+0,0007 63+0,002074+0,0453+0,05622+0,4267+0,05622=2,517
48
Megoldás Kritikus érték meghatározása: DF=(3-1)(4-1)=2∙3=6 α=10% χ 2 krit =10,645 Döntés a nullhipotézisről: Mivel a számított érték (2,517) kisebb, mint a kritikus érték (10,645), így a nullhipotézist elfogadjuk, a selejt nagysága szerint nincs kapcsolat a gép és a műszak között. Gazdaságstatisztika
49
Példa – Feladatgyűjtemény (24.) A Matematika I. és II. tárgyakból a zárthelyi dolgozatokban elért pontszámok eloszlását reprezentálja az alábbi minta: Hasonlítsuk össze 10%-os szignifikancia szinten a két tantárgy pontszám szerinti eloszlását! Gazdaságstatisztika PontszámokHallgatók száma (fő) Matematika I. Matematika II. 0-1033 10-20126 20-302939 30-405242 40-501420 Összesen110
50
Megoldás Hipotézisek: H 0 : a két tantárgy esetében elért pontszámok eloszlása azonos H 1 : a két tantárgy esetében elért pontszámok eloszlása nem azonos Mintavétel, adatok feldolgozása: Kontingencia táblázat elkészítése Sor és oszlopösszegek (peremgyakoriságok számítása) Elméleti gyakoriságok számítása A próbafüggvény értékének kiszámítása Gazdaságstatisztika
51
Megoldás Gazdaságstatisztika PontszámokHallgatók száma (fő) Perem- gyakoriság Matematika I. Matematika II. 0-10 3 3 10-20 12 6 20-30 29 39 30-40 52 42 40-50 14 20 Perem- gyakoriság 110 6 18 68 94 34 220 3 3 99 34 47 17
52
Megoldás Kritikus érték: DF=5-1=4 α=10% χ 2 krit =7,78 Döntés a nullhipotézisről: Mivel a számított érték (7,066) kisebb, mint a kritikus érték (7,78), így a nullhipotézist elfogadjuk, azonos a pontszámok eloszlása a két tárgy esetében. Gazdaságstatisztika
53
Példa – Feladatgyűjtemény (25.) Egy település rendőrkapitánya azt állítja, hogy az éjszakai betörések száma egyenletesen oszlik meg a hét napjain. Egyheti megfigyelés alapján a betörések száma az egyes napokon az alábbi volt: Ellenőrizzük 5%-os szignifikancia szinten, hogy elfogadható-e a rendőrkapitány állítása! Gazdaságstatisztika Nap Betörések száma Hétfő6 Kedd8 Szerda5 Csütörtök7 Péntek12 Szombat17 Vasárnap15 Összesen70
54
Megoldás Hipotézisek felállítása: H 0 : A betörések száma diszkrét egyenletes eloszlású H 1 : A betörések száma nem diszkrét egyenletes eloszlású Mintavétel, adatfeldolgozás: Elméleti gyakoriságok meghatározása Számított érték meghatározása Gazdaságstatisztika
55
Megoldás Nap Betörések száma (f i ) Elméleti gyakoriság (F i ) Hétfő6 Kedd8 Szerda5 Csütörtök7 Péntek12 Szombat17 Vasárnap15 Összesen70 Gazdaságstatisztika 10 70 1,6 0,4 2,5 0,9 0,4 4,9 2,5 13,2
56
Megoldás Kritikus érték: DF=7-1=6 α=5% χ 2 krit =12,592 Döntés a nullhipotézisről: Mivel a számított érték (13,2) nagyobb, mint a kritikus érték (12,592), így a nullhipotézist elutasítjuk, a betörések száma nem diszkrét egyenletes eloszlású. Gazdaságstatisztika
57
Példa – Feladatgyűjtemény (21.) Egy vállalatnál az átlagos heti túlóra-kifizetéseket vizsgálták. 80 véletlenszerűen kiválasztott dolgozó adatai alapján az átlagos túlóra-kifizetés az alábbi eloszlást mutatja: Leírhatók-e a heti túlóra-kifizetések normális eloszlással? (Legyen a szignifikancia szint 10%) Gazdaságstatisztika Heti túlórabér [font] munkások száma T < 119 1 T < 2 29 2 T < 5 17 5 T < 10 12 10 < T3
58
Megoldás Illeszkedésvizsgálat Hipotézisek felállítása H 0 : normális eloszlás N(?;?) H 1 : nem normális eloszlás Normális eloszlás paramétereinek becslése: H 0 : a heti túlóra kifizetés N(3,0;2,98) eloszlású H 1 : a heti túlóra kifizetés nem N(3,0;2,98) eloszlású Gazdaságstatisztika Heti túlórabér [font] munkások száma T < 119 1 T < 2 29 2 T < 5 17 5 T < 10 12 10 < T3 s*=2,98
59
Megoldás Kritikus érték meghatározása A becsült paraméterek száma: 2 =0,10DF=r-1-2=5-3=2 2 kr =4,61 Mintavétel, adatfeldolgozás Elméleti gyakoriságok meghatározása A próbafüggvény értékének meghatározása Gazdaságstatisztika Heti túlórabér [font] munkások száma (f i ) pipi Elméleti gyakoriságok (F i ) T < 119 1 T < 2 29 2 T < 5 17 5 T < 10 12 10 < T3
60
Megoldás Gazdaságstatisztika Heti túlórabér [font] munkások száma (f i ) pipi Elméleti gyakoriságok (F i ) T < 119 1 T < 2 29 2 T < 5 17 5 T < 10 12 10 < T3 0,251429 0,1155 0,3816 0,2423 0,00914 20,114 9,24 30,53 19,384 0,7312
61
Megoldás Gazdaságstatisztika Heti túlórabér [font] munkások száma (f i ) pipi Elméleti gyakoriságok (F i ) T < 119 1 T < 2 29 2 T < 5 17 5 T < 10 12 10 < T3 0,251429 0,1155 0,3816 0,2423 0,00914 20,114 9,24 30,53 19,384 0,7312 0,0617 42,26 6 1,3 Mivel a számított érték (49,622) nagyobb, mint a kritikus érték (4,91), így a nullhipotézist 10%-os szignifikancia szinten elutasítjuk, azaz a túlóra kifizetések nem írhatóak le N(3;2.98) paraméterű normális eloszlással.
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.