Gazdaságstatisztika Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák.

Slides:



Advertisements
Hasonló előadás
Gazdaságstatisztika Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák november 6. és november 13.
Advertisements

Az új közbeszerzési törvény megalkotásának körülményei, várható jövőbeli változások május 26. Dr. Kovács László Miniszterelnökség Közbeszerzési Szabályozási.
Gazdaság- statisztika 4. konzultáció Hipotézisvizsgálatok Árva Gábor PhD Hallgató.
Gazdaságstatisztika, 2015 RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA Gazdaságstatisztika október 20.
Becsléselmélet - gyakorlat október 14.. Példa 1 - Feladatgyűjtemény Egy nagyvállalat személyzeti osztályvezetője azt gyanítja, hogy különbség van.
A vállalatok marketingtevékenysége és a Magyar Marketing Szövetség megítélése Kutatási eredmények az MMSZ részére (2008. július)
Kvantitatív módszerek Becsléselmélet október 7. és 9.
Kvantitatív módszerek Hipotézisvizsgálatok - Nemparaméteres próbák október 16.
Paraméteres próbák- konzultáció október 21..
BEST-INVEST Független Biztosításközvetítő Kft.. Összes biztosítási díjbevétel 2004 (600 Mrd Ft)
Gazdasági jog IV. Előadás Egyes társasági formák Közkeresleti társaság, betéti társaság.
TEROTECHNOLÓGIA Az állóeszközök újratermelési folyamata.
Kockázat és megbízhatóság
tananyag =előadások és gyakorlatok anyaga (írott és elmondott is)
Valószínűségi kísérletek
Bevezetés Biometria I. Molnár Péter Állattani Tanszék
Muraközy Balázs: Mely vállalatok válnak gazellává?
2. előadás Viszonyszámok
Leíró statisztika Becslés
Becslés gyakorlat november 3.
Mintavétel és becslés október 25. és 27.
A Repülésbiztonsági Kockázat
Kvantitatív módszerek
A közigazgatással foglalkozó tudományok
Kockázat és megbízhatóság
Egy üzemben sok gyártósoron gyártanak egy bizonyos elektronikai alkatrészt. Az alkatrészek ellenállását időnként ellenőrzik úgy, hogy egy munkás odamegy.
Kockázat és megbízhatóság
Szigorlati felkészítő Kvantitatív módszerek
Mintavétel és becslés október 27. és 29.
Becsléselmélet - Konzultáció
Kockázat és megbízhatóság
Mintavételes eljárások
Kockázat és megbízhatóság
Kvantitatív módszerek
Hipotézisvizsgálat.
Kockázat és megbízhatóság
Kvantitatív módszerek
Mintavételes eljárások
Nemparaméteres próbák 2.
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
V. Optimális portfóliók
Gazdaságstatisztika Korreláció- és regressziószámítás II.
Geostatisztika prof. Geresdi István szoba szám: E537.
Tartalékolás 1.
MINTAVÉTEL, LEÍRÓ STATISZTIKAI MUTATÓSZÁMOK
Összefüggés vizsgálatok
Varianciaanalízis- ANOVA (Analyze Of VAriance)
Kvantitatív módszerek
Kvantitatív módszerek
Kvantitatív módszerek
Business Mathematics
Regressziós modellek Regressziószámítás.
STRUKTURÁLT SERVEZETEK: funkció, teljesítmény és megbízhatóság
Sztochasztikus kapcsolatok I. Asszociáció
3, u-próba, t-próba Kemometria 2016/2017 3, u-próba, t-próba
Dr. Varga Beatrix egy. docens
2010. I-IV. hónap közlekedési baleseti statisztikája,
Új pályainformációs eszközök - filmek
Matematikai statisztika előadó: Ketskeméty László
Gazdaságinformatikus MSc
3. előadás.
A Közbeszerzési Döntőbizottság tapasztalatai Dr
SZAKKÉPZÉSI ÖNÉRTÉKELÉSI MODELL I. HELYZETFELMÉRŐ SZINT FOLYAMATA 8
Dr. Varga Beatrix egyetemi docens
Paraméteres próbák Adatelemzés.
Kísérlettervezés 2018/19.
3. előadás.
Hipotéziselmélet Adatelemzés.
Mintavételes eljárások
Vargha András KRE és ELTE, Pszichológiai Intézet
Előadás másolata:

Gazdaságstatisztika Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák

Becslés vs hipotézisvizsgálat  Következtető statisztikai eszközök  Egy véletlen minta ismeretében hogyan lehet becslést adni annak a sokaságnak bizonyos jellemzőire, amelyből a minta származik.  Várható érték becslése ismeretlen és ismert sokasági szórás esetén  Sokasági variancia becslése  Sokasági arány becslése  De nem mindig erre van szükség:  el kell döntenünk, hogy a rendelkezésre álló egy vagy több minta származhat-e meghatározott tulajdonságokkal rendelkező egy vagy több sokaságból vagy  összehasonlítási célok  mérlegelni kell, hogy a mintavétel eredménye alátámasztja vagy cáfolja a feltevésünket Kvantitatív módszerek

A hipotézisvizsgálat lényege  A vizsgálandó sokaságra vonatkozó ismereteink gyakran hiányosak és/vagy bizonytalanok  sejtésünket hipotézisként fogalmazzuk meg, amelynek igazságáról meg kell győződni  Hipotézis: sokasággal (!!!) kapcsolatos feltevés, amely vonatkozhat  A sokaság eloszlására  A sokaság eloszlásának egy vagy több paraméterére  Az állítások helyességéről kétféleképpen lehet meggyőződni: Teljes körű adatfelvételt végzünk Mintavétel eredményei alapján következtetünk MINTAVÉTELI INGADOZÁS, MINTAVÉTELI HIBA  Hipotézisvizsgálat: a sokaságra vonatkozó feltevés mintavételi eredményekre támaszkodó vizsgálata. A hipotézisvizsgálat annak mérlegelése, hogy egy sokaságra vonatkozó állítás mennyire hihető a mintavétel eredményeinek tükrében.

 1. lépés: a null- és alternatív hipotézisek megfogalmazása  Nullhipotézis (H 0 ): az a sokaságra vonatkozó feltevés, amelynek igazságáról a hipotézisvizsgálat során közvetlenül meg kívánunk győződni.  Alternatív (vagy ellen-) hipotézis (H 1 ): a nullhipotézissel együtt minden lehetőséget kimerítő, azzal egymást kölcsönösen kizáró hipotézis, amelynek helyességéről közvetetten döntünk a hipotézisvizsgálat során.  A kettő közül azt fogjuk igaznak tekinteni, elfogadni, amelyik a mintavétel eredménye alapján hihetőbbnek tűnik a másiknál  A hipotézisek megfogalmazásának szempontjai: Megválaszolható legyen a bennünket érdeklő kérdés Egymást kizárják Mindig a nullhipotézis helyességéről döntünk, de az arról való döntés egyben közvetett döntés az alternatív hipotézisről. A hipotézisvizsgálat lényeges kérdései

Példa Igaz-e, hogy egy őrölt kávét töltő gép az előírásoknak megfelelően átlagosan 1kg töltősúlyú csomagokat készít?  A sokaság várható értékére vonatkozó feltevést szeretnénk vizsgálni  A töltőtömeg némileg szóródik  A töltés szisztematikusan nem tolódik-e el valamelyik irányba, mert az vagy veszteséget okoz a vállalatnak, vagy a vevőket károsítja meg  A szórásról nem mond semmit!  A nullhipotézis:  H 0 : μ=1kg  A lehetséges ellenhipotézisek:  H 1 : (1) μ≠1kg;  H 1 : (2) μ>1kg;  H 1 : (3) μ<1kg

 2. lépés: a próbafüggvény kiválasztása  A hipotézisek vizsgálatára próbafüggvényt használunk: a mintából a sokaságra történő következtetést szolgálja  A mintaelemek egy olyan függvénye, amelynek valószínűségi eloszlása a sokaság ismert tulajdonságait tekintetbe véve, a nullhipotézis igazságát feltételezve pontosan ismert.  A próbafüggvényt eloszlásának ismerete teszi alkalmassá a nullhipotézis helyességének vizsgálatára: sokaság eloszlása, mintavétel módja, minta nagysága  A próbafüggvények értékei mintáról mintára ingadozó jellemzők, azaz statisztikák.  A próbafüggvények konstruálása elvi, matematikai feladat. A hipotézisvizsgálat lényeges kérdései

 3. lépés: elfogadási és elutasítási (kritikus) tartomány kijelölése  a próbafüggvény lehetséges értékeinek teljes tartományát két egymást át nem fedő részre bontjuk kritikus érték(ek) segítségével: elfogadási és elutasítási (kritikus) tartományra.  A határt (a kritikus értékeket) úgy választjuk meg, hogy a próbafüggvény a nullhipotézis fennállása esetén előre megadott nagy ε valószínűséggel az elfogadási tartományba essen.  Ha a próbafüggvénynek a rendelkezésünkre álló egy – esetleg több – minta adataiból számított értéke az elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist, ellenkező esetben elvetjük azt.  A kritikus tartományba esés α valószínűségét szignifikancia szintnek nevezzük (1%-10% között) A hipotézisvizsgálat lényeges kérdései

 Kritikus értékek:  Az elfogadási és elutasítási tartományt egymástól elhatároló c a és c f értékeket alsó és felső kritikus értéknek szokás nevezni.  A kritikus értékeket mindig a kritikus tartomány részének tekintjük.  A kritikus tartomány kijelölésére kétoldali kritikus tartomány használata esetén két kritikus értékre, egyoldali kritikus tartomány esetén pedig egy kritikus értékre van szükség.  A kritikus értékek a szignifikancia szint és a próbafüggvény eloszlásának ismeretében egyértelműen meghatározhatóak  Speciális táblázatok Gazdaságstatisztika

Egyoldali kritikus tartomány Kritikus Elfogadási Kritikus érték α 1-α Bal oldali kritikus tartomány KritikusElfogadási Kritikus érték α 1-α Jobb oldali kritikus tartomány  Bal vagy jobboldali kritikus tartomány kijelölése:  eleve arra számítunk, hogy a valóság meghatározott irányú eltérést mutat egy általunk feltételezett helyzettől.  ha csak valamilyen feltételezett vagy előírt állapottól való adott irányú eltérés igazán fontos a számunkra.  A próbafüggvény mintából nyert értéke elég kicsi-e (elég nagy-e) ahhoz, hogy a nullhipotézis helyett az alternatív hipotézis fennállását legyen indokolt feltételezni.  A teljes kritikus tartományt a próbafüggvény eloszlásának vagy csak a bal, vagy csak a jobb szélére tesszük.

 Kétoldali kritikus tartomány kijelölése:  csak a nullhipotézisben feltételezett helyzettől való eltérés ténye érdekel bennünket, és közömbös az eltérés iránya.  A próbafüggvény értéke akár kisebb, akár nagyobb lehet, mint a nullhipotézis fennállásakor  A kritikus tartományba esés teljes valószínűségét egyenlő arányban szokás megosztani a kritikus tartomány két része között. Kétoldali kritikus tartomány KritikusElfogadási Kritikus érték α/2 1-α Kritikus α/2 Kritikus érték Két oldali kritikus tartomány

1. A null- (H 0 ) és alternatív (H 1 ) hipotézisek megfogalmazása 2. Olyan próbafüggvény keresése, amelynek eloszlása a nullhipotézis helyességét feltételezve és a próba alkalmazási feltételeit figyelembe véve egyértelműen meghatározható. 3. A szignifikancia szint (α) megválasztása, és a próbafüggvény lehetséges értéktartományának felosztása elfogadási és elutasítási tartományra. 4. Mintavétel, ez alapján a próbafüggvény, mint valószínűségi változó számszerű értékének meghatározása. 5. Döntés a hipotézisek helyességéről:  ha a próbafüggvény értéke az előre kijelölt elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist,  Ha a próbafüggvény értéke az elutasítási tartományba esik, akkor elutasítjuk a nullhipotézist. A hipotézisvizsgálat lépései

Statisztikai próbák elve f(  2 ) 22 DF   2 krit  2 szám  =1-  P(  2 szám <  2 krit (  )|H 0 igaz) = 1-  =  DF 2

A hipotézisvizsgálat során elkövethető hibák Mintából következtetünk !!! Elsőfajú hiba (  ) Másodfajú hiba (  ) Minta-2 Minta-1 Minta-3 Hibát követhetünk el !!! H0H0 Döntés H 0 -ról a minta alapján Igaz Nem igaz Igaz Nem igaz Nincs hiba  e Elsőfajú hiba  A H 0 téves elvetése Másodfajú hiba  A H 0 téves elfogadása  Cél: a másodfajú hiba valószínűségének csökkentése (adott α mellett) Adott n mellett: ha α ↑  β ↓ ha α ↓ ↑  β ↑ Adott α mellett: ha n ↑  β ↓ ha próbafüggvény szórása ↓  β ↓

P-érték  Az a legkisebb szignifikancia szint, amelyen a nullhipotézis épp elvethető az ellenhipotézissel szemben  A próbafüggvény mintából nyert értékéhez tartozó szignifikancia szint.  Ho-t elvetjük, ha a p≤α  Ho-t elfogadjuk, ha a p>α

Példa Kávétöltési példa: a töltőgép normális eloszlás szerint tölti a csomagokat  H 0 : μ=1kg  H 1 : μ≠1kg Legyen egy n=16 elemű mintánk Gazdaságstatisztika

A próbák osztályozása  Mi a nullhipotézisük tárgya:  Paraméterre és eloszlásra irányuló próbák  Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek:  A paraméteres próbák alkalmazási feltételei között szerepelnek a sokasági eloszlás típusára, egyes paramétereire vonatkozó elvárások  A nemparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásának folytonosságát követeli meg  Hány és mekkora minta szükséges a végrehajtásukhoz:  Egy, két vagy többmintás próbák  Független és páros mintás próbák  Kis- és nagymintás próbák (határ n=30)

Illeszkedésvizsgálat  Arról döntünk, hogy valamely  valószínűségi változó F (tapasztalati) eloszlása lehet-e adott F 0 (elméleti) eloszlásfüggvénnyel jellemzett eloszlás  Minták száma: egymintás  Alkalmazás feltétele: nagymintás, diszkrét és folytonos eloszlásokra egyaránt  Hipotézisek:  H 0 : F = F 0  H 1 : F ≠ F 0  A próbafüggvény:  A próbafüggvény eloszlása: χ 2 eloszlás, DF=r-l-1  Típusai: tiszta és becsléses illeszkedésvizsgálat 17

Példa – diszkrét eloszlása A Tiszán egy adott időszakban levonuló árhullámok számát vizsgálva az elmúlt 68 év során az alábbi eredményeket kapták: 30 év volt, amikor nem volt árhullám, 25 olyan év volt, amikor 1 árhullám vonult le az adott időszakban, 9 év volt, amikor 2 és 4 olyan év volt, amikor 3 vagy több árhullám következett be. Feltehető-e, hogy a folyón levonuló árhullámok száma modellezhető Poisson-eloszlással? =? nem ismerjük  a mintából kell becsülnünk Poisson-eloszlás esetén: M(  )= (számtani átlaggal becsülhető) Mivel az elmúlt 68 év során a kérdéses időszakban összesen 55 árhullám volt:  55/68  0,8 Gazdaságstatisztika árhullámok száma 0123 v. több gyakoriság [db]302594

 Nullhipotézis és alternatív hipotézis felállítása: H 0 = az árhullámok száma =0,8 paraméterű Poisson-eloszlású H 1 : az árhullámok száma nem =0,8 paraméterű Poisson-eloszlású  Mintavétel, adatok feldolgozása, kritikus érték (elfogadási és elutasítási tartomány) meghatározása  Poisson eloszlás táblázat =0,8 k=0  p 0 =0, 4493 k=1  p 1 =0,3595 k=2  p 2 =0,1438 k= 3 vagy annál több  1-(p 0 + p 1 + p 2 )=0,0474 Gazdaságstatisztika Példa – diszkrét eloszlása kf(k)pkpk 0300, , , v. több40,0474  681

Példa – diszkrét eloszlás Elméleti gyakoriságok meghatározása Kritikus érték: DF=r-l-1=4-1-1=2  =5%  táblázatból:  2 elm. =5,99 Gazdaságstatisztika kf(k)pkpk 0300, , , v. több40,0474  681 kf(k)pkpk F(k) 0300,449330, ,359524,45 290,14389,78 3 v. több40,04743,22  681

Példa – diszkrét eloszlás  Számított érték:  A számított és a kritikus érték összehasonlítása:  2 elm. =5,99 >>  2 sz =0,27  Döntés a nullhipotézisről: Mivel a számított érték az elfogadási tartományba esik –, ezért 95%-os megbízhatósági elfogadjuk a H 0 -t: a folyón levonuló árhullámok száma modellezhető =0,8 paraméterű Poisson-eloszlással. Gazdaságstatisztika kf(k)pkpk F(k) 0300,449330, ,359524,45 290,14389,78 3 v. több40,04743,22  681

Példa – folytonos eloszlás A légi közlekedésben fontos figyelemmel kísérni az utasok átlagos testsúlyát, hogy egyrészt ne terheljék túl a gépet, másrészt ne utazzon a gép fölös kapacitással. Ezért időről időre ellenőrzik, hogy a felnőtt utasok testsúlya nem tér-e el a feltételezettől. A légitársaság a terhelést a 78kg-os átlagos testsúlyra és 11kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. 5%-os szignifikancia szint mellett teszteljük, hogy az utasok testsúlya normális eloszlású változó! A mintából kiszámított jellemzők: Megoldás: Becsléses illeszkedésvizsgálat Gazdaságstatisztika Testsúly (kg) Ügyfelek száma (fő) Összesen100

Példa – folytonos eloszlás  Hipotézisek: H 0 : az utasok tömege N(78,6;12,187) normális eloszlású H 1 : az utasok tömege nem N(78,6;12,187) normális eloszlású  Mintavétel, adatok feldolgozása Gazdaságstatisztika Testsúly (kg) Ügyfelek száma (fő) - f i PiPi FiFi Összesen100

Példa – folytonos eloszlás  A P i valószínűségi értékek meghatározása Gazdaságstatisztika Testsúly (kg) Ügyfelek száma (fő) - f i PiPi FiFi Összesen100 0, ,1746 0,305 0,2826 0,1344 0,04 1

Példa – folytonos eloszlás  Elméleti gyakoriságok meghatározása Gazdaságstatisztika Testsúly (kg) Ügyfelek száma (fő) - f i PiPi FiFi , , , , , ,04 Összesen100 ~1 6, ,46 30,5 28,26 13,

Példa – folytonos eloszlás  A próbafüggvény értékének meghatározása: Gazdaságstatisztika Testsúly (kg) Ügyfelek száma (fő) - f i PiPi FiFi -6070, , ,174617, ,30530, ,282628, ,134413, ,044 Összesen100~1~100 0,0911 0,122 0,074 0,0024 0, ,3038

Példa – folytonos eloszlás  A kritikus érték meghatározása: DF=r-l-1=6-2-1=3 χ 2 krit =7,815  Számított és kritikus érték összevetése, döntés a nullhipotézisről: Mivel a számított érték (0,3038) kisebb, mint a kritikus érték (7,815), így a nullhipotézist 5%-os szignifikancia szinten elfogadjuk, azaz az utasok tömege N(78,6;12,187) normális eloszlású. Gazdaságstatisztika

Homogenitásvizsgálat  Homogenitásvizsgálat segítségével eldönthetjük, hogy két valószínűségi változó azonos eloszlásúnak tekinthető-e.  Minták száma: kétmintás  Alkalmazás feltétele: nagymintás, a közösnek feltételezett eloszlásfüggvényre nincs kikötés  Hipotézisek:  H 0 : a vizsgált valószínűségi változók két sokaságon belüli eloszlása azonos  H 1 : a vizsgált valószínűségi változók két sokaságon belüli eloszlása nem azonos  A próbafüggvény:  A próbafüggvény eloszlása: χ 2 eloszlás, DF=r-1  Eszköze: kontingencia táblázat

Kontingencia táblázat 29

Példa A személysérüléssel járó közúti balesetekre vonatkoznak az alábbi, mintavételből származó adatok 2003-ban. Hasonlítsuk össze a Budapesten és az ország többi részén történt balesetek idősávok szerinti eloszlását (α=1%)! Gazdaságstatisztika A baleset ideje a nap órái szerint Balesetek száma Budapesten Balesetek száma az ország többi részén Összesen100200

Példa  Hipotézisek felállítása: H 0 : A balesetek idősávok szerinti eloszlása Budapesten és az ország többi részén megegyezik (H 0 : F BP = G egyéb ) H 1 : A balesetek idősávok szerinti eloszlása Budapesten és az ország többi részén nem egyezik (H 1 : F BP  G egyéb )  Mintavétel, adatok feldolgozása:  Kontingencia táblázat:  Sor- és oszlopösszegek kiszámítása  Elméleti gyakoriságok meghatározása  Számított érték meghatározása Gazdaságstatisztika

Példa – kontingencia tábla A baleset ideje a nap órái szerint Balesetek száma Budapesten Balesetek száma az ország többi részén Peremgyakoriság (sorösszegek) Peremgyakoriság (oszlopösszegek) Gazdaságstatisztika ,67 19,67 17,67 23,33 25,67 27,34 39,34 35,34 46,66 51,34

Példa  Kritikus érték meghatározása: DF=r-1=5-1=4 α=1% χ 2 krit =13,277  Döntés a nullhipotézisről: Mivel a számított érték (0,29656) kisebb, mint a kritikus érték (13,277), így a nullhipotézist elfogadjuk, azaz 1%-os szignifikancia szinten elfogadható, hogy a balesetek óránkénti eloszlása Budapesten és az ország többi részén megegyezik. Gazdaságstatisztika

1. A null- (H 0 ) és alternatív (H 1 ) hipotézisek megfogalmazása 2. Olyan próbafüggvény keresése, amelynek eloszlása a nullhipotézis helyességét feltételezve és a próba alkalmazási feltételeit figyelembe véve egyértelműen meghatározható. 3. A szignifikancia szint (α) megválasztása, és a próbafüggvény lehetséges értéktartományának felosztása elfogadási és elutasítási tartományra. 4. Mintavétel, ez alapján a próbafüggvény, mint valószínűségi változó számszerű értékének meghatározása. 5. Döntés a hipotézisek helyességéről:  ha a próbafüggvény értéke az előre kijelölt elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist,  Ha a próbafüggvény értéke az elutasítási tartományba esik, akkor elutasítjuk a nullhipotézist. A hipotézisvizsgálat lépései

Hol tartunk?  Nemparaméteres próbák:  A sokaság eloszlásával kapcsolatos hipotézisek tesztelésére. 1. Illeszkedésvizsgálat:  valamely  valószínűségi változó F (tapasztalati) eloszlása lehet- e adott F 0 (elméleti) eloszlásfüggvénnyel jellemzett eloszlás 2. Homogenitásvizsgálat  Homogenitásvizsgálat segítségével eldönthetjük, hogy két valószínűségi változó azonos eloszlásúnak tekinthető-e. 3. Függetlenségvizsgálat Gazdaságstatisztika

Függetlenségvizsgálat  Két minőségi ismérv valamely adott sokaságon belül független-e egymástól.  A minták száma: egymintás  Alkalmazás feltétele: a kontingencia táblázat méretétől függően nagy minta  Hipotézisek:  H 0 : a két valószínűségi változó független egymástól (nincs sztochasztikus kapcsolat)  H 1 : a két valószínűségi nem független egymástól (közöttük sztochasztikus vagy függvénykapcsolat van)  A próbafüggvény:  A próbafüggvény eloszlása: χ 2 eloszlás, DF=(r-1)(s-1) 36

Kontingencia táblázat 37

A minőségi ismérvek között kapcsolat szorossága a minőségi ismérvek közötti asszociációval vizsgálható Cramer-féle asszociációs együttható  0 és 1 közötti értéket vesz fel.  Minél közelebb esik 1-hez, annál szorosabb a kapcsolat Minőségi ismérvek asszociációja q = min(r,s) 38

Példa Egy közvéleménykutatás során egyik gazdasági témájú TV- műsorról a következő kép alakult ki a diplomások körében: Tesztelje 5%-os szignifikancia szinten a foglalkozás jellege és a TV-műsor minősítése közötti kapcsolatot! Határozzuk meg az asszociációs együtthatót is, jellemezzük a kapcsolat szorosságát! Gazdaságstatisztika A nyilatkozó foglalkozása A műsor megítélése jómegfelelőrossz közgazdász jogász egyéb diplomás

Példa  Hipotézisek felállítása: H 0 : A foglalkozás jellege és a TV-műsor minősítése független egymástól. H 1 : A foglalkozás jellege és a TV-műsor minősítése nem független egymástól.  Mintavétel, adatfeldolgozás:  Kontingencia táblázat elkészítése: Sor-, és oszlop peremgyakoriságok meghatározása Elméleti gyakoriságok kiszámítása Számított érték meghatározása Gazdaságstatisztika

Példa Gazdaságstatisztika A nyilatkozó foglalkozása A műsor megítélésePeremgyakori ságok (sorösszegek) jómegfelelőrossz közgazdász jogász egyéb diplomás Peremgyakoriságok (oszlopösszegek)

Példa  Kritikus érték meghatározása: DF=(r-1)(s-1)=2∙2=4 α=5% χ 2 krit =9,488  Döntés a nullhipotézisről: Mivel a számított érték 55,53 nagyobb, mint a kritikus érték (9,488), így a nullhipotézist elutasítjuk, a foglalkozás és a TV műsor minősítése nem független egymástól. Gazdaságstatisztika

Példa  Asszociációs együttható: n=800  2 szám =55,53 r=s=3  q=3 A diploma típusa és a TV-műsor megítélése, mint két minőségi ismérv között gyenge az asszociációs kapcsolat. Gazdaságstatisztika

Függetlenségvizsgálat PLUSZPONT SZERZÉSI LEHETŐSÉG – beadási lehetőség óra végén Közlekedésbiztonsági szervek 1000 személyi sérüléses közúti balesetet vizsgáltak meg aszerint, hogy milyen súlyos volt a baleset, és a sérült viselt-e biztonsági övet. A kapott eredmények: 1%-os szignifikancia szinten ellenőrizzük, hogy független-e a baleset kimenetele attól, hogy az illető viselt-e biztonsági övet! Gazdaságstatisztika BalesetÖvetÖsszesen viseltNem viselt Könnyű Súlyos Halálos Összesen DF=(r-1)(s-1)

Gyakorló példa – Feladatgyűjtemény (23.) Egy termelési folyamatban 4 gép működik 3 műszakban. Véletlen mintát véve a hibás termékekből, gépek és műszakok szerint csoportosították azokat. Az eredményt az alábbi táblázat mutatja. Van-e kapcsolat a selejt nagysága szerint a gépek és műszakok között? (α=10%) Gazdaságstatisztika Műszak Gépek ABCD I II III

Megoldás  Hipotézisek felállítása: H 0 : független egymástól a selejt nagysága szerint a gép és a műszak H 1 : nem független egymástól a selejt nagysága szerint a gép és a műszak  Mintavétel, adatok feldolgozása:  Kontingencia táblázat elkészítése Sor és oszlopösszegek (peremgyakoriságok számítása) Elméleti gyakoriságok számítása A próbafüggvény értékének kiszámítása Gazdaságstatisztika

Megoldás Gazdaságstatisztika Műszak Gépek Peremgyakoriság (sorösszeg) ABCD I II III Perem- gyakoriságok (oszlopösszeg) ,023 14,21 12,76 8,41 10,85 9,74 11,76 13,1 10,15 10,85 9,74 8,41 χ 2 sz =0,095+0,7976+0,455+0,0414+0,2255+0,315+0, , ,0453+0, ,4267+0,05622=2,517

Megoldás  Kritikus érték meghatározása: DF=(3-1)(4-1)=2∙3=6 α=10% χ 2 krit =10,645  Döntés a nullhipotézisről: Mivel a számított érték (2,517) kisebb, mint a kritikus érték (10,645), így a nullhipotézist elfogadjuk, a selejt nagysága szerint nincs kapcsolat a gép és a műszak között. Gazdaságstatisztika

Példa – Feladatgyűjtemény (24.) A Matematika I. és II. tárgyakból a zárthelyi dolgozatokban elért pontszámok eloszlását reprezentálja az alábbi minta: Hasonlítsuk össze 10%-os szignifikancia szinten a két tantárgy pontszám szerinti eloszlását! Gazdaságstatisztika PontszámokHallgatók száma (fő) Matematika I. Matematika II Összesen110

Megoldás  Hipotézisek: H 0 : a két tantárgy esetében elért pontszámok eloszlása azonos H 1 : a két tantárgy esetében elért pontszámok eloszlása nem azonos  Mintavétel, adatok feldolgozása:  Kontingencia táblázat elkészítése Sor és oszlopösszegek (peremgyakoriságok számítása) Elméleti gyakoriságok számítása A próbafüggvény értékének kiszámítása Gazdaságstatisztika

Megoldás Gazdaságstatisztika PontszámokHallgatók száma (fő) Perem- gyakoriság Matematika I. Matematika II Perem- gyakoriság

Megoldás  Kritikus érték: DF=5-1=4 α=10% χ 2 krit =7,78  Döntés a nullhipotézisről: Mivel a számított érték (7,066) kisebb, mint a kritikus érték (7,78), így a nullhipotézist elfogadjuk, azonos a pontszámok eloszlása a két tárgy esetében. Gazdaságstatisztika

Példa – Feladatgyűjtemény (25.) Egy település rendőrkapitánya azt állítja, hogy az éjszakai betörések száma egyenletesen oszlik meg a hét napjain. Egyheti megfigyelés alapján a betörések száma az egyes napokon az alábbi volt: Ellenőrizzük 5%-os szignifikancia szinten, hogy elfogadható-e a rendőrkapitány állítása! Gazdaságstatisztika Nap Betörések száma Hétfő6 Kedd8 Szerda5 Csütörtök7 Péntek12 Szombat17 Vasárnap15 Összesen70

Megoldás  Hipotézisek felállítása: H 0 : A betörések száma diszkrét egyenletes eloszlású H 1 : A betörések száma nem diszkrét egyenletes eloszlású  Mintavétel, adatfeldolgozás:  Elméleti gyakoriságok meghatározása  Számított érték meghatározása Gazdaságstatisztika

Megoldás Nap Betörések száma (f i ) Elméleti gyakoriság (F i ) Hétfő6 Kedd8 Szerda5 Csütörtök7 Péntek12 Szombat17 Vasárnap15 Összesen70 Gazdaságstatisztika ,6 0,4 2,5 0,9 0,4 4,9 2,5 13,2

Megoldás  Kritikus érték: DF=7-1=6 α=5% χ 2 krit =12,592  Döntés a nullhipotézisről: Mivel a számított érték (13,2) nagyobb, mint a kritikus érték (12,592), így a nullhipotézist elutasítjuk, a betörések száma nem diszkrét egyenletes eloszlású. Gazdaságstatisztika

Példa – Feladatgyűjtemény (21.) Egy vállalatnál az átlagos heti túlóra-kifizetéseket vizsgálták. 80 véletlenszerűen kiválasztott dolgozó adatai alapján az átlagos túlóra-kifizetés az alábbi eloszlást mutatja: Leírhatók-e a heti túlóra-kifizetések normális eloszlással? (Legyen a szignifikancia szint 10%) Gazdaságstatisztika Heti túlórabér [font] munkások száma T <  T <  T <  T < < T3

Megoldás  Illeszkedésvizsgálat  Hipotézisek felállítása  H 0 : normális eloszlás N(?;?)  H 1 : nem normális eloszlás  Normális eloszlás paramétereinek becslése: H 0 : a heti túlóra kifizetés N(3,0;2,98) eloszlású H 1 : a heti túlóra kifizetés nem N(3,0;2,98) eloszlású Gazdaságstatisztika Heti túlórabér [font] munkások száma T <  T <  T <  T < < T3 s*=2,98

Megoldás  Kritikus érték meghatározása A becsült paraméterek száma: 2  =0,10DF=r-1-2=5-3=2  2 kr =4,61  Mintavétel, adatfeldolgozás  Elméleti gyakoriságok meghatározása  A próbafüggvény értékének meghatározása Gazdaságstatisztika Heti túlórabér [font] munkások száma (f i ) pipi Elméleti gyakoriságok (F i ) T <  T <  T <  T < < T3

Megoldás Gazdaságstatisztika Heti túlórabér [font] munkások száma (f i ) pipi Elméleti gyakoriságok (F i ) T <  T <  T <  T < < T3 0, ,1155 0,3816 0,2423 0, ,114 9,24 30,53 19,384 0,7312

Megoldás Gazdaságstatisztika Heti túlórabér [font] munkások száma (f i ) pipi Elméleti gyakoriságok (F i ) T <  T <  T <  T < < T3 0, ,1155 0,3816 0,2423 0, ,114 9,24 30,53 19,384 0,7312 0, ,26 6 1,3 Mivel a számított érték (49,622) nagyobb, mint a kritikus érték (4,91), így a nullhipotézist 10%-os szignifikancia szinten elutasítjuk, azaz a túlóra kifizetések nem írhatóak le N(3;2.98) paraméterű normális eloszlással.