Konzultáció november 19. Nemparaméteres próbák, egymintás próbák

Slides:



Advertisements
Hasonló előadás
Hipotézis-ellenőrzés (Statisztikai próbák)
Advertisements

I. előadás.
II. előadás.
Rangszám statisztikák
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Két változó közötti összefüggés
Összefüggés vizsgálatok
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. V. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Regresszióanalízis 10. gyakorlat.
Nem-paraméteres eljárások, több csoport összehasonlítása
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Kvantitatív módszerek 8. Hipotézisvizsgálatok I. Nemparaméteres próbák Dr. Kövesi János.
Nemparaméteres próbák Statisztika II., 5. alkalom.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
STATISZTIKA II. 6. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Kvantitatív Módszerek
Kvantitatív módszerek
Valószínűségszámítás
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika Hipotézisvizsgálatok Nemparaméteres próbák II. 17. előadás.
Gazdaságstatisztika 18. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 22. előadás
Gazdaságstatisztika 14. előadás.
Gazdaságstatisztika 13. előadás.
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Gazdaságstatisztika 15. előadás.
Hipotézis vizsgálat (2)
Következtető statisztika 9.
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Hipotézis vizsgálat.
t A kétoldalú statisztikai próba alapfogalmai
Paleobiológiai módszerek és modellek 4. hét
I. előadás.
A kombinációs táblák (sztochasztikus kapcsolatok) elemzése
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Kvantitatív módszerek Hipotézisvizsgálatok Paraméteres próbák.
Gazdaságstatisztika Hipotézisvizsgálatok Paraméteres próbák november 19., november 20., november 26.
Kvantitatív módszerek
Paraméteres próbák- gyakorlat
Hipotézisvizsgálatok Paraméteres próbák
Hipotézisvizsgálatok
Nemparaméteres próbák
Kiváltott agyi jelek informatikai feldolgozása 2016
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
II. előadás.
Kvantitatív módszerek MBA és Számvitel mesterszak
Becsléselmélet - Konzultáció
Gazdaságstatisztika konzultáció
Kvantitatív módszerek
Nemparaméteres próbák
I. Előadás bgk. uni-obuda
III. zárthelyi dolgozat konzultáció
Hipotézisvizsgálatok Paraméteres próbák
Sztochasztikus kapcsolatok I. Asszociáció
Kockázat és megbízhatóság
Nemparaméteres próbák
Gazdaságinformatikus MSc
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
1.3. Hipotézisvizsgálat, statisztikai próbák
Előadás másolata:

Konzultáció 2014. november 19. Nemparaméteres próbák, egymintás próbák Gazdaságstatisztika Konzultáció 2014. november 19. Nemparaméteres próbák, egymintás próbák

Mi a hipotézisvizsgálatok célja? Következtető statisztikai eszközök Egy véletlen minta ismeretében hogyan lehet becslést adni annak a sokaságnak bizonyos jellemzőire, amelyből a minta származik. Várható érték becslése ismeretlen és ismert sokasági szórás esetén Sokasági variancia becslése Sokasági arány becslése De nem mindig erre van szükség: el kell döntenünk, hogy a rendelkezésre álló egy vagy több minta származhat-e meghatározott tulajdonságokkal rendelkező egy vagy több sokaságból vagy összehasonlítási célok mérlegelni kell, hogy a mintavétel eredménye alátámasztja vagy cáfolja a feltevésünket

Mi a hipotézisvizsgálatok célja? A vizsgálandó sokaságra vonatkozó ismereteink gyakran hiányosak és/vagy bizonytalanok  sejtésünket hipotézisként fogalmazzuk meg, amelynek igazságáról meg kell győződni Hipotézis: sokasággal (!!!) kapcsolatos feltevés, amely vonatkozhat A sokaság eloszlására A sokaság eloszlásának egy vagy több paraméterére Az állítások helyességéről kétféleképpen lehet meggyőződni: Teljes körű adatfelvételt végzünk Mintavétel eredményei alapján következtetünk MINTAVÉTELI INGADOZÁS, MINTAVÉTELI HIBA Hipotézisvizsgálat: a sokaságra vonatkozó feltevés mintavételi eredményekre támaszkodó vizsgálata. A hipotézisvizsgálat annak mérlegelése, hogy egy sokaságra vonatkozó állítás mennyire hihető a mintavétel eredményeinek tükrében.

1. lépés: a null- és alternatív hipotézisek megfogalmazása Mi a nullhipotézis és az alternatív (ellen-)hipotézis, mi a szerepük a hipotézisvizsgálat során, és hogyan kell őket megfogalmazni? 1. lépés: a null- és alternatív hipotézisek megfogalmazása Nullhipotézis (H0): az a sokaságra vonatkozó feltevés, amelynek igazságáról a hipotézisvizsgálat során közvetlenül meg kívánunk győződni. Alternatív (vagy ellen-) hipotézis (H1): a nullhipotézissel együtt minden lehetőséget kimerítő, azzal egymást kölcsönösen kizáró hipotézis, amelynek helyességéről közvetetten döntünk a hipotézisvizsgálat során. A kettő közül azt fogjuk igaznak tekinteni, elfogadni, amelyik a mintavétel eredménye alapján hihetőbbnek tűnik a másiknál A hipotézisek megfogalmazásának szempontjai: Megválaszolható legyen a bennünket érdeklő kérdés Egymást kizárják Mindig a nullhipotézis helyességéről döntünk, de az arról való döntés egyben közvetett döntés az alternatív hipotézisről.

Mi a próbafüggvény és mire használjuk a hipotézisvizsgálat során? A hipotézisek vizsgálatára próbafüggvényt használunk: a mintából a sokaságra történő következtetést szolgálja A mintaelemek egy olyan függvénye, amelynek valószínűségi eloszlása a sokaság ismert tulajdonságait tekintetbe véve, a nullhipotézis igazságát feltételezve pontosan ismert. A próbafüggvényt eloszlásának ismerete teszi alkalmassá a nullhipotézis helyességének vizsgálatára: sokaság eloszlása, mintavétel módja, minta nagysága A próbafüggvények értékei mintáról mintára ingadozó jellemzők, azaz statisztikák. A próbafüggvények konstruálása elvi, matematikai feladat. Gazdaságstatisztika

Hogyan jelölhetjük ki az elfogadási és elutasítási tartományokat Hogyan jelölhetjük ki az elfogadási és elutasítási tartományokat? Mi a kritikus érték? a próbafüggvény lehetséges értékeinek teljes tartományát két egymást át nem fedő részre bontjuk kritikus érték(ek) segítségével: elfogadási és elutasítási (kritikus) tartományra. A határt (a kritikus értékeket) úgy választjuk meg, hogy a próbafüggvény a nullhipotézis fennállása esetén előre megadott nagy ε valószínűséggel az elfogadási tartományba essen. Ha a próbafüggvénynek a rendelkezésünkre álló egy – esetleg több – minta adataiból számított értéke az elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist, ellenkező esetben elvetjük azt. A kritikus tartományba esés α valószínűségét szignifikancia szintnek nevezzük (1%-10% között) Gazdaságstatisztika

Hogyan jelölhetjük ki az elfogadási és elutasítási tartományokat Hogyan jelölhetjük ki az elfogadási és elutasítási tartományokat? Mi a kritikus érték? Kritikus értékek: Az elfogadási és elutasítási tartományt egymástól elhatároló ca és cf értékeket alsó és felső kritikus értéknek szokás nevezni. A kritikus értékeket mindig a kritikus tartomány részének tekintjük. A kritikus tartomány kijelölésére kétoldali kritikus tartomány használata esetén két kritikus értékre, egyoldali kritikus tartomány esetén pedig egy kritikus értékre van szükség. A kritikus értékek a szignifikancia szint és a próbafüggvény eloszlásának ismeretében egyértelműen meghatározhatóak Speciális táblázatok Gazdaságstatisztika

Egyoldali kritikus tartomány Elfogadási Kritikus érték α 1-α Bal oldali kritikus tartomány Kritikus Elfogadási Kritikus érték α 1-α Jobb oldali kritikus tartomány Bal vagy jobboldali kritikus tartomány kijelölése: eleve arra számítunk, hogy a valóság meghatározott irányú eltérést mutat egy általunk feltételezett helyzettől. ha csak valamilyen feltételezett vagy előírt állapottól való adott irányú eltérés igazán fontos a számunkra. A próbafüggvény mintából nyert értéke elég kicsi-e (elég nagy-e) ahhoz, hogy a nullhipotézis helyett az alternatív hipotézis fennállását legyen indokolt feltételezni. A teljes kritikus tartományt a próbafüggvény eloszlásának vagy csak a bal, vagy csak a jobb szélére tesszük.

Kétoldali kritikus tartomány Kétoldali kritikus tartomány kijelölése: csak a nullhipotézisben feltételezett helyzettől való eltérés ténye érdekel bennünket, és közömbös az eltérés iránya. A próbafüggvény értéke akár kisebb, akár nagyobb lehet, mint a nullhipotézis fennállásakor A kritikus tartományba esés teljes valószínűségét egyenlő arányban szokás megosztani a kritikus tartomány két része között. Kritikus Elfogadási Kritikus érték α/2 1-α Két oldali kritikus tartomány

A hipotézisvizsgálat lépései A null- (H0) és alternatív (H1) hipotézisek megfogalmazása Olyan próbafüggvény keresése, amelynek eloszlása a nullhipotézis helyességét feltételezve és a próba alkalmazási feltételeit figyelembe véve egyértelműen meghatározható. A szignifikancia szint (α) megválasztása, és a próbafüggvény lehetséges értéktartományának felosztása elfogadási és elutasítási tartományra. Mintavétel, ez alapján a próbafüggvény, mint valószínűségi változó számszerű értékének meghatározása. Döntés a hipotézisek helyességéről: ha a próbafüggvény értéke az előre kijelölt elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist, Ha a próbafüggvény értéke az elutasítási tartományba esik, akkor elutasítjuk a nullhipotézist.

A hipotézisvizsgálat során elkövethető hibák Adott n mellett: ha α ↑  β ↓ ha α ↓ ↑  β ↑ Adott α mellett: ha n ↑  β ↓ ha próbafüggvény szórása ↓  β ↓ A hipotézisvizsgálat során elkövethető hibák H0 Döntés H0-ról a minta alapján Igaz Nem igaz Minta-1 Mintából következtetünk !!! Minta-2 Másodfajú hiba  A H0 téves elfogadása Nincs hiba  Hibát követhetünk el !!! Minta-3 Elsőfajú hiba  A H0 téves elvetése Másodfajú hiba () Elsőfajú hiba () Nincs hiba e Cél: a másodfajú hiba valószínűségének csökkentése (adott α mellett)  Kvantitatív módszerek

A próbák osztályozása Mi a nullhipotézisük tárgya: Paraméterre és eloszlásra irányuló próbák Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek: A paraméteres próbák alkalmazási feltételei között szerepelnek a sokasági eloszlás típusára, egyes paramétereire vonatkozó elvárások A nemparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásának folytonosságát követeli meg Hány és mekkora minta szükséges a végrehajtásukhoz: Egy, két vagy többmintás próbák Független és páros mintás próbák Kis- és nagymintás próbák (határ n=30)

Illeszkedésvizsgálat Arról döntünk, hogy valamely  valószínűségi változó F (tapasztalati) eloszlása lehet-e adott F0 (elméleti) eloszlásfüggvénnyel jellemzett eloszlás Minták száma: egymintás Alkalmazás feltétele: nagymintás, diszkrét és folytonos eloszlásokra egyaránt Hipotézisek: H0: F = F0 H1: F ≠ F0 A próbafüggvény: A próbafüggvény eloszlása: χ2 eloszlás, DF=r-l-1 Típusai: tiszta és becsléses illeszkedésvizsgálat

Homogenitásvizsgálat Homogenitásvizsgálat segítségével eldönthetjük, hogy két valószínűségi változó azonos eloszlásúnak tekinthető-e. Minták száma: kétmintás Alkalmazás feltétele: nagymintás, a közösnek feltételezett eloszlásfüggvényre nincs kikötés Hipotézisek: H0: a vizsgált valószínűségi változók két sokaságon belüli eloszlása azonos H1: a vizsgált valószínűségi változók két sokaságon belüli eloszlása nem azonos A próbafüggvény: A próbafüggvény eloszlása: χ2 eloszlás, DF=r-1 Eszköze: kontingencia táblázat

Kontingencia táblázat

Függetlenségvizsgálat Két minőségi ismérv valamely adott sokaságon belül független-e egymástól. A minták száma: egymintás Alkalmazás feltétele: a kontingencia táblázat méretétől függően nagy minta Hipotézisek: H0 : a két valószínűségi változó független egymástól (nincs sztochasztikus kapcsolat) H1 : a két valószínűségi nem független egymástól (közöttük sztochasztikus vagy függvénykapcsolat van) A próbafüggvény: A próbafüggvény eloszlása: χ2 eloszlás, DF=(r-1)(s-1)

Kontingencia táblázat

Minőségi ismérvek asszociációja A minőségi ismérvek között kapcsolat szorossága a minőségi ismérvek közötti asszociációval vizsgálható Cramer-féle asszociációs együttható 0 és 1 közötti értéket vesz fel. Minél közelebb esik 1-hez, annál szorosabb a kapcsolat q = min(r,s)

1. Feladat Egy ipari parkban az elmúlt 70 évben az évente bekövetkező áramkimaradások gyakorisága az alábbi táblázat szerint alakult. 5%-os szignifikancia szinten elfogadható-e az a feltételezés, hogy az áramkimaradások száma Poisson-eloszlású valószínűségi változó? Áramkimaradások száma (évente): 1 2 3 4 5 6 7 7-nél több Évek száma: 16 23 15 Gazdaságstatisztika

1. Feladat - megoldás A megoldás menete Tudjuk, hogy a nullhipotézis teljesülése esetén az áramkimaradások éves száma Poisson-eloszlású valószínűségi változónak tekinthető. A mintából becslést adunk az eloszlás paraméterére. Meghatározzuk, hogy az áramkimaradások száma a feladatban megadott értékeket mekkora valószínűséggel veszi fel. Kiszámítjuk az áramkimaradások számának elméleti gyakoriságait. Az elméleti és tapasztalati gyakoriságok ismeretében – a khi-négyzet próba alkalmazásával – illeszkedésvizsgálatot hajtunk végre. Gazdaságstatisztika

1. Feladat - megoldás A feltételezett eloszlás (Poisson-eloszlás) λ paramétere nem ismert, ezért becsléses illeszkedésvizsgálatot hajtunk végre. Jelölje ζ az áramkimaradások éves számát, mint valószínűségi változót. Ha a nullhipotézis teljesül, akkor ζ λ paraméterű Poisson-eloszlású. A λ paraméter (maximum likelihood) becslése a mintaátlag: H0: az áramkimaradások éves száma λ=2,2 paraméterű Poisson-eloszlást követ H1: az áramkimaradások éves száma nem λ=2,2 paraméterű Poisson-eloszlást követ Gazdaságstatisztika

1. Feladat - megoldás Az elméleti gyakoriságok meghatározásához a következő valószínűségeket kell kiszámítanunk: Áramkimara-dások száma: 1 2 3 4 5 6 7 7-nél több Évek száma: 16 23 15 Gazdaságstatisztika

1. Feladat - megoldás A valószínűségek ismeretében az elméleti gyakoriságok az összefüggés alapján számíthatók, ahol N=70 a minta elemszáma. A következő táblázat a próba végrehajtásához szükséges tapasztalati és kiszámított elméleti gyakoriságokat tartalmazza. k 6 0,1108 7,7562 1 16 0,2438 17,0637 2 23 0,2681 18,7701 3 15 0,1966 13,7647 4 7 0,1082 7,5706 5 0,0476 3,3311 0,0174 1,2214 0,0055 0,3839 7-nél több 0,0020 0,1384 Gazdaságstatisztika

1. Feladat - megoldás A próba végrehajtása Tesztstatisztika kiszámítása: A kritikus érték meghatározása A szabadságfok: DF = r-l-1 = 9-1-1 = 7 (r=9, l=1, mert 1 paramétert becsültünk.) és a szabadságfok ismeretében a khi-négyzet eloszlás táblázatából: Döntés , ezért a nullhipotézist 5%-os szignifikancia szinten elfogadjuk. Gazdaságstatisztika

Asztallap vastagsága (d) 2. Feladat Egy faipari üzemben a méretre gyártott asztallapok vastagságát vizsgálták. 200 asztallap vastagságát megmérve az adatokat az alábbi táblázatban rögzítették. 5%-os szignifikancia szinten elfogadható-e az a feltételezés, hogy az asztallapok vastagsága normális eloszlású valószínűségi változó 50,2mm várható értékkel és 1,3mm szórással? Asztallap vastagsága (d) (mm) Asztallapok száma (darab) d < 47 3 47 ≤ d < 49 31 49 ≤ d < 51 105 51 ≤ d < 53 56 53 ≤ d 5 Gazdaságstatisztika

2. Feladat - megoldás A feladat szövege alapján a következő hipotézisek fogalmazhatók meg: H0: az asztallapok vastagsága 50,2mm várható értékű, 1,3mm szórású normális eloszlást követ H1: az asztallapok vastagsága nem 50,2mm várható értékű, 1,3mm szórású normális eloszlást követ Mivel ismertek a feltételezett eloszlás elméleti paraméterei, ezért tiszta illeszkedésvizsgálatot hajtunk végre. Gazdaságstatisztika

Asztallap vastagsága (d) 2. Feladat - megoldás A feladat megoldásához meg kell határoznunk az asztallap vastagságának a megadott kategóriákba esési elméleti gyakoriságait. A nullhipotézis teljesülése esetén az asztallap vastagság megadott kategóriákba esési valószínűségeit a , paraméterű normális eloszlásfüggvény segítségével számíthatjuk ki. E valószínűségek ismeretében a megadott kategóriákba esési elméleti gyakoriságok kiszámíthatóak. A megadott kategóriákba esési valószínűségek meghatározása: Jelölje az asztallapok vastagságát, mint valószínűségi változót. A következő valószínűségeket kell meghatároznunk: Asztallap vastagsága (d) (mm) d < 47 47 ≤ d < 49 49 ≤ d < 51 51 ≤ d < 53 53 ≤ d Gazdaságstatisztika

2. Feladat - megoldás A , paraméterű normális eloszlás helyett a standard normális eloszlásfüggvénnyel számolunk Gazdaságstatisztika

Asztallap vastagsága (d) 2. Feladat - megoldás A valószínűségek ismeretében az elméleti gyakoriságok az összefüggéssel meghatározhatóak, ahol N=200 a minta elemszáma. Megjegyzés: Próba végrehajtása Tesztstatisztika kiszámítása: a kategóriák száma Asztallap vastagsága (d) (mm) d < 47 3 0,007 1,3834 47 ≤ d < 49 31 0,1711 34,2133 49 ≤ d < 51 105 0,5528 110,5732 51 ≤ d < 53 56 0,2534 50,7049 53 ≤ d 5 0,0156 3,1252 Gazdaságstatisztika

2. Feladat - megoldás A kritikus érték meghatározása Döntés A szabadságfok: DF = r-l-1 = 5-0-1 = 4 (l=0, mert nem becsültünk egyetlen paramétert sem) és a szabadságfok ismeretében a khi-négyzet eloszlás táblázatából Döntés , ezért a nullhipotézist elfogdajuk, azaz 5%-os szignifikancia szinten elfogadható az a feltételezés, hogy az asztallapok vastagsága normális eloszlású valószínűségi változó 50,2mm várható értékkel és 1,3mm szórással. Gazdaságstatisztika

3. Feladat A csokoládé, a vanília és az eper-fagylaltok iránti preferenciát vizsgálták kisiskolások körében. 4 korcsoportban, összesen 289 kisiskolástól kérdezték meg, hogy melyik fagylaltok kedveli a leginkább. A felmérés eredményét a következő táblázat összegzi. 5%-os szignifikancia szinten elfogadható-e az a feltételezés, hogy a fagylaltok iránti preferencia független a kisiskolás korától? 1. osztály 2. osztály 3. osztály 4. osztály Csokoládé 26 62 48 12 Vanília 8 18 6 Eper 16 42 28 11 Gazdaságstatisztika

3. Feladat - megoldás r=3; s=4; DF=(r-1)(s-1)=(3-1)(4-1)=6; =5% A 6 szabadságfokú khi-négyzet eloszlás táblázatából az =5%-hoz tartozó érték: Döntés: χ 2sz< χ20,05 =>a nullhipotézis elfogadható, a fagylaltok iránti preferencia független a kisiskolás korától. F11= 148*50/289 = 25,606 F21= 44*50/289 = 7,612 … F34=97*29/289=9,734 1. osztály 2. osztály 3. osztály 4. osztály Csokoládé 26 62 48 12 148 25.606 62.478 45.066 14.851   Vanília 8 18 6 44 7.612 18.574 13.398 4.415 Eper 16 42 28 11 97 16.782 40.948 29.536 9.734 50 122 88 29 289 f1· f2· f3· f·1 f·2 f·3 f·4 Gazdaságstatisztika

Példa – Feladatgyűjtemény (21. feladat) Vizsgáljuk meg, hogy a Tisza Szegednél mért évi maximális vízállásai ugyanazt az eloszlást követték-e 1876 és 1925 között, mint 1926-tól 1975-ig! A méterben megadott adatok az alábbiak (α=10%): Megoldás: homogenitásvizsgálat H0: a két időszak maximális vízállásainak eloszlása azonos H1: a két időszak maximális vízállásainak eloszlása nem azonos   Gyakoriság 1876-1925 Gyakoriság 1926-1975 V < 5 5 10 5  V <6 11 6  V <7 13 7  V <8 8 < V 8 6 Gazdaságstatisztika

Megoldás Kontingencia táblázat: =0,10 DF=5-1=4 2kr=7,78 tap.gyak elm.gyak C1 C2 Peremgyakoriság 1 5 7.50 10 15 2 11 11.00 22 3 13 13.00 26 4 11.50 23 8 7.00 6 14 50 100 =0,10 DF=5-1=4 2kr=7,78 Mivel a számított érték (2,344) az elfogadási tartományba esik, a nullhipotézist elfogadjuk 10%-os szignifikancia szinten, vagyis a két időszak maximális vízállásainak eloszlása azonos. Gazdaságstatisztika

Paraméteres próbák A paraméteres próbák szigorúbb alkalmazási feltételeket igényelnek Arány-, ill. intervallum szintű mérési skáláról származó adatok állnak rendelkezésre Erősségük (a hamis nullhipotézis elutasításának valószínűsége) nagyobb Normális eloszlás paramétereire vonatkozó próbák Csoportosításuk: Egymintás, kétmintás, többmintás Független és páros mintás Várható értékre, szórásra, sokasági arányra irányuló

Egymintás próbák Az egymintás próbák mindig egy adott sokaság valamely jellemzőjére vonatkozó feltevések helyességének ellenőrzésére szolgálnak. Ennek érdekében a rendelkezésre álló egyetlen mintából meghatározott jellemzőt (átlag, tapasztalati szórás) valamely feltételezett, vagy kívánatosnak tartott állapothoz viszonyítjuk. Így annak a kérdésnek a megválaszolására alkalmasak, hogy az a sokaság, amelyből a minta származik lehet-e olyan, mint amilyennek mi azt a nullhipotézisben feltételezzük. Egymintás várható értékre irányuló próbák Egymintás sokasági szórásra irányuló próba

Egymintás próbák – sokasági szórásra irányuló próba Alkalmazási feltételek: normális eloszlású alapsokaság Nullhipotézis: Lehetséges ellenhipotézisek és elfogadási tartományok: A próbafüggvény χ2 eloszlású (DF=n-1):

Egymintás próbák – sokasági várható értékre irányuló próba Az alkalmazási feltételek függvényében kétféle próba: egymintás z-próba ha ismerjük az alapsokasági szórást (0), vagy ha nem ismerjük, de nagy mintával dolgozunk (n>30 és a 0-t a korrigált tapasztalati szórással becsüljük) egymintás t-próba ha nem ismerjük az alapsokasági szórást, és kis mintánk van Nullhipotézis: H0: =m0, vagyis a várható érték egy adott m0 értékkel egyenlő. Lehetséges ellenhipotézisek: H1: ≠m0 H1:  > m0 H1:  < m0

Egymintás próbák – egymintás z-próba Alkalmazás feltétele: normális eloszlású alapsokaság Nullhipotézis: Ellenhipotézisek és elfogadási tartományok: A próbafüggvény N(0;1) eloszlású: H0: =m0 H1: ≠m0 -z/2 <zsz<z/2 H1:  > m0 zsz<z H1:  < m0 zsz>-z

Egymintás próbák – egymintás t-próba Alkalmazás feltétele: normális eloszlású alapsokaság, ismeretlen alapsokasági szórás (és kis mintaelemszám) Nullhipotézis: Ellenhipotézisek és elfogadási tartományok: A próbafüggvény Student eloszlású (DF=n-1): H0: =m0 H1: ≠m0 -t/2 <tsz<t/2 H1:  > m0 tsz<t H1:  < m0 tsz>-t

Egymintás sokasági szórásra és várható értékre irányuló próbák Paraméteres próbák Egymintás sokasági szórásra és várható értékre irányuló próbák

Példa – Feladatgyűjtemény (40. feladat) Egy sörgyártó vállalatnál a sör névleges térfogata 500ml kell, hogy legyen, és a térfogat szórása legfeljebb 10ml lehet. Egy 100 elemű véletlen mintából ellenőrzik a szállítmányt. A mintából számított jellemzők: A minta alapján ellenőrizze az átlagos töltési térfogata és a töltési térfogat szórására a vonatkozó hipotézisek teljesülését! Térfogat, ml db -480 5 480-490 20 490-500 30 500-510 24 510-520 16 520- Összesen 100 Gazdaságstatisztika

Megoldás Mivel a számított érték (-0,714) az elfogadási tartományba esik, a nullhipotézist elfogadjuk 5%-os szignifikancia szinten, vagyis a töltési térfogat várható értéke 500ml. Nézzük a töltési térfogat várható értékre vonatkozó előírás teljesülését! (a töltési térfogat várható értéke 500 ml legyen) Sokasági várható értékre irányuló egymintás z-próba, n>30 Gazdaságstatisztika

Megoldás Mivel a számított érték (157,1724) az elutasítási tartományba esik, a nullhipotézist elutasítjuk 5%-os szignifikancia szinten, vagyis a töltési térfogat szórása nagyobb, mint 10ml. Nézzük a töltési térfogat szórására vonatkozó előírás teljesülését! (a sör töltési térfogatának szórása legfeljebb 10ml lehet) Sokasági szórásra vonatkozó hipotézis tesztelése n=100 Elfogadási tartomány: Elfogadási tartomány: Gazdaságstatisztika