Hipotézisvizsgálatok Paraméteres próbák Gazdaságstatisztika Hipotézisvizsgálatok Paraméteres próbák
A próbák osztályozása Mi a nullhipotézisük tárgya? Paraméterre és eloszlásra irányuló próbák Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek? A paraméteres próbák alkalmazási feltételei között szerepelnek a sokasági eloszlás típusára, egyes paramétereire vonatkozó elvárások A nemparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásának folytonosságát követeli meg Hány és mekkora minta szükséges a végrehajtásukhoz? Egy, két vagy többmintás próbák Független és páros mintás próbák Kis- és nagymintás próbák (határ n=30)
Paraméteres próbák A paraméteres próbák szigorúbb alkalmazási feltételeket igényelnek. Arány-, ill. intervallum szintű mérési skáláról származó adatok állnak rendelkezésre. Erősségük (a hamis nullhipotézis elutasításának valószínűsége) nagyobb. Normális eloszlás paramétereire vonatkozó próbák Csoportosításuk: Egymintás, kétmintás, többmintás Független és páros mintás Várható értékre, szórásra irányuló
Egymintás próbák Az egymintás próbák mindig egy adott sokaság valamely jellemzőjére vonatkozó feltevések helyességének ellenőrzésére szolgálnak. Ennek érdekében a rendelkezésre álló egyetlen mintából meghatározott jellemzőt (átlag, tapasztalati szórás) valamely feltételezett, vagy kívánatosnak tartott állapothoz viszonyítjuk. Így annak a kérdésnek a megválaszolására alkalmasak, hogy az a sokaság, amelyből a minta származik lehet-e olyan, mint amilyennek mi azt a nullhipotézisben feltételezzük. Egymintás várható értékre irányuló próbák Egymintás sokasági szórásra irányuló próba
Egymintás próbák – sokasági szórásra irányuló próba Alkalmazási feltételek: normális eloszlású alapsokaság Nullhipotézis: Lehetséges ellenhipotézisek és elfogadási tartományok: A próbafüggvény χ2 eloszlású (DF=n-1):
Példa Mivel a számított érték kisebb, mint a kritikus érték, így 5%-os szignifikancia szinten elfogadható a nullhipotézis, vagyis nincs szignifikáns eltérés a szórás tekintetében. A kerti törpék piacán az elmúlt évtizedekben a törpék átlagos magassága 120 cm volt, ugyanakkor a szórás ingadozott. A kiszámítható alapanyag-ellátás feltétele, hogy a szórás ne haladja meg a 10cm-t. Egy tavalyi felmérés szerint egy 25 elemű véletlen minta szórása 12cm volt. A magasság normális eloszlása ismert. Ellenőrizzük 95%-os megbízhatósággal, nincs-e veszélyben az alapanyag ellátás? Megoldás: n=25 DF=24 s*=12 σ0=10 Elfogadási tartomány: Kritikus érték: (α=5%, DF=24) ˂
Példa Nézzük ismét az a példát, amely a légi közlekedésben az utasok átlagos testsúlyára és a testsúly szórására vonatkozóan élt feltételezésekkel (lásd illeszkedésvizsgálat, ahol a normalitást már igazoltuk). A légitársaság a terhelést 78kg-os átlagos testsúlyra és 11kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. A mintából számított jellemzők: 5%-os szignifikancia szint mellett most teszteljük az utasok testsúlyának szórására vonatkozó feltevést! Testsúly (kg) Ügyfelek száma (fő) -60 7 60-70 16 70-80 32 80-90 28 90-100 13 100- 4 Összesen 100
˂ Példa Megoldás: n=100 (DF=99) Hipotézisek: H0: σ=11kg H1: σ>11kg Mivel a számított érték kisebb, mint a kritikus érték, így 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, azaz a sokasági szórásra vonatkozó feltételezés elfogadható. Megoldás: n=100 (DF=99) Hipotézisek: H0: σ=11kg H1: σ>11kg H1: σ≠11kg Elfogadási tartomány: Kritikus érték: (α=5%, DF=99) ˂ Mivel a számított érték a két kritikus érték közé esik, így 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, azaz a sokasági szórásra vonatkozó feltételezés elfogadható. Elfogadási tartomány: Kritikus értékek: (α/2=2,5%, DF=99)
Egymintás próbák – sokasági várható értékre irányuló próba Az alkalmazási feltételek függvényében kétféle próba: egymintás z-próba ha ismerjük az alapsokasági szórást (0), vagy ha nem ismerjük, de nagy mintával dolgozunk (n>30 és a 0-t a korrigált tapasztalati szórással becsüljük) egymintás t-próba ha nem ismerjük az alapsokasági szórást, és kis mintánk van Nullhipotézis: H0: =m0, vagyis a várható érték egy adott m0 értékkel egyenlő. Lehetséges ellenhipotézisek: H1: ≠ m0 H1: > m0 H1: < m0
Egymintás próbák – egymintás z-próba Alkalmazás feltétele: normális eloszlású alapsokaság Nullhipotézis: Ellenhipotézisek és elfogadási tartományok: A próbafüggvény N(0;1) eloszlású: H0: =m0 H1: ≠ m0 -z/2 <zsz<z/2 H1: > m0 zsz<z H1: < m0 zsz>-z
Példa Nézzük ismét az a példát, amely a légi közlekedésben az utasok átlagos testsúlyára és a testsúly szórására vonatkozóan élt feltételezésekkel (lásd illeszkedésvizsgálat, ahol a normalitást már igazoltuk). A légitársaság a terhelést 78kg-os átlagos testsúlyra és 11kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. A mintából számított jellemzők: 5%-os szignifikancia szint mellett most teszteljük az utasok testsúlyának várható értékére vonatkozó feltevést! Testsúly (kg) Ügyfelek száma (fő) -60 7 60-70 16 70-80 32 80-90 28 90-100 13 100- 4 Összesen 100
Példa Mivel a számított érték (0,49) kisebb, mint a kritikus érték, így a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten elfogadható, hogy a sokasági várható érték 78kg. Megoldás: n=100 Hipotézisek: H0: μ=78kg H1: μ>78kg H1: μ≠78kg Elfogadási tartomány: Kritikus érték: (α=5%) ˂ Elfogadási tartomány: Kritikus érték: (α/2=2,5%) Mivel a számított érték a két kritikus érték közé esik, így a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten elfogadható, hogy az utasok testsúlyának várható értéke 78kg.
Egymintás próbák – egymintás t-próba Alkalmazás feltétele: normális eloszlású alapsokaság, ismeretlen alapsokasági szórás (és kis mintaelemszám) Nullhipotézis: Ellenhipotézisek és elfogadási tartományok: A próbafüggvény Student eloszlású (DF=n-1): H0: =m0 H1: ≠ m0 -t/2 <tsz<t/2 H1: > m0 tsz<t H1: < m0 tsz>-t
Példa Egy konzervgyárban a sűrített paradicsom töltését automata gép végzi. A dobozok névleges súlya 450g, amitől csak véletlenszerű eltérések megengedettek. A súly szerinti eloszlás normálisnak tekinthető. A gyár az egyik szállítmányból 25 elemű mintát vett, a mintában a dobozok átlagos súlya 446g volt, a szórás pedig 11g. Ellenőrizzük a névleges töltősúlyra vonatkozó hipotézist 5%-os szignifikancia szinten! Megoldás: Mivel a mintaelemszám kisebb, mint 30 és nem ismert a sokasági szórás, továbbá a súly szerinti eloszlás normálisnak tekinthető, így a sokaság várható értékére vonatkozó feltevésünket egymintás t-próbával végezhetjük el.
˂ Példa Megoldás: n=25 (<30) μ=450g Hipotézisek: Mivel a számított érték kisebb, mint a kritikus érték, így a nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz nem fogadható el a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan eltér 450g-tól. Megoldás: n=25 (<30) μ=450g Hipotézisek: H0: μ=450g H1: μ<450g H1: μ≠450g Elfogadási tartomány: Kritikus érték: (α=5%, DF=24) ˂ Elfogadási tartomány: Kritikus érték: (α/2=2,5%, DF=24) Mivel a számított érték az elfogadási tartományba esik, így a nullhipotézist 5%-os szignifikancia szinten elfogadjuk, azaz elfogadható a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan nem tér el 450g-tól.
Tesztelendő paraméter Alkalmazási feltételek Hipotézisek Próbafüggvény Próbafüggvény eloszlása Sokasági várható érték Sokasági eloszlás normális sokasági szórás ismert H0: = m0 H1: (1) ≠ m0 (2) > m0 (3) < m0 standard normális (z) sokasági szórás nem ismert Student t-eloszlás (DF=n-1) Sokasági variancia (szórás) H0: σ = σ0 (1) σ ≠ σ0 (2) σ > σ0 (3) σ < σ0 χ2-eloszlás
Példa – Feladatgyűjtemény (27.) Egy szárazelemeket gyártó vállalatnál megvizsgálták egy új típusú elemfajta élettartamát. A korábbi elemek várható élettartama 299 óra volt. Véletlen mintavétellel kiválasztva 200 új elemet, az átlagos élettartamuk 300 óra volt, 8 óra szórással. Valóban megnőtt az elemek várható élettartama (α=1%)? Megoldás: Egymintás, sokasági várható értékre irányuló próba Bár σ nem ismert, de n>30 egymintás z-próba n=200
Példa – Feladatgyűjtemény (27.) Hipotézisek: H0: μ=299h H1: μ>299h Elfogadási tartomány: Kritikus érték (α=1%): ˂ Mivel zsz<zα, ezért H0-t elfogadjuk 99%-os megbízhatósági szinten, azaz nem nőtt meg az elemek élettartama, és az továbbra is várhatóan 299 óra.
Példa – Feladatgyűjtemény (28.) Egy automata gépsor által töltött dobozokból 10 elemű mintát veszünk. A mintába került 10 doboz grammban kifejezett töltősúlya a következő: 255g, 242g, 245g, 253g, 249g, 251g, 250g, 255g, 245g, 246g. Ellenőrizzük, hogy a gépsor teljesíti-e a 250g várható értékű specifikációt 1%-os szignifikancia szinten! Megoldás: Egymintás sokasági várható értékre irányuló próba egymintás t-próba, n<30 n=10 (DF=9)
Példa – Feladatgyűjtemény (28.) Hipotézisek: H0: μ=250 H1: μ≠250 Elfogadási tartomány: Kritikus érték: (α/2=0,5%, DF=9) Mivel a számított érték (-0,63) a két kritikus érték közé esik (±3,25), így a nullhipotézist elfogadjuk, azaz 1%-os szignifikancia szinten elfogadható, hogy a gépsor teljesíti a 250g-os specifikációt.
Példa – Feladatgyűjtemény (29.) Egy konzervgyárban burgonyát használnak fel. Csomagolási okok miatt a burgonyák súlya nem szóródhat. Másfelől a gyárat a súlykülönbségek is érdeklik, mert a különböző méretű burgonyákat futószalag-módszerrel tudják kiválogatni. Ezért az átlagos súlykülönbségnek (szóródásnak) 5 grammnak kell lennie. A burgonyák súlyának eloszlására a normális eloszlás feltételezhető, és a tesztelést 1%-os szignifikancia szinten végezzük el. Tegyük fel, hogy két termelő szállítja be a burgonyákat. Az A termelőtől származó burgonyából vett 16 elemű minta alapján a szórás 3,8 grammra adódott. A B termelő által beszállított burgonyából vett 101 elemű minta alapján a szórás 6,6 grammra adódott. Teljesítik-e a beszállítók az elvárást? Megoldás: egymintás, sokasági szórásra irányuló próba
Példa – Feladatgyűjtemény (29.) Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem különbözik szignikánsan (1%) a σ=5 grammtól. „A” termelő esete: H0: σ=5 H1: σ≠5 n=16 s*=3,8gr H1: σ <5 Elfogadási tartomány: Kritikus értékek: (α/2=0,05%, DF=15) Elfogadási tartomány: Kritikus érték: (α=1%, DF=15) Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem kisebb szignikánsan (1%), mint 5 gramm.
Példa – Feladatgyűjtemény (29.) Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan különbözik (1%) a σ=5 grammtól. „B” termelő esete: H0: σ=5 H1: σ ≠5 n=101 s*=6,6gr H1: σ >5 Elfogadási tartomány: Kritikus értékek: (α/2=0,05%, DF=100) Elfogadási tartomány: Kritikus érték: (α=1%, DF=100) Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan (1%) nagyobb, mint 5 gramm.
Példa – Feladatgyűjtemény (30.) Egy csővágó automata gépnek 1200mm hosszú csődarabokat kell levágnia. A gyártásközi ellenőrzés feladata, hogy megállapítsa, hogy a gép által gyártott darabok hosszmérete megfelel-e az előírásoknak. Előző adatfelvételekből ismert, hogy a gép által gyártott csődarabok hossza normális eloszlású valószínűségi változó 3mm szórással. A gyártásközi ellenőrzésre kiválasztottak egy 16 elemű mintát. A csődarabok hossza a mintában: Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3mm-t! Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak! 1208 1204 1202 1194 1195 1205 1197 1193 1191 1187
Példa – Feladatgyűjtemény (30.) Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3mm-t a minta alapján! Megoldás: Egymintás szóráspróba n=16 Hipotézisek: H0: σ=3 H1: σ>3 Elfogadási tartomány: Kritikus érték: (α=5%, DF=15) 1208 1204 1202 1194 1195 1205 1197 1193 1191 1187 Mivel a számított érték az elutasítási tartományba esik, így a nullhipotézist 5%-os szignifikancia szinten elvetjük. A csődarabok hosszának szórása 5%-os szignifikancia szinten meghaladja a 3mm-t.
Példa – Feladatgyűjtemény (30.) Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak (1200mm, 5%)! Megoldás: Egymintás t-próba (n<30) H0: μ=1200 H1: μ≠1200 Elfogadási tartomány: Kritikus érték: (α/2=2,5%, DF=15) 5%-os szignifikancia szinten a csővágó automata teljesíti az 1200mm várható értékű specifikációt, így elfogadjuk a nullhipotézist.