Gazdaságstatisztika Hipotézisvizsgálatok Paraméteres próbák november 19., november 20., november 26.
1. A null- (H 0 ) és alternatív (H 1 ) hipotézisek megfogalmazása 2. Olyan próbafüggvény keresése, amelynek eloszlása a nullhipotézis helyességét feltételezve és a próba alkalmazási feltételeit figyelembe véve egyértelműen meghatározható. 3. A szignifikancia szint (α) megválasztása, és a próbafüggvény lehetséges értéktartományának felosztása elfogadási és elutasítási tartományra. 4. Mintavétel, ez alapján a próbafüggvény, mint valószínűségi változó számszerű értékének meghatározása. 5. Döntés a hipotézisek helyességéről: – ha a próbafüggvény értéke az előre kijelölt elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist, – ha a próbafüggvény értéke az elutasítási tartományba esik, akkor elutasítjuk a nullhipotézist. A hipotézisvizsgálat lépései
A próbák osztályozása Mi a nullhipotézisük tárgya? – Paraméterre és eloszlásra irányuló próbák Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek? – A paraméteres próbák alkalmazási feltételei között szerepelnek a sokasági eloszlás típusára, egyes paramétereire vonatkozó elvárások – A nemparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásának folytonosságát követeli meg Hány és mekkora minta szükséges a végrehajtásukhoz? – Egy, két vagy többmintás próbák – Független és páros mintás próbák – Kis- és nagymintás próbák (határ n=30)
Paraméteres próbák A paraméteres próbák szigorúbb alkalmazási feltételeket igényelnek. Arány-, ill. intervallum szintű mérési skáláról származó adatok állnak rendelkezésre. Erősségük (a hamis nullhipotézis elutasításának valószínűsége) nagyobb. Normális eloszlás paramétereire vonatkozó próbák Csoportosításuk: – Egymintás, kétmintás, többmintás – Független és páros mintás – Várható értékre, szórásra, sokasági arányra irányuló
Az egymintás próbák mindig egy adott sokaság valamely jellemzőjére vonatkozó feltevések helyességének ellenőrzésére szolgálnak. Ennek érdekében a rendelkezésre álló egyetlen mintából meghatározott jellemzőt (átlag, tapasztalati szórás) valamely feltételezett, vagy kívánatosnak tartott állapothoz viszonyítjuk. Így annak a kérdésnek a megválaszolására alkalmasak, hogy az a sokaság, amelyből a minta származik lehet-e olyan, mint amilyennek mi azt a nullhipotézisben feltételezzük. – Egymintás várható értékre irányuló próbák – Egymintás sokasági szórásra irányuló próba Egymintás próbák
Egymintás próbák – sokasági szórásra irányuló próba Alkalmazási feltételek: normális eloszlású alapsokaság Nullhipotézis: Lehetséges ellenhipotézisek és elfogadási tartományok: A próbafüggvény χ 2 eloszlású (DF=n-1):
Példa A kerti törpék piacán az elmúlt évtizedekben a törpék átlagos magassága 120 cm volt, ugyanakkor a szórás ingadozott. A kiszámítható alapanyag-ellátás feltétele, hogy a szórás ne haladja meg a 10cm-t. Egy tavalyi felmérés szerint egy 25 elemű véletlen minta szórása 12cm volt. A magasság normális eloszlása ismert. Ellenőrizzük 95%-os megbízhatósággal, nincs-e veszélyben az alapanyag ellátás? Megoldás: n=25 DF=24 s * =12 σ 0 =10 Elfogadási tartomány: Kritikus érték: (α=5%, DF=24) ˂ Mivel a számított érték kisebb, mint a kritikus érték, így 5%-os szignifikancia szinten elfogadható a nullhipotézis, vagyis nincs szignifikáns eltérés a szórás tekintetében.
Példa Nézzük ismét az a példát, amely a légi közlekedésben az utasok átlagos testsúlyára és a testsúly szórására vonatkozóan élt feltételezésekkel (lásd illeszkedésvizsgálat, ahol a normalitást már igazoltuk). A légitársaság a terhelést 78kg-os átlagos testsúlyra és 11kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. A mintából számított jellemzők: 5%-os szignifikancia szint mellett most teszteljük az utasok testsúlyának szórására vonatkozó feltevést! Testsúly (kg) Ügyfelek száma (fő) Összesen100
Megoldás: n=100 (DF=99) Hipotézisek: H 0 : σ=11kg H 1 : σ>11kg H 1 : σ≠11kg Példa Elfogadási tartomány: Kritikus érték: (α=5%, DF=99) ˂ Mivel a számított érték kisebb, mint a kritikus érték, így 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, azaz a sokasági szórásra vonatkozó feltételezés elfogadható. Elfogadási tartomány: Kritikus értékek: (α/2=2,5%, DF=99) Mivel a számított érték a két kritikus érték közé esik, így 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, azaz a sokasági szórásra vonatkozó feltételezés elfogadható.
Az alkalmazási feltételek függvényében kétféle próba: – egymintás z-próba ha ismerjük az alapsokasági szórást ( 0 ), vagy ha nem ismerjük, de nagy mintával dolgozunk (n>30 és a 0 -t a korrigált tapasztalati szórással becsüljük) – egymintás t-próba ha nem ismerjük az alapsokasági szórást, és kis mintánk van Nullhipotézis: H 0 : =m 0, vagyis a várható érték egy adott m 0 értékkel egyenlő. Lehetséges ellenhipotézisek: Egymintás próbák – sokasági várható értékre irányuló próba H 1 : ≠ m 0 H 1 : > m 0 H 1 : < m 0
Egymintás próbák – egymintás z-próba Alkalmazás feltétele: normális eloszlású alapsokaság Nullhipotézis: Ellenhipotézisek és elfogadási tartományok: A próbafüggvény N(0;1) eloszlású: H 0 : =m 0 H 1 : ≠ m 0 -z /2 <z sz <z /2 H 1 : > m 0 z sz <z H 1 : -z
Példa Nézzük ismét az a példát, amely a légi közlekedésben az utasok átlagos testsúlyára és a testsúly szórására vonatkozóan élt feltételezésekkel (lásd illeszkedésvizsgálat, ahol a normalitást már igazoltuk). A légitársaság a terhelést 78kg-os átlagos testsúlyra és 11kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. A mintából számított jellemzők: 5%-os szignifikancia szint mellett most teszteljük az utasok testsúlyának várható értékére vonatkozó feltevést! Testsúly (kg) Ügyfelek száma (fő) Összesen100
Megoldás: n=100 Hipotézisek: H 0 : μ=78kg H 1 : μ>78kg H 1 : μ≠78kg Példa Elfogadási tartomány: Kritikus érték: (α=5%) ˂ Mivel a számított érték a két kritikus érték közé esik, így a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten elfogadható, hogy az utasok testsúlyának várható értéke 78kg. Elfogadási tartomány: Kritikus érték: (α/2=2,5%) Mivel a számított érték (0,49) kisebb, mint a kritikus érték, így a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten elfogadható, hogy a sokasági várható érték 78kg.
Egymintás próbák – egymintás t-próba Alkalmazás feltétele: normális eloszlású alapsokaság, ismeretlen alapsokasági szórás (és kis mintaelemszám) Nullhipotézis: Ellenhipotézisek és elfogadási tartományok: A próbafüggvény Student eloszlású (DF=n-1): H 0 : =m 0 H 1 : ≠ m 0 -t /2 <t sz <t /2 H 1 : > m 0 t sz <t H 1 : -t
Egy konzervgyárban a sűrített paradicsom töltését automata gép végzi. A dobozok névleges súlya 450g, amitől csak véletlenszerű eltérések megengedettek. A súly szerinti eloszlás normálisnak tekinthető. A gyár az egyik szállítmányból 25 elemű mintát vett, a mintában a dobozok átlagos súlya 446g volt, a szórás pedig 11g. Ellenőrizzük a névleges töltősúlyra vonatkozó hipotézist 5%-os szignifikancia szinten! Megoldás: Mivel a mintaelemszám kisebb, mint 30 és nem ismert a sokasági szórás, továbbá a súly szerinti eloszlás normálisnak tekinthető, így a sokaság várható értékére vonatkozó feltevésünket egymintás t- próbával végezhetjük el. Példa
Megoldás: n=25 (<30) μ=450g Hipotézisek: H 0 : μ=450g H 1 : μ<450g H 1 : μ≠450g Példa Elfogadási tartomány: Kritikus érték: (α=5%, DF=24) ˂ Mivel a számított érték kisebb, mint a kritikus érték, így a nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz nem fogadható el a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan eltér 450g-tól. Elfogadási tartomány: Kritikus érték: (α/2=2,5%, DF=24) Mivel a számított érték az elfogadási tartományba esik, így a nullhipotézist 5%-os szignifikancia szinten elfogadjuk, azaz elfogadható a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan nem tér el 450g-tól.
Tesztelendő paraméter Alkalmazási feltételek HipotézisekPróbafüggvényPróbafüggv ény eloszlása Sokasági várható érték Sokasági eloszlás normális sokasági szórás ismert H 0 : = m 0 H 1 : (1) ≠ m 0 (2) > m 0 (3) < m 0 standard normális (z) Sokasági eloszlás normális sokasági szórás nem ismert H 0 : = m 0 H 1 : (1) ≠ m 0 (2) > m 0 (3) < m 0 Student t- eloszlás (DF=n-1) Sokasági variancia (szórás) Sokasági eloszlás normális H 0 : σ = σ 0 H 1 : (1) σ ≠ σ 0 (2) σ > σ 0 (3) σ < σ 0 χ 2 -eloszlás (DF=n-1)
Példa – Feladatgyűjtemény (27.) Egy szárazelemeket gyártó vállalatnál megvizsgálták egy új típusú elemfajta élettartamát. A korábbi elemek várható élettartama 299 óra volt. Véletlen mintavétellel kiválasztva 200 új elemet, az átlagos élettartamuk 300 óra volt, 8 óra szórással. Valóban megnőtt az elemek várható élettartama (α=1%)? Megoldás: Egymintás, sokasági várható értékre irányuló próba Bár σ nem ismert, de n>30 egymintás z-próba n=200
Hipotézisek: H 0 : μ=299h H 1 : μ>299h Példa – Feladatgyűjtemény (27.) Elfogadási tartomány: Kritikus érték (α=1%): Mivel z sz <z α, ezért H 0 -t elfogadjuk 99%-os megbízhatósági szinten, azaz nem nőtt meg az elemek élettartama, és az továbbra is várhatóan 299 óra. ˂
Egy automata gépsor által töltött dobozokból 10 elemű mintát veszünk. A mintába került 10 doboz grammban kifejezett töltősúlya a következő: 255g, 242g, 245g, 253g, 249g, 251g, 250g, 255g, 245g, 246g. Ellenőrizzük, hogy a gépsor teljesíti-e a 250g várható értékű specifikációt 1%-os szignifikancia szinten! Megoldás: Egymintás sokasági várható értékre irányuló próba egymintás t-próba, n<30 n=10 (DF=9) Példa – Feladatgyűjtemény (28.)
Hipotézisek: H 0 : μ=250 H 1 : μ≠250 Példa – Feladatgyűjtemény (28.) Elfogadási tartomány: Kritikus érték: (α/2=0,5%, DF=9) Mivel a számított érték (-0,63) a két kritikus érték közé esik (±3,25), így a nullhipotézist elfogadjuk, azaz 1%-os szignifikancia szinten elfogadható, hogy a gépsor teljesíti a 250g-os specifikációt.
Egy konzervgyárban burgonyát használnak fel. Csomagolási okok miatt a burgonyák súlya nem szóródhat. Másfelől a gyárat a súlykülönbségek is érdeklik, mert a különböző méretű burgonyákat futószalag-módszerrel tudják kiválogatni. Ezért az átlagos súlykülönbségnek (szóródásnak) 5 grammnak kell lennie. A burgonyák súlyának eloszlására a normális eloszlás feltételezhető, és a tesztelést 1%-os szignifikancia szinten végezzük el. Tegyük fel, hogy két termelő szállítja be a burgonyákat. Az A termelőtől származó burgonyából vett 16 elemű minta alapján a szórás 3,8 grammra adódott. A B termelő által beszállított burgonyából vett 101 elemű minta alapján a szórás 6,6 grammra adódott. Teljesítik-e a beszállítók az elvárást? Megoldás: egymintás, sokasági szórásra irányuló próba Példa – Feladatgyűjtemény (29.)
„A” termelő esete: H 0 : σ=5 H 1 : σ≠5 n=16 s * =3,8gr H 1 : σ <5 Példa – Feladatgyűjtemény (29.) Elfogadási tartomány: Kritikus értékek: (α/2=0,05%, DF=15) Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem különbözik szignikánsan (1%) a σ=5 grammtól. Elfogadási tartomány: Kritikus érték: (α=1%, DF=15) Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem kisebb szignikánsan (1%), mint 5 gramm.
„B” termelő esete: H 0 : σ=5 H 1 : σ ≠5 n=101 s * =6,6gr H 1 : σ >5 Példa – Feladatgyűjtemény (29.) Elfogadási tartomány: Kritikus értékek: (α/2=0,05%, DF=100) Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan különbözik (1%) a σ=5 grammtól. Elfogadási tartomány: Kritikus érték: (α=1%, DF=100) Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan (1%) nagyobb, mint 5 gramm.
Egy csővágó automata gépnek 1200mm hosszú csődarabokat kell levágnia. A gyártásközi ellenőrzés feladata, hogy megállapítsa, hogy a gép által gyártott darabok hosszmérete megfelel-e az előírásoknak. Előző adatfelvételekből ismert, hogy a gép által gyártott csődarabok hossza normális eloszlású valószínűségi változó 3mm szórással. A gyártásközi ellenőrzésre kiválasztottak egy 16 elemű mintát. A csődarabok hossza a mintában: a) Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3mm-t! b) Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak! Példa – Feladatgyűjtemény (30.)
Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3mm-t a minta alapján! Megoldás: Egymintás szóráspróba n=16 Hipotézisek: H 0 : σ=3 H 1 : σ>3 Példa – Feladatgyűjtemény (30.) Elfogadási tartomány: Kritikus érték: (α=5%, DF=15) Mivel a számított érték az elutasítási tartományba esik, így a nullhipotézist 5%-os szignifikancia szinten elvetjük. A csődarabok hosszának szórása 5%-os szignifikancia szinten meghaladja a 3mm-t.
Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak (1200mm, 5%)! Megoldás: Egymintás t-próba (n<30) H 0 : μ=1200 H 1 : μ≠1200 Példa – Feladatgyűjtemény (30.) Elfogadási tartomány: Kritikus érték: (α/2=2,5%, DF=15) 5%-os szignifikancia szinten a csővágó automata teljesíti az 1200mm várható értékű specifikációt, így elfogadjuk a nullhipotézist.
Paraméteres próbák Kétmintás próbák
A kétmintás próbák – ideértve a speciális páros mintás próbákat is – annak a kérdésnek a vizsgálatára használhatók, hogy két meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb.) sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. A kétmintás próbák két sokaság egymással való összehasonlítását szolgálják. A sokaságok időben, térben vagy bármilyen más tekintetben különbözhetnek egymástól. – Kétmintás, a sokasági varianciák egyezésére irányuló próba – Páros mintás, a várható értékek különbségére irányuló próba – Két, független mintás, várható értékek egyezésére irányuló z-, ill. t- próba Kétmintás próbák
Alkalmazási feltétel: normális eloszlású, független alapsokaságok Nullhipotézis: Ellenhipotézis: H 1 : 1 2 > 2 2 A próbafüggvény F-eloszlású (DF 1, DF 2, DF 1,2 =n 1,2 -1) Táblázataink is egyoldali próbára vonatkoznak (F , DF 1, DF 2 kritikus értékeit adják meg) A két alapeloszlásból vett n 1 és n 2 elemű minták korrigált tapasztalati szórásai torzítatlan becslései az alapsokasági szórásoknak. Kétmintás próbák – a sokasági szórások összehasonlítására irányuló próba ahol s 1 *2 >s 2 *2
Példa Egy fodrászatba férfiak és nők egyaránt járnak. 12 véletlenszerűen kiválasztott férfi és 15 véletlenszerűen kiválasztott nő esetében mérjük a szolgáltatás időtartamát, amelynek eloszlása normális. A férfiak esetében a szolgáltatás igénybevételének átlagos ideje 35 perc, 26 perc szórással. A nők esetében a frizura elkészítésének átlagos ideje 48 perc, 30 perc szórással. Teszteljük 5%-os szignifikancia szinten, hogy van-e különbség a szolgáltatási idő szórása között a férfiak és nők esetében! Megoldás: kétmintás, sokasági szórások vizsgálatára irányuló próba Hipotézisek felállítása:
Számított érték meghatározása: Kritikus érték meghatározása: α=5% DF nő =15-1=14=DF 1 DF férfi =12-1=11=DF 2 F krit =2,72 Példa Mivel a számított érték (1,33), kisebb, mint a kritikus érték (2,72), így a nullhipotézist 5%-os szignifikancia szinten nincs jogunk elutasítani, vagyis a férfiak és nők kiszolgálási idejének szórása között nincs szignifikáns különbség.
Két film tetszési indexét hasonlítja össze egy közvéleménykutató intézet. Az első filmre, a Leányregény címűre 104 elemű mintát vettek, ebből 40 nő volt. A pontok átlaga 65, szórása 3,6 volt a mintában. A rém c. filmre 140 elemű mintát vettek, melyben a férfiak száma 96 volt, a pontok átlaga itt 74 volt, a szórás pedig 4,4. A pontok normális eloszlása mindkét csoportban feltételezhető. Teszteljük 1%-os szignifikancia szinten, hogy van-e különbség a két filmre adott pontok szórása között! Megoldás: Mivel a filmre adott pontszámok normalitása feltételezhető, így használhatjuk az F-próbát a sokasági szórások egyezőségének a vizsgálatára. 1-es indexszel jelöljük a A rém c. filmet, 2-es indexszel Leányregény c. filmet. Példa
Számított érték meghatározása: Kritikus érték meghatározása: α=1% DF 1 =140-1=139 DF 2 =104-1=103 F krit =1,53 Példa Mivel a számított érték (1,494), kisebb, mint a kritikus érték (1,53), így a nullhipotézist 1%-os szignifikancia szinten nincs jogunk elutasítani, vagyis a két filmre adott ponszámok szórása között nincs szignifikáns különbség.
FÜGGETLEN MINTÁK Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák Az alkalmazási feltételek függvényében kétféle próba: – kétmintás z-próba ha ismerjük az alapsokasági szórásokat ( 1 és 2 ), vagy ha nem ismerjük, de nagy mintával dolgozunk (n 1,2 >30 és az ismeretlen alapsokasági szórásokat a korrigált tapasztalati szórásokkal becsüljük) – kétmintás t-próba ha nem ismerjük az alapsokasági szórásokat, és kis mintáink vannak Nullhipotézis: H 0 : 1 = 2 (vagyis a két sokasági várható érték egyenlő) Lehetséges ellenhipotézisek: H 1 : 1 ≠ μ 2 H 1 : 1 > μ 2 H 1 : 1 < μ 2
Kétmintás z-próba Alkalmazás feltétele: normális eloszlású alapsokaságok, ismert alapsokasági varianciák Nullhipotézis: H 0 : 1 = 2 Lehetséges ellenhipotézisek és elfogadási tartományok: A próbafüggvény N(0,1) eloszlású: Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák H 1 : 1 ≠ 2 -z /2 <z sz <z /2 H 1 : 1 > 2 z sz <z H 1 : 1 -z
Nézzük ismét az előző, két film tetszési indexét összehasonlító példánkat! Most teszteljük azt 1%-os szignifikancia szinten, hogy a van-e különbség a két film átlagos tetszési pontszáma között! Emlékeztetőül: Az első filmre, a Leányregény címűre 104 elemű mintát vettek, ebből 40 nő volt. A pontok átlaga 65, szórása 3,6 volt a mintában. A rém c. filmre 140 elemű mintát vettek, melyben a férfiak száma 96 volt, a pontok átlaga itt 74 volt, a szórás pedig 4,4. A pontok normális eloszlása mindkét csoportban feltételezhető. Megoldás: Mivel mindkét film esetében a mintaelemszám nagyobb, mint 30, továbbá feltételezhető a pontok normális eloszlása, így kétmintás z- próbát használhatunk (1-es index A rém c. film, 2-es index a Leányregény c. film).Példa
Hipotézisek: H 0 : 1 = 2 H 1 : 1 ≠ 2 Számított érték meghatározása: Kritikus értékek meghatározása: α=1% z α/2 =±2,34Példa Mivel a számított érték nem az elfogadási tartományba esik, így szignifikáns különbség van 1%-os szignifikancia szinten a két film tetszési indexe között.
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák Kétmintás t-próba Alkalmazás feltétele: normális eloszlású alapsokaságok, ismeretlen alapsokasági varianciák – kis minták esetén akkor kezelhető, ha az ismeretlen szórásokról tudjuk, hogy azok egyenlőek (F-PRÓBA) Nullhipotézis: H 0 : 1 = 2 Lehetséges ellenhipotézisek és elfogadási tartományok: A próbafüggvény Student eloszlású (DF=n 1 +n 2 -2): H 1 : 1 ≠ 2 -t /2 <t sz <t /2 H 1 : 1 > 2 t sz <t H 1 : 1 -t
Korábbi fodrászatos példánk (lásd sokasági szórások egyezésére irányuló próba) vizsgáljuk meg, hogy van-e különbség a kiszolgálási idő várható értéke között a férfiak és a nők esetében 5%-os szignifikancia szinten! n nő =15 n férfi =12 A kétmintás t-próba alkalmazási feltételei: az alapsokaságok eloszlásának normalitása (nevezetesen a szolgáltatási idő eloszlása mind a férfiak, mind a nők esetében normális, ezt feltételeztük már az F-próba elvégzésénél is) nő és férfi nem ismert és n nő <30 és n férfi <30 nő = férfi, ezt már bizonyítottuk F-próbával korábbanPélda
Hipotézisek felállítása: H 0 : nő = férfi H 1 : nő ≠ férfi Számított érték meghatározása: Kritikus érték meghatározása: α=5% DF= =25 t 0,975 =±2,06Példa Mivel a számított érték az elfogadási tartományba esik, így a H 0 hipotézist elfogadjuk, azaz 5%-os szignifikancia szinten nincs különbség a férfiak és a nők kiszolgálási idejének várható értéke között.
Hipotézisek felállítása: H 0 : nő = férfi H 1 : nő > férfi Számított érték meghatározása: Kritikus érték meghatározása: α=5% DF= =25 t 0,95 =1,708Példa Mivel t sz =1,185<1,708, így a H 0 -t elfogadjuk, azaz nincs különbség a két várható érték között 5%-os szignifikancia szinten.
PÁROS MINTÁK Páros mintáknál az egyik minta elemeinek kiválasztása maga után vonja a másik minta elemeinek kiválasztását. n=n 1 =n 2 a két páros minta összetartozó elemeinek d i =y i -x i különbségeit képezzük egy n elemű minta Nullhipotézis: H 0 : μ 1 =μ 2 vagy H 0 : μ d =δ 0 Ellenhipotézis: egyoldali vagy kétoldali Próbafüggvény Student eloszlást követ (DF=n-1): Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák
Egy speciális diéta hatásosságát vizsgálják. Ehhez minden vizsgálati személy testsúlyát megmérték a diéta előtt és után. A hipotetikus kísérlet eredménye 9 kísérleti személyen a következő táblázatban látható. Vizsgáljuk meg 1%-os szignifikancia szinten, hogy hatásos volt-e a diéta! Megoldás: Páros mintáról van szó, hiszen ugyanazon diétában résztvevő személyek testsúlyát mérték meg a diéta megkezdése előtt és után. Példa A vizsgált személy sorszáma Testsúly a diéta előtt Testsúly a diéta után
A diéta megkezdése előtt a 9 résztvevő testsúlyának átlaga: Hipotézisek: H 0 : μ e =μ u (μ e -μ u =0) H 1 : μ e >μ u (μ e -μ u >0) Példa A vizsgált személy sorszáma Testsúly a diéta előtt Testsúly a diéta után
Számított érték meghatározása: Kritikus érték: α=1% t α =2,896 Elfogadási tartomány: t sz < t α Példa A vizsgált személy sorszáma Testsúly a diéta előtt Testsúly a diéta után didi Mivel a számított érték (1,511) nagyobb, mint a kritikus érték (2,896), így a nullhipotézist elutasítjuk, vagyis van szignifikáns különbség a páciensek testsúlyában a diéta előtt és után.
Tesztelendő paraméter Alkalmazási feltételekHipotézisekPróbafüggvényPróbafüggvény eloszlása Sokasági várható érték mindkét sokaság normális eloszlású, 1 és 2 ismert v. n 1 és n 2 >30, a minták függetlenek H 0 : 1 = 2 H 1 : (1) 1 ≠ 2 (2) 1 > 2 (3) 1 < 2 standard normális (z) mindkét sokaság normális eloszlású, 1 és 2 nem ismert v. n 1 és n 2 <30 1 = 2, a minták függetlenek H 0 : 1 = 2 H 1 : (1) 1 ≠ 2 (2) 1 > 2 (3) 1 < 2 Student t- eloszlás (DF=n 1 +n 2 -2) a sokaság normális eloszlású, páros minta H 0 : 1 = 2 (H 0 : μ d =δ 0 ) H 1 : (1) 1 ≠ 2 (μ d ≠ δ 0 ) (2) 1 > 2 (μ d > δ 0 ) (3) 1 < 2 (μ d < δ 0 ) Student t- eloszlás (DF=n-1) Sokasági variancia Mindkét sokasági eloszlás normális, ahol s 1 *2 > s 2 *2 F-eloszlás (DF 1 =n 1 -1; DF 2 =n 2 -1)
Példa – Feladatgyűjtemény (32.) Kétféle oldat (A és B) pH értékét szeretnénk összehasonlítani. Hatelemű mintát elemezve az A oldatból 7,52-es átlagos pH értéket kaptunk 0,024 szórással. Ötelemű minta alapján a B oldat átlagos pH értéke 7,49 volt 0,032 szórással. Vizsgálja meg, hogy van-e különbség a két oldat pH értékében (α=5%)! Megoldás: kétmintás sokasági várható értékekre irányuló t-próba (n<30), amely előtt F-próbát kell végeznünk: H 0 : A = B H 1 : A < B α=5%DF számláló =4 DF nevező =5F krit =5,19 H 0 -t 95%-os megbízhatósági szinten elfogadjuk, rátérhetünk a t- próbára.
Kétmintás t-próba: H 0 : A = B H 1 : A B Kritikus érték meghatározása: α=0,05DF=6+5-2=9t /2 =±2,26 Mivel a számított érték (1,78) az elfogadási tartományba esik, H 0 -t 95%-os megbízhatósági szinten elfogadjuk, azaz nincs különbség a két oldat pH értéke között. Példa – Feladatgyűjtemény (32.)
Egy liter „A” márkájú benzin felhasználásával öt hasonló gépkocsi azonos feltételek mellett 11,5, 12,3, 10,2, 11,7 és 10,8 km-t tett meg. Ugyanezek az autók a „B” márkájú benzinnel 10,3, 9,8, 11,4, 10,1 és 10,7 km-t mentek. Vizsgálja meg, hogy az 1l-rel megtehető km-ek számát tekintve az „A” márka jobb-e, mint a „B”? Megoldás: Páros minta, kétmintás, sokasági várható értékek egyezésének vizsgálata Hipotézisek: H 0 : μ A =μ B (μ d =0) H 1 : μ A >μ B (μ d >0) Példa – Feladatgyűjtemény (31.)
Számított érték meghatározása: Kritikus érték meghatározása: DF=4α=5% t krit =2,13 Elfogadási tartomány: t sz < t α Példa – Feladatgyűjtemény (31.) A benzinB benzin d i különbség 11,510,31,2 12,39,82,5 10,211,4-1,2 11,710,11,6 10,810,70,1 Mivel a próbafüggvény értéke az elfogadási tartományba esik, így H 0 -t elfogadjuk 95%-os megbízhatósági szinten, vagyis a két benzinmárka között nincsen különbség, az autók átlagos futásteljesítménye nem tér el egymástól.
Többmintás próbák A többmintás próbák annak a kérdésnek a vizsgálatára használhatók, hogy több – meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb.) – sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. A többmintás próbák kettőnél több sokaság egymással való összehasonlítására szolgálnak. – Több sokasági szórás (variancia) összehasonlítása – Több sokaság várható értékének összehasonlítása (varianciaanalízis)
Cochran próba: azt dönthetjük el, hogy a szórások között talált legnagyobb érték tekinthető-e a többivel azonos eloszlásból származónak. Alkalmazási feltétel: normális eloszlású alapsokaságok, azonos n elemszámú minták (r db sokaságból r db mintánk van) Nullhipotézis: Ellenhipotézis: H 1 : nem minden variancia egyenlő A próbafüggvény: DF=n-1 Elfogadási tartomány: g sz < g krit Többmintás próbák – több sokasági szórás összehasonlítása
Egy áruházláncnál megvizsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fizetett összeg. Minden boltban kiválasztottak 6 véletlen mintát. A vásárláskor fizetett összegeket az alábbi táblázat mutatja (dollárban): Feltételezve, hogy a kifizetések normális eloszlásúak, van-e különbség a szórás tekintetében a 3 üzlet között 5%-os szignifikancia szinten? Példa – Cochran próba 1. bolt2. bolt3. bolt 12,0515,179,48 23,9418,526,92 14,6319,5710,47 25,7821,47,63 17,5213,5911,90 18,4520,575,92
Hipotézisek felállítása: H0:H0: H 1 : nem minden variancia egyenlő Számított érték meghatározása: szükségünk van a korrigált tapasztalati szórásokra! Példa – Cochran próba 1. bolt2. bolt3. bolt 12,0515,179,48 23,9418,526,92 14,6319,5710,47 25,7821,47,63 17,5213,5911,90 18,4520,575,92
Kritikus érték meghatározása: α=5% n=6 (egy-egy minta azonos elemszáma) DF=n-1=6-1=5 r=3 (a minták száma) g krit =0,73 Döntés a nullhipotézisről: Mivel a számított érték (0,653) kisebb, mint a kritikus érték (0,73), a nullhipotézist elfogadjuk 5%-os szignifikancia szinten, azaz a sokasági szórások egyezése feltételezhető. Példa – Cochran próba
Egy egészségügyi kutatóközpont öt különböző fogyókúra eljárást kíván összehasonlítani. A vizsgálatra 25 túlsúlyos személyt kértek fel, akiket 5 csoportba soroltak be. Egy hónapon keresztül alkalmazták az egyes eljárásokat. Feltételezve a súlycsökkenés normális eloszlását vizsgáljuk meg, hogy van-e különbség a fogyókúrás terápiák által eredményezett súlycsökkenések varianciája között (α=5%)! Megoldás: EljárásSúlyveszteség (kg) A B74789 C D6 577 E H 1 : nem minden variancia egyenlő
Minden fogyókúrás eljárásra ki kell számolnunk a súlycsökkenések átlagát és korrigált tapasztalati szórását: Példa – Cochran próba EljárásSúlyveszteség (kg) A B74789 C D6 577 E Kritikus érték: α=5%, r=5, DF=n-1=4, g krit =0,56 5%-os szignifikancia szinten a különböző fogyókúrás eljárások eredményeként előálló súlycsökkenések varianciája között nincs különbség, mivel a számított érték kisebb, mint a kritikus.
Több sokaság várható értékének összehasonlítása - varianciaanalízis Alkalmazási feltétel: független minta, normális eloszlású alapsokaságok, a sokasági szórások egyezése feltételezhető (lásd Cochran próba) Nullhipotézis: – a nullhipotézis fennállása azt jelenti, hogy nincs kapcsolat az X mennyiségi ismérv és a sokaságokat megkülönböztető minőségi ismérv között – a próba a vegyes kapcsolat tesztelésének is tekinthető, a nullhipotézis elfogadása esetén a minőségi ismérv nem befolyásolja a mennyiségi ismérv alakulását, a két ismérv független egymástól Ellenhipotézis: H 1 : bármely két várható érték nem egyenlő egymással – H 1 fennállása azt jelenti, hogy van kapcsolat az adott két ismérv között A szórásnégyzet-felbontás módszerére épül (lásd heterogén sokaság vizsgálata)
Menete: – Főátlag számítása: – Teljes négyzetösszeg: – Csoportok közötti négyzetösszeg: a csoportok közti eltéréseket magyarázza, méri – Csoportokon belüli négyzetösszeg: a csoportokon belüli eltéréseket, a véletlen hatásokat mutatja Több sokaság várható értékének összehasonlítása - varianciaanalízis
SST = SSK + SSB SSK: a csoportosítás hatása a szóródásra Varianciahányados: H 2 =SSK/SST SSB: a szóródás azon része, amelyet a csoportosítás nem magyaráz – a csoportosító ismérven kívül egyéb tényezők magyaráznak A varianciaanalízis éppen arra keresi a választ, hogy a csoportosító ismérvnek köszönhető eltérésnégyzet-összeg (SSK) szignifikáns nagyságrendű-e. Több sokaság várható értékének összehasonlítása - varianciaanalízis
Ha H 0 igaz: – a csoporton belüli négyzetösszeg (SSB) 2 -eloszlású n-r szabadságfokkal – a csoportok közötti négyzetösszeg (SSK) 2 -eloszlású r-1 szabadságfokkal – a négyzetösszegek és a megfelelő szabadságfokok hányadosából képzett ún. külső (s k 2 ), ill. belső (s b 2 ) szórásnégyzetek egymástól függetlenek – a közös várható értékük az ismeretlen, de egyenlő alapsokasági szórás: M(s k 2 )=M(s b 2 )= . – A két szórás egyezésének vizsgálatával így ellenőrizhetjük eredeti hipotézisünket: a várható értékek azonosságát A próbastatisztika (r-1, n-r) paraméterű F-eloszlású: Több sokaság várható értékének összehasonlítása - varianciaanalízis
ANOVA tábla Több sokaság várható értékének összehasonlítása - varianciaanalízis Négyzetösszeg neve NégyzetösszegekSzabadságfok Szórás becslése F értékp-érték Csoportok közötti * r-1sk2sk2 s k 2 /s b 2 p Csoporton belüli ** n-rsb2sb2 -- Teljesn-1---
Egy áruházláncnál megvizsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fizetett összeg. Minden boltban kiválasztottak 6 véletlen mintát. A vásárláskor fizetett összegeket az alábbi táblázat mutatja (dollárban): Feltételezve, hogy a kifizetések normális eloszlásúak, van-e különbség az eladások várható értékeinek tekintetében a 3 üzlet között 5%-os szignifikancia szinten? A varianciaanalízis alkalmazási feltételei között szerepel a sokasági szórások egyezése, ezt már igazoltuk Cochran-próbával, továbbá feltételeztük az értékesítések értékének normalitását. 1. bolt2. bolt3. bolt 12,0515,179,48 23,9418,526,92 14,6319,5710,47 25,7821,47,63 17,5213,5911,90 18,4520,575,92 Példa - Varianciaanalízis
Hipotézisek felállítása: H0:H0: H 1 : bármely két várható érték nem egyenlő egymással Számított érték meghatározása: n 1 =n 2 =n 3 =6r=3 Példa - Varianciaanalízis 1. bolt2. bolt3. bolt 12,0515,179,48 23,9418,526,92 14,6319,5710,47 25,7821,47,63 17,5213,5911,90 18,4520,575,92
Példa - Varianciaanalízis
Négyzet- összegek Szabadságfok Szórás becslése F érték Csoportok közötti 378,4 Csoporton belüli 214,05- Teljes 592,45-- Példa - Varianciaanalízis r-1=3-1=2 n-r=18-3= ,2 14,3 =0,05 A számláló szabadságfoka (DF 1 ) = 2 A nevező szabadságfoka (DF 2 ) = 15 A kritikus érték: F kr =3,68 Mivel F sz >>F kr, a nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz az átlagok, ill. legalább egy átlag szignifikánsan különbözik a többitől. Esetünkben ez értelemszerűen a 3. bolt, ahol az egy vásárlásnál kifizetett összeg nagysága átlagosan kevesebb, mint a fele a másik két bolt átlagánál. 13,23
A Cochran-próbával is tesztelt fogyókúrás eljárásokat nézzük újra, és ellenőrizzük, hogy van-e különbség az egyes eljárások között a hatékonyság szempontjából 5%-os szignifikancia szinten! (vagyis van-e olyan, amelyik nagyobb átlagos súlycsökkenéssel jár, mint a többi?) Tegyük fel, hogy feltételezhető az eljárások okozta súlyveszteségek varianciájának azonossága, így folytathatjuk a várható értékek egyezésének vizsgálatával.Példa EljárásSúlyveszteség (kg)átlagokszórások A ,22 B ,87 C ,36 D ,87 E ,41
Főátlag: Példa H 1 : bármely két várható érték nem egyenlő egymással EljárásSúlyveszteség (kg)átlagokszórások A ,22 B ,87 C ,36 D ,87 E ,41 α=5% DF 1 =4 DF 2 =20 F krit =2,87 Mivel a számított érték nagyobb, mint a kritikus érték, így a nullhipotézist elutasítjuk. 5%-os szignifikancia szinten van különbség az egyes fogyókúrás eljárások által eredményezett súlycsökkenések várható értéke között, azaz valószínűleg van olyan, amelyik hatásosabb a másiknál.
Egy betongyárban 4 cementgyárból (A, B, C, D) vásárolnak cementet. A cement minőségét próbakockák gyártásával ellenőrzik. A beérkező „500-as cement” szállítmányokból mintát véve a próbakockák nyomószilárdság adatai [kg/cm 2 -ben] az alábbiak A szállító: 512, 716, 668, 726, 580 B szállító: 516, 664, 614, 586, 590 C szállító: 542, 684, 722, 600, 642 D szállító: 566, 744, 546, 610, 672. Van-e különbség a szállítók között? (Vagyis van-e különbség a különböző cementgyártók által beszállított cement(kockák) nyomószilárdságának várható értékei között?) Varianciaanalízis, előtte Cochran próba! Példa – Feladatgyűjtemény (37.)
A sokasági varianciák egyezőségének vizsgálata – Cochran próba Hipotézisek: H 0 : A = B = D = C H 1 : a legnagyobb szórású különbözik Példa – Feladatgyűjtemény (37.) Beszállító MintaMintaátlagKorr. tap. szórás A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, , ,6 92,113 53,5 70,44 81,06
Cochran próba Számított érték meghatározása Kritikus érték: α=5% n=5 DF=4r=4g krit =0,63 Döntés: mivel a számított érték kisebb, mint a kritikus érték, így a nullhipotézist elfogadjuk, 5%-os szignifikancia szint mellett a sokasági szórások megegyeznek. Példa – Feladatgyűjtemény (37.) Beszállító MintaMintaátlagKorr. tap. szórás A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, , ,6 92,113 53,5 70,44 81,06
Varianciaanalízis Hipotézisek: H 0 : A = B = C = D H 1 : bármelyik kettő nem egyenlő Példa – Feladatgyűjtemény (37.) Beszállító MintaMintaátlagKorr. tap. szórás A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, , ,6 92,113 53,5 70,44 81,06
Varianciaanalízis Példa – Feladatgyűjtemény (37.) Beszállító MintaMintaátlagKorr. tap. szórás A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, , ,6 92,113 53,5 70,44 81,06
ANOVA tábla Példa – Feladatgyűjtemény (37.) Négyzet- összegek Szabadságfok Szórás becslése F érték Csoportok közötti Csoporton belüli - Teljes , , ,57 r-1=4-1=3 N-r=20-4=16 N-1=19 =0,05 DF 1 =3 DF 2 = 16 A kritikus érték: F kr =3,24 Mivel F sz =0,4<F krit =3,24 H 0 -t elfogadjuk 95%-os megbízhatósági szinten, azaz a beszállítóktól származó próbakockák minősége (nyomószilárdsági adatai) között nincs különbség. 2290, ,9 0,4
Összefoglalás A zárthelyin számonkérésére kerülő próbák Nemparaméteres próbák: – Illeszkedésvizsgálat – Homogenitásvizsgálat – Függetlenségvizsgálat Paraméteres próbák: – Egymintás Sokasági szórásra irányuló próba Várható értékre irányuló próbák (egymintás z- vagy t-próba) – Kétmintás Sokasági szórásokra irányuló próba (F-próba) Várható értékekre irányuló próba (kétmintás z-, vagy t-próba, páros mintás próba) – Többmintás Sokasági szórásokra (Cochran-próba) Várható értékekre irányuló próba (varianciaanalízis)