Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
Hipotézisvizsgálatok
Gazdaságstatisztika Hipotézisvizsgálatok Paraméteres próbák 2015. november 12., november 19., november 23.
2
A próbák osztályozása Mi a nullhipotézisük tárgya?
Paraméterre és eloszlásra irányuló próbák Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek? A paraméteres próbák alkalmazási feltételei között szerepelnek a sokasági eloszlás típusára, egyes paramétereire vonatkozó elvárások A nemparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásának folytonosságát követeli meg Hány és mekkora minta szükséges a végrehajtásukhoz? Egy, két vagy többmintás próbák Független és páros mintás próbák Kis- és nagymintás próbák (határ n=30)
3
Paraméteres próbák A paraméteres próbák szigorúbb alkalmazási feltételeket igényelnek. Arány-, ill. intervallum szintű mérési skáláról származó adatok állnak rendelkezésre. Erősségük (a hamis nullhipotézis elutasításának valószínűsége) nagyobb. Normális eloszlás paramétereire vonatkozó próbák Csoportosításuk: Egymintás, kétmintás, többmintás Független és páros mintás Várható értékre, szórásra irányuló
4
Egymintás próbák Az egymintás próbák mindig egy adott sokaság valamely jellemzőjére vonatkozó feltevések helyességének ellenőrzésére szolgálnak. Ennek érdekében a rendelkezésre álló egyetlen mintából meghatározott jellemzőt (átlag, tapasztalati szórás) valamely feltételezett, vagy kívánatosnak tartott állapothoz viszonyítjuk. Így annak a kérdésnek a megválaszolására alkalmasak, hogy az a sokaság, amelyből a minta származik lehet-e olyan, mint amilyennek mi azt a nullhipotézisben feltételezzük. Egymintás várható értékre irányuló próbák Egymintás sokasági szórásra irányuló próba
5
Egymintás próbák – sokasági szórásra irányuló próba
Alkalmazási feltételek: normális eloszlású alapsokaság Nullhipotézis: Lehetséges ellenhipotézisek és elfogadási tartományok: A próbafüggvény χ2 eloszlású (DF=n-1):
6
Példa Mivel a számított érték kisebb, mint a kritikus érték, így 5%-os szignifikancia szinten elfogadható a nullhipotézis, vagyis nincs szignifikáns eltérés a szórás tekintetében. A kerti törpék piacán az elmúlt évtizedekben a törpék átlagos magassága 120 cm volt, ugyanakkor a szórás ingadozott. A kiszámítható alapanyag-ellátás feltétele, hogy a szórás ne haladja meg a 10cm-t. Egy tavalyi felmérés szerint egy 25 elemű véletlen minta szórása 12cm volt. A magasság normális eloszlása ismert. Ellenőrizzük 95%-os megbízhatósággal, nincs-e veszélyben az alapanyag ellátás? Megoldás: n=25 DF=24 s*=12 σ0=10 Elfogadási tartomány: Kritikus érték: (α=5%, DF=24) ˂
7
Példa Nézzük ismét az a példát, amely a légi közlekedésben az utasok átlagos testsúlyára és a testsúly szórására vonatkozóan élt feltételezésekkel (lásd illeszkedésvizsgálat, ahol a normalitást már igazoltuk). A légitársaság a terhelést 78kg-os átlagos testsúlyra és 11kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. A mintából számított jellemzők: 5%-os szignifikancia szint mellett most teszteljük az utasok testsúlyának szórására vonatkozó feltevést! Testsúly (kg) Ügyfelek száma (fő) -60 7 60-70 16 70-80 32 80-90 28 90-100 13 100- 4 Összesen 100
8
˂ Példa Megoldás: n=100 (DF=99) Hipotézisek: H0: σ=11kg H1: σ>11kg
Mivel a számított érték kisebb, mint a kritikus érték, így 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, azaz a sokasági szórásra vonatkozó feltételezés elfogadható. Megoldás: n=100 (DF=99) Hipotézisek: H0: σ=11kg H1: σ>11kg H1: σ≠11kg Elfogadási tartomány: Kritikus érték: (α=5%, DF=99) ˂ Mivel a számított érték a két kritikus érték közé esik, így 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, azaz a sokasági szórásra vonatkozó feltételezés elfogadható. Elfogadási tartomány: Kritikus értékek: (α/2=2,5%, DF=99)
9
Példa Pluszpont szerzési lehetőség: beadás óra végén!
A Q épület aulájában működő italautomatának minden egyes pohárba 2 dl folyadékot kell töltenie. Jogos vevői elvárás, hogy az automata töltési súlyának szórása minél kisebb legyen, hiszen mind a túltöltés, mind az alultöltés problémát jelent. Az automata tesztelésére 30 elemű mintát vettek, amely alapján a gép 1,98 dl folyadékot tölt 0,17 dl szórással. Teszteljük 5%-os szignifikancia szinten, hogy teljesül-e az, hogy az automata legfeljebb 0,1 dl-es szórással tölti az italokat!
10
Példa megoldás Egymintás szóráspróba
11
Egymintás próbák – sokasági várható értékre irányuló próba
Az alkalmazási feltételek függvényében kétféle próba: egymintás z-próba ha ismerjük az alapsokasági szórást (0), vagy ha nem ismerjük, de nagy mintával dolgozunk (n>30 és a 0-t a korrigált tapasztalati szórással becsüljük) egymintás t-próba ha nem ismerjük az alapsokasági szórást, és kis mintánk van Nullhipotézis: H0: =m0, vagyis a várható érték egy adott m0 értékkel egyenlő. Lehetséges ellenhipotézisek: H1: ≠ m0 H1: > m0 H1: < m0
12
Egymintás próbák – egymintás z-próba
Alkalmazás feltétele: normális eloszlású alapsokaság Nullhipotézis: Ellenhipotézisek és elfogadási tartományok: A próbafüggvény N(0;1) eloszlású: H0: =m0 H1: ≠ m0 -z/2 <zsz<z/2 H1: > m0 zsz<z H1: < m0 zsz>-z
13
Példa Nézzük ismét az a példát, amely a légi közlekedésben az utasok átlagos testsúlyára és a testsúly szórására vonatkozóan élt feltételezésekkel (lásd illeszkedésvizsgálat, ahol a normalitást már igazoltuk). A légitársaság a terhelést 78kg-os átlagos testsúlyra és 11kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. A mintából számított jellemzők: 5%-os szignifikancia szint mellett most teszteljük az utasok testsúlyának várható értékére vonatkozó feltevést! Testsúly (kg) Ügyfelek száma (fő) -60 7 60-70 16 70-80 32 80-90 28 90-100 13 100- 4 Összesen 100
14
Példa Mivel a számított érték (0,49) kisebb, mint a kritikus érték, így a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten elfogadható, hogy a sokasági várható érték 78kg. Megoldás: n=100 Hipotézisek: H0: μ=78kg H1: μ>78kg H1: μ≠78kg Elfogadási tartomány: Kritikus érték: (α=5%) ˂ Elfogadási tartomány: Kritikus érték: (α/2=2,5%) Mivel a számított érték a két kritikus érték közé esik, így a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten elfogadható, hogy az utasok testsúlyának várható értéke 78kg.
15
Egymintás próbák – egymintás t-próba
Alkalmazás feltétele: normális eloszlású alapsokaság, ismeretlen alapsokasági szórás (és kis mintaelemszám) Nullhipotézis: Ellenhipotézisek és elfogadási tartományok: A próbafüggvény Student eloszlású (DF=n-1): H0: =m0 H1: ≠ m0 -t/2 <tsz<t/2 H1: > m0 tsz<t H1: < m0 tsz>-t
16
Példa Egy konzervgyárban a sűrített paradicsom töltését automata gép végzi. A dobozok névleges súlya 450g, amitől csak véletlenszerű eltérések megengedettek. A súly szerinti eloszlás normálisnak tekinthető. A gyár az egyik szállítmányból 25 elemű mintát vett, a mintában a dobozok átlagos súlya 446g volt, a szórás pedig 11g. Ellenőrizzük a névleges töltősúlyra vonatkozó hipotézist 5%-os szignifikancia szinten! Megoldás: Mivel a mintaelemszám kisebb, mint 30 és nem ismert a sokasági szórás, továbbá a súly szerinti eloszlás normálisnak tekinthető, így a sokaság várható értékére vonatkozó feltevésünket egymintás t-próbával végezhetjük el.
17
˂ Példa Megoldás: n=25 (<30) μ=450g Hipotézisek:
Mivel a számított érték kisebb, mint a kritikus érték, így a nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz nem fogadható el a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan eltér 450g-tól. Megoldás: n=25 (<30) μ=450g Hipotézisek: H0: μ=450g H1: μ<450g H1: μ≠450g Elfogadási tartomány: Kritikus érték: (α=5%, DF=24) ˂ Elfogadási tartomány: Kritikus érték: (α/2=2,5%, DF=24) Mivel a számított érték az elfogadási tartományba esik, így a nullhipotézist 5%-os szignifikancia szinten elfogadjuk, azaz elfogadható a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan nem tér el 450g-tól.
18
Tesztelendő paraméter Alkalmazási feltételek Hipotézisek Próbafüggvény
Próbafüggvény eloszlása Sokasági várható érték Sokasági eloszlás normális sokasági szórás ismert H0: = m0 H1: (1) ≠ m0 (2) > m0 (3) < m0 standard normális (z) sokasági szórás nem ismert Student t-eloszlás (DF=n-1) Sokasági variancia (szórás) H0: σ = σ0 (1) σ ≠ σ0 (2) σ > σ0 (3) σ < σ0 χ2-eloszlás
19
Példa Pluszpont szerzési lehetőség: beadás óra végén! (2 pont) Egy 25 elemű mintából teszteljük, hogy a kenyér átlagos súlya megfelel-e az 1kg-os előírásnak. A mintaátlag 995g, a mintából becsült szórás 5g. A súly szerinti eloszlás normálisnak tekinthető. 5%-os szignifikancia szinten ellenőrizzük, hogy a kenyér átlagos súlya megfelel az előírásnak! H1: ≠ m0 -t/2 <tsz<t/2 H1: > m0 tsz<t H1: < m0 tsz>-t DF=n-1
20
Példa megoldása n=25 H0: = 1kg H1: < 1kg Kritikus érték (5%, DF=24): -1,711 Elfogadási tartomány: tsz>-t Mivel a számított érték (-5) kisebb, mint a kritikus (-1,711), az elutasítási tartományba esik, a nullhipotézist elutasítjuk ezen a szignifikancia szinten.
21
Példa – Feladatgyűjtemény (27.)
Egy szárazelemeket gyártó vállalatnál megvizsgálták egy új típusú elemfajta élettartamát. A korábbi elemek várható élettartama 299 óra volt. Véletlen mintavétellel kiválasztva 200 új elemet, az átlagos élettartamuk 300 óra volt, 8 óra szórással. Valóban megnőtt az elemek várható élettartama (α=1%)? Megoldás: Egymintás, sokasági várható értékre irányuló próba Bár σ nem ismert, de n>30 egymintás z-próba n=200
22
Példa – Feladatgyűjtemény (27.)
Hipotézisek: H0: μ=299h H1: μ>299h Elfogadási tartomány: Kritikus érték (α=1%): ˂ Mivel zsz<zα, ezért H0-t elfogadjuk 99%-os megbízhatósági szinten, azaz nem nőtt meg az elemek élettartama, és az továbbra is várhatóan 299 óra.
23
Példa – Feladatgyűjtemény (28.)
Egy automata gépsor által töltött dobozokból 10 elemű mintát veszünk. A mintába került 10 doboz grammban kifejezett töltősúlya a következő: 255g, 242g, 245g, 253g, 249g, 251g, 250g, 255g, 245g, 246g. Ellenőrizzük, hogy a gépsor teljesíti-e a 250g várható értékű specifikációt 1%-os szignifikancia szinten! Megoldás: Egymintás sokasági várható értékre irányuló próba egymintás t-próba, n<30 n=10 (DF=9)
24
Példa – Feladatgyűjtemény (28.)
Hipotézisek: H0: μ=250 H1: μ≠250 Elfogadási tartomány: Kritikus érték: (α/2=0,5%, DF=9) Mivel a számított érték (-0,63) a két kritikus érték közé esik (±3,25), így a nullhipotézist elfogadjuk, azaz 1%-os szignifikancia szinten elfogadható, hogy a gépsor teljesíti a 250g-os specifikációt.
25
Példa – Feladatgyűjtemény (29.)
Egy konzervgyárban burgonyát használnak fel. Csomagolási okok miatt a burgonyák súlya nem szóródhat. Másfelől a gyárat a súlykülönbségek is érdeklik, mert a különböző méretű burgonyákat futószalag-módszerrel tudják kiválogatni. Ezért az átlagos súlykülönbségnek (szóródásnak) 5 grammnak kell lennie. A burgonyák súlyának eloszlására a normális eloszlás feltételezhető, és a tesztelést 1%-os szignifikancia szinten végezzük el. Tegyük fel, hogy két termelő szállítja be a burgonyákat. Az A termelőtől származó burgonyából vett 16 elemű minta alapján a szórás 3,8 grammra adódott. A B termelő által beszállított burgonyából vett 101 elemű minta alapján a szórás 6,6 grammra adódott. Teljesítik-e a beszállítók az elvárást? Megoldás: egymintás, sokasági szórásra irányuló próba
26
Példa – Feladatgyűjtemény (29.)
Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem különbözik szignikánsan (1%) a σ=5 grammtól. „A” termelő esete: H0: σ=5 H1: σ≠5 n=16 s*=3,8gr H1: σ <5 Elfogadási tartomány: Kritikus értékek: (α/2=0,05%, DF=15) Elfogadási tartomány: Kritikus érték: (α=1%, DF=15) Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem kisebb szignikánsan (1%), mint 5 gramm.
27
Példa – Feladatgyűjtemény (29.)
Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan különbözik (1%) a σ=5 grammtól. „B” termelő esete: H0: σ=5 H1: σ ≠5 n=101 s*=6,6gr H1: σ >5 Elfogadási tartomány: Kritikus értékek: (α/2=0,05%, DF=100) Elfogadási tartomány: Kritikus érték: (α=1%, DF=100) Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan (1%) nagyobb, mint 5 gramm.
28
Példa – Feladatgyűjtemény (30.)
Egy csővágó automata gépnek 1200mm hosszú csődarabokat kell levágnia. A gyártásközi ellenőrzés feladata, hogy megállapítsa, hogy a gép által gyártott darabok hosszmérete megfelel-e az előírásoknak. Előző adatfelvételekből ismert, hogy a gép által gyártott csődarabok hossza normális eloszlású valószínűségi változó 3mm szórással. A gyártásközi ellenőrzésre kiválasztottak egy 16 elemű mintát. A csődarabok hossza a mintában: Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3mm-t! Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak! 1208 1204 1202 1194 1195 1205 1197 1193 1191 1187
29
Példa – Feladatgyűjtemény (30.)
Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3mm-t a minta alapján! Megoldás: Egymintás szóráspróba n=16 Hipotézisek: H0: σ=3 H1: σ>3 Elfogadási tartomány: Kritikus érték: (α=5%, DF=15) 1208 1204 1202 1194 1195 1205 1197 1193 1191 1187 Mivel a számított érték az elutasítási tartományba esik, így a nullhipotézist 5%-os szignifikancia szinten elvetjük. A csődarabok hosszának szórása 5%-os szignifikancia szinten meghaladja a 3mm-t.
30
Példa – Feladatgyűjtemény (30.)
Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak (1200mm, 5%)! Megoldás: Egymintás t-próba (n<30) H0: μ=1200 H1: μ≠1200 Elfogadási tartomány: Kritikus érték: (α/2=2,5%, DF=15) 5%-os szignifikancia szinten a csővágó automata teljesíti az 1200mm várható értékű specifikációt, így elfogadjuk a nullhipotézist.
31
Paraméteres próbák Kétmintás próbák
32
Kétmintás próbák A kétmintás próbák – ideértve a speciális páros mintás próbákat is – annak a kérdésnek a vizsgálatára használhatók, hogy két meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb.) sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. A kétmintás próbák két sokaság egymással való összehasonlítását szolgálják. A sokaságok időben, térben vagy bármilyen más tekintetben különbözhetnek egymástól. Kétmintás, a sokasági varianciák egyezésére irányuló próba Páros mintás, a várható értékek különbségére irányuló próba Két, független mintás, várható értékek egyezésére irányuló z-, ill. t- próba
33
Kétmintás próbák – a sokasági szórások összehasonlítására irányuló próba
Alkalmazási feltétel: normális eloszlású, független alapsokaságok Nullhipotézis: Ellenhipotézis: H1: 12>22 A próbafüggvény F-eloszlású (DF1, DF2, DF1,2=n1,2 -1) Táblázataink is egyoldali próbára vonatkoznak (F, DF1, DF2 kritikus értékeit adják meg) A két alapeloszlásból vett n1 és n2 elemű minták korrigált tapasztalati szórásai torzítatlan becslései az alapsokasági szórásoknak. ahol s1*2>s2*2
34
Példa Egy fodrászatba férfiak és nők egyaránt járnak. 12 véletlenszerűen kiválasztott férfi és 15 véletlenszerűen kiválasztott nő esetében mérjük a szolgáltatás időtartamát, amelynek eloszlása normális. A férfiak esetében a szolgáltatás igénybevételének átlagos ideje 35 perc, 26 perc szórással. A nők esetében a frizura elkészítésének átlagos ideje 48 perc, 30 perc szórással. Teszteljük 5%-os szignifikancia szinten, hogy van-e különbség a szolgáltatási idő szórása között a férfiak és nők esetében! Megoldás: kétmintás, sokasági szórások vizsgálatára irányuló próba Hipotézisek felállítása:
35
Példa Számított érték meghatározása: Kritikus érték meghatározása: α=5% DFnő=15-1=14=DF1 DFférfi=12-1=11=DF2 Fkrit=2,72 Mivel a számított érték (1,33), kisebb, mint a kritikus érték (2,72), így a nullhipotézist 5%-os szignifikancia szinten nincs jogunk elutasítani, vagyis a férfiak és nők kiszolgálási idejének szórása között nincs szignifikáns különbség.
36
Példa Pluszpont szerzési lehetőség! – beadás óra végén (1 pont) Szinte havonta röppen fel a hír, hogy eddig nem ismert, új Shakespeare darabra bukkantak, de többségük hamisítványnak bizonyul. Az eredetiség megállapításának egyik eszköze, hogy a művet összehasonlítják egy eredeti, hasonló műfajú Shakespeare művel, és véletlenszerűen kiválasztott, azonos hosszúságú részeket vizsgálnak, hányszor fordul elő egy-egy jellegzetes kifejezése, vagy akár vesszői. Egy újonnan felfedezett művet hasonlítanak össze a Hamlettel. Mindkét szövegből kiválasztanak véletlenszerűen egyenlő hosszúságú szövegrészletet és azt vizsgálják, hányszor fordul elő az „ezért” szó. Az eredmények: 1%-os szignifikancia szinten ellenőrizze, hogy a keresett kifejezés („ezért”) szórásai egyeznek-e a két szövegben! A vizsgált szövegrészletben a kifejezés számának Új szöveg Hamlet Átlaga 3,1 2,4 Szórása 1,1 0,9
37
Példa Kritikus érték meghatározása (1%, DF1=99, DF2=99): 1,53 A számított érték kisebb, mint a kritikus, elfogadási tartományba esik, 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, nincs szignifikáns különbség a két szövegben az „ezért” kifejezés szóródásának.
38
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák
FÜGGETLEN MINTÁK Az alkalmazási feltételek függvényében kétféle próba: kétmintás z-próba ha ismerjük az alapsokasági szórásokat (1 és 2), vagy ha nem ismerjük, de nagy mintával dolgozunk (n1,2>30 és az ismeretlen alapsokasági szórásokat a korrigált tapasztalati szórásokkal becsüljük) kétmintás t-próba ha nem ismerjük az alapsokasági szórásokat, és kis mintáink vannak Nullhipotézis: H0: 1=2 (vagyis a két sokasági várható érték egyenlő) Lehetséges ellenhipotézisek: H1: 1 ≠ μ2 H1: 1 > μ2 H1: 1 < μ2
39
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák
Kétmintás z-próba Alkalmazás feltétele: normális eloszlású alapsokaságok, ismert alapsokasági varianciák Nullhipotézis: H0: 1=2 Lehetséges ellenhipotézisek és elfogadási tartományok: A próbafüggvény N(0,1) eloszlású: H1: 1 ≠ 2 -z/2 <zsz<z/2 H1: 1 > 2 zsz<z H1: 1 < 2 zsz>-z
40
Példa Egy tejüzemben két gépen töltenek literes dobozokba tejet. A gyártásközi ellenőrzés során mindkét gépről véletlen mintát vettek. A mintavétel eredményei: A töltési térfogat mindkét gépen normális eloszlású. Hasonlítsuk össze, hogy azonosnak tekinthető-e a két gépen töltött tej mennyiségének várható töltési térfogata! (5%) Megoldás: Mivel mindkét minta esetében a mintaelemszám nagyobb, mint 30, továbbá feltételezhető a töltési térfogat normális eloszlása, így kétmintás z-próbát használhatunk. I. gép II. gép Mintaelemszám 100 Átlagos töltési mennyiség 995ml 999ml Töltési mennyiség szórása 11ml 12ml
41
Példa Mivel a számított érték nem az elfogadási tartományba esik, így szignifikáns különbség van 5%-os szignifikancia szinten a két gép által töltött várható töltési térfogat között. Hipotézisek: H0: 1=2 H1: 1≠2 Számított érték meghatározása: Kritikus értékek meghatározása: α=5% zα/2=±1,96
42
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák
Kétmintás t-próba Alkalmazás feltétele: normális eloszlású alapsokaságok, ismeretlen alapsokasági varianciák kis minták esetén akkor kezelhető, ha az ismeretlen szórásokról tudjuk, hogy azok egyenlőek (F-PRÓBA) Nullhipotézis: H0: 1=2 Lehetséges ellenhipotézisek és elfogadási tartományok: A próbafüggvény Student eloszlású (DF=n1+n2-2): H1: 1 ≠ 2 -t/2 <tsz<t/2 H1: 1 > 2 tsz<t H1: 1 < 2 tsz>-t
43
Példa Korábbi fodrászatos példánk (lásd sokasági szórások egyezésére irányuló próba) vizsgáljuk meg, hogy van-e különbség a kiszolgálási idő várható értéke között a férfiak és a nők esetében 5%-os szignifikancia szinten! nnő=15 nférfi=12 A kétmintás t-próba alkalmazási feltételei: az alapsokaságok eloszlásának normalitása (nevezetesen a szolgáltatási idő eloszlása mind a férfiak, mind a nők esetében normális, ezt feltételeztük már az F-próba elvégzésénél is) nő és férfi nem ismert és nnő<30 és nférfi<30 nő = férfi, ezt már bizonyítottuk F-próbával korábban
44
Példa Hipotézisek felállítása: H0: nő=férfi H1: nő≠férfi
Mivel a számított érték az elfogadási tartományba esik, így a H0 hipotézist elfogadjuk, azaz 5%-os szignifikancia szinten nincs különbség a férfiak és a nők kiszolgálási idejének várható értéke között. Hipotézisek felállítása: H0: nő=férfi H1: nő≠férfi Számított érték meghatározása: Kritikus érték meghatározása: α=5% DF= =25 t0,975=±2,06
45
Példa Hipotézisek felállítása: H0: nő=férfi H1: nő>férfi
Számított érték meghatározása: Kritikus érték meghatározása: α=5% DF= =25 t0,95=1,708 Mivel tsz=1,185<1,708, így a H0-t elfogadjuk, azaz nincs különbség a két várható érték között 5%-os szignifikancia szinten.
46
Példa – Feladatgyűjtemény (32.)
Kétféle oldat (A és B) pH értékét szeretnénk összehasonlítani. Hatelemű mintát elemezve az A oldatból 7,52-es átlagos pH értéket kaptunk 0,024 szórással. Ötelemű minta alapján a B oldat átlagos pH értéke 7,49 volt 0,032 szórással. Vizsgálja meg, hogy van-e különbség a két oldat pH értékében (α=5%)! Megoldás: kétmintás sokasági várható értékekre irányuló t-próba (n<30), amely előtt F-próbát kell végeznünk: H0: A=B H1: A<B α=5% DFszámláló=4 DFnevező=5 Fkrit=5,19 H0-t 95%-os megbízhatósági szinten elfogadjuk, rátérhetünk a t-próbára.
47
Példa – Feladatgyűjtemény (32.)
Kétmintás t-próba: H0: A=B H1: AB Kritikus érték meghatározása: α=0,05 DF=6+5-2=9 t/2=±2,26 Mivel a számított érték (1,78) az elfogadási tartományba esik, H0-t 95%-os megbízhatósági szinten elfogadjuk, azaz nincs különbség a két oldat pH értéke között.
48
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák
PÁROS MINTÁK Páros mintáknál az egyik minta elemeinek kiválasztása maga után vonja a másik minta elemeinek kiválasztását. n=n1=n2 a két páros minta összetartozó elemeinek di=yi-xi különbségeit képezzük egy n elemű minta Nullhipotézis: H0: μ1=μ2 vagy H0: μd=δ0 Ellenhipotézis: egyoldali vagy kétoldali Próbafüggvény Student eloszlást követ (DF=n-1):
49
A vizsgált személy sorszáma
Példa Egy speciális diéta hatásosságát vizsgálják. Ehhez minden vizsgálati személy testsúlyát megmérték a diéta előtt és után. A hipotetikus kísérlet eredménye 9 kísérleti személyen a következő táblázatban látható. Vizsgáljuk meg 1%-os szignifikancia szinten, hogy hatásos volt-e a diéta! Megoldás: Páros mintáról van szó, hiszen ugyanazon diétában résztvevő személyek testsúlyát mérték meg a diéta megkezdése előtt és után. A vizsgált személy sorszáma Testsúly a diéta előtt Testsúly a diéta után 1 95 90 2 75 72 3 110 100 4 81 5 92 88 6 83 7 94 93 8 82 9 105 99
50
A vizsgált személy sorszáma
Példa A diéta megkezdése előtt a 9 résztvevő testsúlyának átlaga: Hipotézisek: H0: μe=μu (μe-μu=0) H1: μe>μu (μe-μu>0) A vizsgált személy sorszáma Testsúly a diéta előtt Testsúly a diéta után 1 95 90 2 75 72 3 110 100 4 81 5 92 88 6 83 7 94 93 8 82 9 105 99
51
A vizsgált személy sorszáma
Példa Mivel a számított érték (4,55) nagyobb, mint a kritikus érték (2,896), így a nullhipotézist elutasítjuk, vagyis van szignifikáns különbség a páciensek testsúlyában a diéta előtt és után. Számított érték meghatározása: Kritikus érték: α=1% tα=2,896 Elfogadási tartomány: tsz< tα A vizsgált személy sorszáma Testsúly a diéta előtt Testsúly a diéta után di 1 95 90 5 2 75 72 3 110 100 10 4 81 6 92 88 83 7 94 93 8 82 9 105 99
52
Példa – Feladatgyűjtemény (31.)
Egy liter „A” márkájú benzin felhasználásával öt hasonló gépkocsi azonos feltételek mellett 11,5, 12,3, 10,2, 11,7 és 10,8 km-t tett meg. Ugyanezek az autók a „B” márkájú benzinnel 10,3, 9,8, 11,4, 10,1 és 10,7 km-t mentek. Vizsgálja meg, hogy az 1l-rel megtehető km-ek számát tekintve az „A” márka jobb-e, mint a „B”? Megoldás: Páros minta, kétmintás, sokasági várható értékek egyezésének vizsgálata Hipotézisek: H0: μA=μB (μd=0) H1: μ A>μB (μ d>0)
53
Példa – Feladatgyűjtemény (31.)
A benzin B benzin di különbség 11,5 10,3 1,2 12,3 9,8 2,5 10,2 11,4 -1,2 11,7 10,1 1,6 10,8 10,7 0,1 Számított érték meghatározása: Kritikus érték meghatározása: DF=4 α=5% tkrit=2,13 Elfogadási tartomány: tsz< tα Mivel a próbafüggvény értéke az elfogadási tartományba esik, így H0-t elfogadjuk 95%-os megbízhatósági szinten, vagyis a két benzinmárka között nincsen különbség, az autók átlagos futásteljesítménye nem tér el egymástól.
54
Tesztelendő paraméter Alkalmazási feltételek Hipotézisek Próbafüggvény
Próbafüggvény eloszlása Sokasági várható érték mindkét sokaság normális eloszlású, 1 és 2 ismert v. n1 és n2>30, a minták függetlenek H0: 1=2 H1: (1) 1 ≠ 2 (2) 1 > 2 (3) 1 < 2 standard normális (z) mindkét sokaság normális eloszlású, 1 és 2 nem ismert v. n1 és n2<30 1=2, a minták függetlenek Student t-eloszlás (DF=n1+n2-2) a sokaság normális eloszlású, páros minta (H0: μd=δ0) (1) 1 ≠ 2 (μd ≠ δ0) (μd > δ0) (μd < δ0) (DF=n-1) Sokasági variancia Mindkét sokasági eloszlás normális , ahol s1*2 > s2*2 F-eloszlás (DF1=n1-1; DF2=n2-1)
55
Többmintás próbák A többmintás próbák annak a kérdésnek a vizsgálatára használhatók, hogy több – meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb.) – sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. A többmintás próbák kettőnél több sokaság egymással való összehasonlítására szolgálnak. Több sokasági szórás (variancia) összehasonlítása Több sokaság várható értékének összehasonlítása (varianciaanalízis)
56
Többmintás próbák – több sokasági szórás összehasonlítása
Cochran próba: azt dönthetjük el, hogy a szórások között talált legnagyobb érték tekinthető-e a többivel azonos eloszlásból származónak. Alkalmazási feltétel: normális eloszlású alapsokaságok, azonos n elemszámú minták (r db sokaságból r db mintánk van) Nullhipotézis: Ellenhipotézis: H1: nem minden variancia egyenlő A próbafüggvény: DF=n-1 Elfogadási tartomány: gsz < gkrit
57
Példa – Cochran próba Egy áruházláncnál megvizsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fizetett összeg. Minden boltban kiválasztottak 6 véletlen mintát. A vásárláskor fizetett összegeket az alábbi táblázat mutatja (dollárban): Feltételezve, hogy a kifizetések normális eloszlásúak, van-e különbség a szórás tekintetében a 3 üzlet között 5%-os szignifikancia szinten? 1. bolt 2. bolt 3. bolt 12,05 15,17 9,48 23,94 18,52 6,92 14,63 19,57 10,47 25,78 21,4 7,63 17,52 13,59 11,90 18,45 20,57 5,92
58
Példa – Cochran próba Hipotézisek felállítása: H0:
1. bolt 2. bolt 3. bolt 12,05 15,17 9,48 23,94 18,52 6,92 14,63 19,57 10,47 25,78 21,4 7,63 17,52 13,59 11,90 18,45 20,57 5,92 Hipotézisek felállítása: H0: H1: nem minden variancia egyenlő Számított érték meghatározása: szükségünk van a korrigált tapasztalati szórásokra!
59
Példa – Cochran próba Kritikus érték meghatározása: α=5%
n=6 (egy-egy minta azonos elemszáma) DF=n-1=6-1=5 r=3 (a minták száma) gkrit=0,73 Döntés a nullhipotézisről: Mivel a számított érték (0,653) kisebb, mint a kritikus érték (0,73), a nullhipotézist elfogadjuk 5%-os szignifikancia szinten, azaz a sokasági szórások egyezése feltételezhető.
60
H1: nem minden variancia egyenlő
Példa – Cochran próba Egy egészségügyi kutatóközpont öt különböző fogyókúra eljárást kíván összehasonlítani. A vizsgálatra 25 túlsúlyos személyt kértek fel, akiket 5 csoportba soroltak be. Egy hónapon keresztül alkalmazták az egyes eljárásokat. Feltételezve a súlycsökkenés normális eloszlását vizsgáljuk meg, hogy van-e különbség a fogyókúrás terápiák által eredményezett súlycsökkenések varianciája között (α=5%)! Megoldás: Eljárás Súlyveszteség (kg) A 13 16 15 B 7 4 8 9 C 12 6 10 D 5 E 11 H1: nem minden variancia egyenlő
61
Példa – Cochran próba Minden fogyókúrás eljárásra ki kell számolnunk a súlycsökkenések átlagát és korrigált tapasztalati szórását: Eljárás Súlyveszteség (kg) A 13 16 15 B 7 4 8 9 C 12 6 10 D 5 E 11 5%-os szignifikancia szinten a különböző fogyókúrás eljárások eredményeként előálló súlycsökkenések varianciája között nincs különbség, mivel a számított érték kisebb, mint a kritikus. Kritikus érték: α=5%, r=5, DF=n-1=4, gkrit=0,56
62
A. Kis- és mikrovállalkozások
Pluszpont szerzési lehetőség! – Beadás óra végén – 1 pont Egy kutatás során azt vizsgálták, hogy az üzleti környezetet hogyan ítélik meg az egyes vállalkozások vezetői. A kérdőíves vizsgálat során a vállalkozások mérete alapján 3 csoportba (A, B, C) sorolták a megkérdezett vezetőket, akik válaszait egy 100 pontos skálán értékelték. Az értékelési skálán kapott pontszámok normális eloszlásúnak tekinthetők. A vizsgálat során mindhárom kategóriában 8 vállalkozást kérdeztek meg. Vizsgálja meg, hogy a vállalatméret szerinti csoportok tekintetében van-e eltérés a pontszámok szórása között! (1%) A. Kis- és mikrovállalkozások B. Közepes vállalatok C. Nagy-vállalatok 45 63 62 39 66 65 52 61 43 68 74 51 72 69 64 47 58 70 48 60 Átlag 46 67 s* 4,375 4,567 4,342 r - sokaságok száma n – minták azonos elemszáma
63
H1: nem minden variancia egyenlő
Példa megoldása H1: nem minden variancia egyenlő Kritikus érték (1%, r=3, DF=7): 0,75 Mivel a számított érték az elfogadási tartományba esik, a nullhipotézist elfogadjuk, a pontszámok szórásának egyezése ezen a szignifikancia szinten elfogadható.
64
Több sokaság várható értékének összehasonlítása - varianciaanalízis
Alkalmazási feltétel: független minta, normális eloszlású alapsokaságok, a sokasági szórások egyezése feltételezhető (lásd Cochran próba) Nullhipotézis: a nullhipotézis fennállása azt jelenti, hogy nincs kapcsolat az X mennyiségi ismérv és a sokaságokat megkülönböztető minőségi ismérv között a próba a vegyes kapcsolat tesztelésének is tekinthető, a nullhipotézis elfogadása esetén a minőségi ismérv nem befolyásolja a mennyiségi ismérv alakulását, a két ismérv független egymástól Ellenhipotézis: H1: bármely két várható érték nem egyenlő egymással H1 fennállása azt jelenti, hogy van kapcsolat az adott két ismérv között A szórásnégyzet-felbontás módszerére épül (lásd heterogén sokaság vizsgálata)
65
Több sokaság várható értékének összehasonlítása - varianciaanalízis
Menete: Főátlag számítása: Teljes négyzetösszeg: Csoportok közötti négyzetösszeg: a csoportok közti eltéréseket magyarázza, méri Csoportokon belüli négyzetösszeg: a csoportokon belüli eltéréseket, a véletlen hatásokat mutatja
66
Több sokaság várható értékének összehasonlítása - varianciaanalízis
SST = SSK + SSB SSK: a csoportosítás hatása a szóródásra Varianciahányados: H2=SSK/SST SSB: a szóródás azon része, amelyet a csoportosítás nem magyaráz a csoportosító ismérven kívül egyéb tényezők magyaráznak A varianciaanalízis éppen arra keresi a választ, hogy a csoportosító ismérvnek köszönhető eltérésnégyzet-összeg (SSK) szignifikáns nagyságrendű-e.
67
Több sokaság várható értékének összehasonlítása - varianciaanalízis
Ha H0 igaz: a csoporton belüli négyzetösszeg (SSB) 2-eloszlású n-r szabadságfokkal a csoportok közötti négyzetösszeg (SSK) 2-eloszlású r-1 szabadságfokkal a négyzetösszegek és a megfelelő szabadságfokok hányadosából képzett ún. külső (sk2), ill. belső (sb2) szórásnégyzetek egymástól függetlenek a közös várható értékük az ismeretlen, de egyenlő alapsokasági szórás: M(sk2)=M(sb2)=. A két szórás egyezésének vizsgálatával így ellenőrizhetjük eredeti hipotézisünket: a várható értékek azonosságát A próbastatisztika (r-1, n-r) paraméterű F-eloszlású:
68
Több sokaság várható értékének összehasonlítása - varianciaanalízis
ANOVA tábla Négyzetösszeg neve Négyzetösszegek Szabadságfok Szórás becslése F érték p-érték Csoportok közötti * r-1 sk2 sk2/sb2 p Csoporton belüli ** n-r sb2 - Teljes n-1
69
Példa - Varianciaanalízis
Egy áruházláncnál megvizsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fizetett összeg. Minden boltban kiválasztottak 6 véletlen mintát. A vásárláskor fizetett összegeket az alábbi táblázat mutatja (dollárban): Feltételezve, hogy a kifizetések normális eloszlásúak, van-e különbség az eladások várható értékeinek tekintetében a 3 üzlet között 5%-os szignifikancia szinten? A varianciaanalízis alkalmazási feltételei között szerepel a sokasági szórások egyezése, ezt már igazoltuk Cochran-próbával, továbbá feltételeztük az értékesítések értékének normalitását. 1. bolt 2. bolt 3. bolt 12,05 15,17 9,48 23,94 18,52 6,92 14,63 19,57 10,47 25,78 21,4 7,63 17,52 13,59 11,90 18,45 20,57 5,92
70
Példa - Varianciaanalízis
Hipotézisek felállítása: H0: H1: bármely két várható érték nem egyenlő egymással Számított érték meghatározása: n1=n2=n3=6 r=3 1. bolt 2. bolt 3. bolt 12,05 15,17 9,48 23,94 18,52 6,92 14,63 19,57 10,47 25,78 21,4 7,63 17,52 13,59 11,90 18,45 20,57 5,92
71
Példa - Varianciaanalízis
72
Példa - Varianciaanalízis
Négyzet-összegek Szabadságfok Szórás becslése F érték Csoportok közötti 378,4 Csoporton belüli 214,05 - Teljes 592,45 r-1=3-1=2 189,2 13,23 n-r=18-3=15 14,3 17 Mivel Fsz>>Fkr, a nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz az átlagok, ill. legalább egy átlag szignifikánsan különbözik a többitől. Esetünkben ez értelemszerűen a 3. bolt, ahol az egy vásárlásnál kifizetett összeg nagysága átlagosan kevesebb, mint a fele a másik két bolt átlagánál. =0,05 A számláló szabadságfoka (DF1) = 2 A nevező szabadságfoka (DF2) = 15 A kritikus érték: Fkr=3,68
73
Példa A Cochran-próbával is tesztelt fogyókúrás eljárásokat nézzük újra, és ellenőrizzük, hogy van-e különbség az egyes eljárások között a hatékonyság szempontjából 5%-os szignifikancia szinten! (vagyis van-e olyan, amelyik nagyobb átlagos súlycsökkenéssel jár, mint a többi?) Tegyük fel, hogy feltételezhető az eljárások okozta súlyveszteségek varianciájának azonossága, így folytathatjuk a várható értékek egyezésének vizsgálatával. Eljárás Súlyveszteség (kg) átlagok szórások A 13 16 15 1,22 B 7 4 8 9 1,87 C 12 6 10 2,36 D 5 E 11 1,41
74
H1: bármely két várható érték nem egyenlő egymással
Példa Mivel a számított érték nagyobb, mint a kritikus érték, így a nullhipotézist elutasítjuk. 5%-os szignifikancia szinten van különbség az egyes fogyókúrás eljárások által eredményezett súlycsökkenések várható értéke között, azaz valószínűleg van olyan, amelyik hatásosabb a másiknál. H1: bármely két várható érték nem egyenlő egymással Főátlag: α=5% DF1=4 DF2=20 Fkrit=2,87 Eljárás Súlyveszteség (kg) átlagok s*2 A 13 16 15 1,22 B 7 4 8 9 1,87 C 12 6 10 2,36 D 5 E 11 1,41
75
Példa – Feladatgyűjtemény (37.)
Egy betongyárban 4 cementgyárból (A, B, C, D) vásárolnak cementet. A cement minőségét próbakockák gyártásával ellenőrzik. A beérkező „500-as cement” szállítmányokból mintát véve a próbakockák nyomószilárdság adatai [kg/cm2-ben] az alábbiak A szállító: 512, 716, 668, 726, 580 B szállító: 516, 664, 614, 586, 590 C szállító: 542, 684, 722, 600, 642 D szállító: 566, 744, 546, 610, 672. Van-e különbség a szállítók között? (Vagyis van-e különbség a különböző cementgyártók által beszállított cement(kockák) nyomószilárdságának várható értékei között?) Varianciaanalízis, előtte Cochran próba!
76
Példa – Feladatgyűjtemény (37.)
A sokasági varianciák egyezőségének vizsgálata – Cochran próba Hipotézisek: H0: A=B=D=C H1: a legnagyobb szórású különbözik Beszállító Minta Mintaátlag Korr. tap. szórás A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 640,4 92,113 594 53,5 638 70,44 627,6 81,06
77
Példa – Feladatgyűjtemény (37.)
Cochran próba Számított érték meghatározása Kritikus érték: α=5% n=5 DF=4 r=4 gkrit=0,63 Döntés: mivel a számított érték kisebb, mint a kritikus érték, így a nullhipotézist elfogadjuk, 5%-os szignifikancia szint mellett a sokasági szórások megegyeznek. Beszállító Minta Mintaátlag Korr. tap. szórás A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 640,4 92,113 594 53,5 638 70,44 81,06 627,6
78
Példa – Feladatgyűjtemény (37.)
Varianciaanalízis Hipotézisek: H0: A=B=C=D H1: bármelyik kettő nem egyenlő Beszállító Minta Mintaátlag Korr. tap. szórás A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 640,4 92,113 594 53,5 638 70,44 627,6 81,06
79
Példa – Feladatgyűjtemény (37.)
Varianciaanalízis Beszállító Minta Mintaátlag Korr. tap. szórás A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 640,4 92,113 594 53,5 638 70,44 627,6 81,06
80
Példa – Feladatgyűjtemény (37.)
Mivel Fsz=0,4<Fkrit=3,24 H0-t elfogadjuk 95%-os megbízhatósági szinten, azaz a beszállítóktól származó próbakockák minősége (nyomószilárdsági adatai) között nincs különbség. ANOVA tábla Négyzet-összegek Szabadságfok Szórás becslése F érték Csoportok közötti Csoporton belüli - Teljes 6872,25 r-1=4-1=3 2290,75 0,4 91518,32 N-r=20-4=16 5719,9 98390,57 N-1=19 =0,05 DF1 =3 DF2 = 16 A kritikus érték: Fkr=3,24
81
Összefoglalás A zárthelyin számonkérésére kerülő próbák
Nemparaméteres próbák: Illeszkedésvizsgálat Homogenitásvizsgálat Függetlenségvizsgálat Paraméteres próbák: Egymintás Sokasági szórásra irányuló próba Várható értékre irányuló próbák (egymintás z- vagy t-próba) Kétmintás Sokasági szórásokra irányuló próba (F-próba) Várható értékekre irányuló próba (kétmintás z-, vagy t-próba, páros mintás próba) Többmintás Sokasági szórásokra (Cochran-próba) Várható értékekre irányuló próba (varianciaanalízis)
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.