Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Gazdaságstatisztika Hipotézisvizsgálatok Paraméteres próbák 2014. november 19., november 20., november 26.

Hasonló előadás


Az előadások a következő témára: "Gazdaságstatisztika Hipotézisvizsgálatok Paraméteres próbák 2014. november 19., november 20., november 26."— Előadás másolata:

1 Gazdaságstatisztika Hipotézisvizsgálatok Paraméteres próbák 2014. november 19., november 20., november 26.

2 1. A null- (H 0 ) és alternatív (H 1 ) hipotézisek megfogalmazása 2. Olyan próbafüggvény keresése, amelynek eloszlása a nullhipotézis helyességét feltételezve és a próba alkalmazási feltételeit figyelembe véve egyértelműen meghatározható. 3. A szignifikancia szint (α) megválasztása, és a próbafüggvény lehetséges értéktartományának felosztása elfogadási és elutasítási tartományra. 4. Mintavétel, ez alapján a próbafüggvény, mint valószínűségi változó számszerű értékének meghatározása. 5. Döntés a hipotézisek helyességéről: – ha a próbafüggvény értéke az előre kijelölt elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist, – ha a próbafüggvény értéke az elutasítási tartományba esik, akkor elutasítjuk a nullhipotézist. A hipotézisvizsgálat lépései

3 A próbák osztályozása  Mi a nullhipotézisük tárgya? – Paraméterre és eloszlásra irányuló próbák  Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek? – A paraméteres próbák alkalmazási feltételei között szerepelnek a sokasági eloszlás típusára, egyes paramétereire vonatkozó elvárások – A nemparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásának folytonosságát követeli meg  Hány és mekkora minta szükséges a végrehajtásukhoz? – Egy, két vagy többmintás próbák – Független és páros mintás próbák – Kis- és nagymintás próbák (határ n=30)

4 Paraméteres próbák  A paraméteres próbák szigorúbb alkalmazási feltételeket igényelnek.  Arány-, ill. intervallum szintű mérési skáláról származó adatok állnak rendelkezésre.  Erősségük (a hamis nullhipotézis elutasításának valószínűsége) nagyobb.  Normális eloszlás paramétereire vonatkozó próbák  Csoportosításuk: – Egymintás, kétmintás, többmintás – Független és páros mintás – Várható értékre, szórásra, sokasági arányra irányuló

5  Az egymintás próbák mindig egy adott sokaság valamely jellemzőjére vonatkozó feltevések helyességének ellenőrzésére szolgálnak. Ennek érdekében a rendelkezésre álló egyetlen mintából meghatározott jellemzőt (átlag, tapasztalati szórás) valamely feltételezett, vagy kívánatosnak tartott állapothoz viszonyítjuk.  Így annak a kérdésnek a megválaszolására alkalmasak, hogy az a sokaság, amelyből a minta származik lehet-e olyan, mint amilyennek mi azt a nullhipotézisben feltételezzük. – Egymintás várható értékre irányuló próbák – Egymintás sokasági szórásra irányuló próba Egymintás próbák

6 Egymintás próbák – sokasági szórásra irányuló próba  Alkalmazási feltételek: normális eloszlású alapsokaság  Nullhipotézis:  Lehetséges ellenhipotézisek és elfogadási tartományok:  A próbafüggvény χ 2 eloszlású (DF=n-1):

7 Példa A kerti törpék piacán az elmúlt évtizedekben a törpék átlagos magassága 120 cm volt, ugyanakkor a szórás ingadozott. A kiszámítható alapanyag-ellátás feltétele, hogy a szórás ne haladja meg a 10cm-t. Egy tavalyi felmérés szerint egy 25 elemű véletlen minta szórása 12cm volt. A magasság normális eloszlása ismert. Ellenőrizzük 95%-os megbízhatósággal, nincs-e veszélyben az alapanyag ellátás? Megoldás: n=25  DF=24 s * =12 σ 0 =10 Elfogadási tartomány: Kritikus érték: (α=5%, DF=24) ˂ Mivel a számított érték kisebb, mint a kritikus érték, így 5%-os szignifikancia szinten elfogadható a nullhipotézis, vagyis nincs szignifikáns eltérés a szórás tekintetében.

8 Példa Nézzük ismét az a példát, amely a légi közlekedésben az utasok átlagos testsúlyára és a testsúly szórására vonatkozóan élt feltételezésekkel (lásd illeszkedésvizsgálat, ahol a normalitást már igazoltuk). A légitársaság a terhelést 78kg-os átlagos testsúlyra és 11kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. A mintából számított jellemzők: 5%-os szignifikancia szint mellett most teszteljük az utasok testsúlyának szórására vonatkozó feltevést! Testsúly (kg) Ügyfelek száma (fő) -607 60-7016 70-8032 80-9028 90-10013 100-4 Összesen100

9  Megoldás: n=100 (DF=99)  Hipotézisek: H 0 : σ=11kg H 1 : σ>11kg H 1 : σ≠11kg Példa Elfogadási tartomány: Kritikus érték: (α=5%, DF=99) ˂ Mivel a számított érték kisebb, mint a kritikus érték, így 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, azaz a sokasági szórásra vonatkozó feltételezés elfogadható. Elfogadási tartomány: Kritikus értékek: (α/2=2,5%, DF=99) Mivel a számított érték a két kritikus érték közé esik, így 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, azaz a sokasági szórásra vonatkozó feltételezés elfogadható.

10  Az alkalmazási feltételek függvényében kétféle próba: – egymintás z-próba  ha ismerjük az alapsokasági szórást (  0 ), vagy ha nem ismerjük, de nagy mintával dolgozunk (n>30 és a  0 -t a korrigált tapasztalati szórással becsüljük) – egymintás t-próba  ha nem ismerjük az alapsokasági szórást, és kis mintánk van  Nullhipotézis: H 0 :  =m 0, vagyis a várható érték egy adott m 0 értékkel egyenlő.  Lehetséges ellenhipotézisek: Egymintás próbák – sokasági várható értékre irányuló próba H 1 :  ≠ m 0 H 1 :  > m 0 H 1 :  < m 0

11 Egymintás próbák – egymintás z-próba  Alkalmazás feltétele: normális eloszlású alapsokaság  Nullhipotézis:  Ellenhipotézisek és elfogadási tartományok:  A próbafüggvény N(0;1) eloszlású: H 0 :  =m 0 H 1 :  ≠ m 0 -z  /2 m 0 z sz { "@context": "http://schema.org", "@type": "ImageObject", "contentUrl": "http://images.slideplayer.hu/42/11597479/slides/slide_11.jpg", "name": "Egymintás próbák – egymintás z-próba  Alkalmazás feltétele: normális eloszlású alapsokaság  Nullhipotézis:  Ellenhipotézisek és elfogadási tartományok:  A próbafüggvény N(0;1) eloszlású: H 0 :  =m 0 H 1 :  ≠ m 0 -z  /2 m 0 z sz m 0 z sz

12 Példa Nézzük ismét az a példát, amely a légi közlekedésben az utasok átlagos testsúlyára és a testsúly szórására vonatkozóan élt feltételezésekkel (lásd illeszkedésvizsgálat, ahol a normalitást már igazoltuk). A légitársaság a terhelést 78kg-os átlagos testsúlyra és 11kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. A mintából számított jellemzők: 5%-os szignifikancia szint mellett most teszteljük az utasok testsúlyának várható értékére vonatkozó feltevést! Testsúly (kg) Ügyfelek száma (fő) -607 60-7016 70-8032 80-9028 90-10013 100-4 Összesen100

13 Megoldás: n=100 Hipotézisek: H 0 : μ=78kg H 1 : μ>78kg H 1 : μ≠78kg Példa Elfogadási tartomány: Kritikus érték: (α=5%) ˂ Mivel a számított érték a két kritikus érték közé esik, így a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten elfogadható, hogy az utasok testsúlyának várható értéke 78kg. Elfogadási tartomány: Kritikus érték: (α/2=2,5%) Mivel a számított érték (0,49) kisebb, mint a kritikus érték, így a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten elfogadható, hogy a sokasági várható érték 78kg.

14 Egymintás próbák – egymintás t-próba  Alkalmazás feltétele: normális eloszlású alapsokaság, ismeretlen alapsokasági szórás (és kis mintaelemszám)  Nullhipotézis:  Ellenhipotézisek és elfogadási tartományok:  A próbafüggvény Student eloszlású (DF=n-1): H 0 :  =m 0 H 1 :  ≠ m 0 -t  /2 m 0 t sz { "@context": "http://schema.org", "@type": "ImageObject", "contentUrl": "http://images.slideplayer.hu/42/11597479/slides/slide_14.jpg", "name": "Egymintás próbák – egymintás t-próba  Alkalmazás feltétele: normális eloszlású alapsokaság, ismeretlen alapsokasági szórás (és kis mintaelemszám)  Nullhipotézis:  Ellenhipotézisek és elfogadási tartományok:  A próbafüggvény Student eloszlású (DF=n-1): H 0 :  =m 0 H 1 :  ≠ m 0 -t  /2 m 0 t sz m 0 t sz

15 Egy konzervgyárban a sűrített paradicsom töltését automata gép végzi. A dobozok névleges súlya 450g, amitől csak véletlenszerű eltérések megengedettek. A súly szerinti eloszlás normálisnak tekinthető. A gyár az egyik szállítmányból 25 elemű mintát vett, a mintában a dobozok átlagos súlya 446g volt, a szórás pedig 11g. Ellenőrizzük a névleges töltősúlyra vonatkozó hipotézist 5%-os szignifikancia szinten! Megoldás: Mivel a mintaelemszám kisebb, mint 30 és nem ismert a sokasági szórás, továbbá a súly szerinti eloszlás normálisnak tekinthető, így a sokaság várható értékére vonatkozó feltevésünket egymintás t- próbával végezhetjük el. Példa

16  Megoldás: n=25 (<30) μ=450g  Hipotézisek: H 0 : μ=450g H 1 : μ<450g H 1 : μ≠450g Példa Elfogadási tartomány: Kritikus érték: (α=5%, DF=24) ˂ Mivel a számított érték kisebb, mint a kritikus érték, így a nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz nem fogadható el a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan eltér 450g-tól. Elfogadási tartomány: Kritikus érték: (α/2=2,5%, DF=24) Mivel a számított érték az elfogadási tartományba esik, így a nullhipotézist 5%-os szignifikancia szinten elfogadjuk, azaz elfogadható a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan nem tér el 450g-tól.

17 Tesztelendő paraméter Alkalmazási feltételek HipotézisekPróbafüggvényPróbafüggv ény eloszlása Sokasági várható érték Sokasági eloszlás normális sokasági szórás ismert H 0 :  = m 0 H 1 : (1)  ≠ m 0 (2)  > m 0 (3)  < m 0 standard normális (z) Sokasági eloszlás normális sokasági szórás nem ismert H 0 :  = m 0 H 1 : (1)  ≠ m 0 (2)  > m 0 (3)  < m 0 Student t- eloszlás (DF=n-1) Sokasági variancia (szórás) Sokasági eloszlás normális H 0 : σ = σ 0 H 1 : (1) σ ≠ σ 0 (2) σ > σ 0 (3) σ < σ 0 χ 2 -eloszlás (DF=n-1)

18 Példa – Feladatgyűjtemény (27.) Egy szárazelemeket gyártó vállalatnál megvizsgálták egy új típusú elemfajta élettartamát. A korábbi elemek várható élettartama 299 óra volt. Véletlen mintavétellel kiválasztva 200 új elemet, az átlagos élettartamuk 300 óra volt, 8 óra szórással. Valóban megnőtt az elemek várható élettartama (α=1%)? Megoldás: Egymintás, sokasági várható értékre irányuló próba Bár σ nem ismert, de n>30  egymintás z-próba n=200

19  Hipotézisek: H 0 : μ=299h H 1 : μ>299h Példa – Feladatgyűjtemény (27.) Elfogadási tartomány: Kritikus érték (α=1%): Mivel z sz { "@context": "http://schema.org", "@type": "ImageObject", "contentUrl": "http://images.slideplayer.hu/42/11597479/slides/slide_19.jpg", "name": " Hipotézisek: H 0 : μ=299h H 1 : μ>299h Példa – Feladatgyűjtemény (27.) Elfogadási tartomány: Kritikus érték (α=1%): Mivel z sz

20 Egy automata gépsor által töltött dobozokból 10 elemű mintát veszünk. A mintába került 10 doboz grammban kifejezett töltősúlya a következő: 255g, 242g, 245g, 253g, 249g, 251g, 250g, 255g, 245g, 246g. Ellenőrizzük, hogy a gépsor teljesíti-e a 250g várható értékű specifikációt 1%-os szignifikancia szinten! Megoldás: Egymintás sokasági várható értékre irányuló próba egymintás t-próba, n<30 n=10 (DF=9) Példa – Feladatgyűjtemény (28.)

21 Hipotézisek: H 0 : μ=250 H 1 : μ≠250 Példa – Feladatgyűjtemény (28.) Elfogadási tartomány: Kritikus érték: (α/2=0,5%, DF=9) Mivel a számított érték (-0,63) a két kritikus érték közé esik (±3,25), így a nullhipotézist elfogadjuk, azaz 1%-os szignifikancia szinten elfogadható, hogy a gépsor teljesíti a 250g-os specifikációt.

22 Egy konzervgyárban burgonyát használnak fel. Csomagolási okok miatt a burgonyák súlya nem szóródhat. Másfelől a gyárat a súlykülönbségek is érdeklik, mert a különböző méretű burgonyákat futószalag-módszerrel tudják kiválogatni. Ezért az átlagos súlykülönbségnek (szóródásnak) 5 grammnak kell lennie. A burgonyák súlyának eloszlására a normális eloszlás feltételezhető, és a tesztelést 1%-os szignifikancia szinten végezzük el. Tegyük fel, hogy két termelő szállítja be a burgonyákat. Az A termelőtől származó burgonyából vett 16 elemű minta alapján a szórás 3,8 grammra adódott. A B termelő által beszállított burgonyából vett 101 elemű minta alapján a szórás 6,6 grammra adódott. Teljesítik-e a beszállítók az elvárást? Megoldás: egymintás, sokasági szórásra irányuló próba Példa – Feladatgyűjtemény (29.)

23 „A” termelő esete: H 0 : σ=5 H 1 : σ≠5 n=16 s * =3,8gr H 1 : σ <5 Példa – Feladatgyűjtemény (29.) Elfogadási tartomány: Kritikus értékek: (α/2=0,05%, DF=15) Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem különbözik szignikánsan (1%) a σ=5 grammtól. Elfogadási tartomány: Kritikus érték: (α=1%, DF=15) Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem kisebb szignikánsan (1%), mint 5 gramm.

24 „B” termelő esete: H 0 : σ=5 H 1 : σ ≠5 n=101 s * =6,6gr H 1 : σ >5 Példa – Feladatgyűjtemény (29.) Elfogadási tartomány: Kritikus értékek: (α/2=0,05%, DF=100) Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan különbözik (1%) a σ=5 grammtól. Elfogadási tartomány: Kritikus érték: (α=1%, DF=100) Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan (1%) nagyobb, mint 5 gramm.

25 Egy csővágó automata gépnek 1200mm hosszú csődarabokat kell levágnia. A gyártásközi ellenőrzés feladata, hogy megállapítsa, hogy a gép által gyártott darabok hosszmérete megfelel-e az előírásoknak. Előző adatfelvételekből ismert, hogy a gép által gyártott csődarabok hossza normális eloszlású valószínűségi változó 3mm szórással. A gyártásközi ellenőrzésre kiválasztottak egy 16 elemű mintát. A csődarabok hossza a mintában: a) Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3mm-t! b) Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak! Példa – Feladatgyűjtemény (30.) 120812041202 1194 11951205119411971193 12051202119111951194 1187

26 Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3mm-t a minta alapján! Megoldás: Egymintás szóráspróba n=16 Hipotézisek: H 0 : σ=3 H 1 : σ>3 Példa – Feladatgyűjtemény (30.) 120812041202 1194 11951205119411971193 12051202119111951194 1187 Elfogadási tartomány: Kritikus érték: (α=5%, DF=15) Mivel a számított érték az elutasítási tartományba esik, így a nullhipotézist 5%-os szignifikancia szinten elvetjük. A csődarabok hosszának szórása 5%-os szignifikancia szinten meghaladja a 3mm-t.

27 Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak (1200mm, 5%)! Megoldás: Egymintás t-próba (n<30) H 0 : μ=1200 H 1 : μ≠1200 Példa – Feladatgyűjtemény (30.) Elfogadási tartomány: Kritikus érték: (α/2=2,5%, DF=15) 5%-os szignifikancia szinten a csővágó automata teljesíti az 1200mm várható értékű specifikációt, így elfogadjuk a nullhipotézist.

28 Paraméteres próbák Kétmintás próbák

29  A kétmintás próbák – ideértve a speciális páros mintás próbákat is – annak a kérdésnek a vizsgálatára használhatók, hogy két meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb.) sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól.  A kétmintás próbák két sokaság egymással való összehasonlítását szolgálják.  A sokaságok időben, térben vagy bármilyen más tekintetben különbözhetnek egymástól. – Kétmintás, a sokasági varianciák egyezésére irányuló próba – Páros mintás, a várható értékek különbségére irányuló próba – Két, független mintás, várható értékek egyezésére irányuló z-, ill. t- próba Kétmintás próbák

30  Alkalmazási feltétel: normális eloszlású, független alapsokaságok  Nullhipotézis:  Ellenhipotézis: H 1 :  1 2 >  2 2  A próbafüggvény F-eloszlású (DF 1, DF 2, DF 1,2 =n 1,2 -1)  Táblázataink is egyoldali próbára vonatkoznak (F , DF 1, DF 2 kritikus értékeit adják meg)  A két alapeloszlásból vett n 1 és n 2 elemű minták korrigált tapasztalati szórásai torzítatlan becslései az alapsokasági szórásoknak. Kétmintás próbák – a sokasági szórások összehasonlítására irányuló próba ahol s 1 *2 >s 2 *2

31 Példa Egy fodrászatba férfiak és nők egyaránt járnak. 12 véletlenszerűen kiválasztott férfi és 15 véletlenszerűen kiválasztott nő esetében mérjük a szolgáltatás időtartamát, amelynek eloszlása normális. A férfiak esetében a szolgáltatás igénybevételének átlagos ideje 35 perc, 26 perc szórással. A nők esetében a frizura elkészítésének átlagos ideje 48 perc, 30 perc szórással. Teszteljük 5%-os szignifikancia szinten, hogy van-e különbség a szolgáltatási idő szórása között a férfiak és nők esetében! Megoldás: kétmintás, sokasági szórások vizsgálatára irányuló próba Hipotézisek felállítása:

32 Számított érték meghatározása: Kritikus érték meghatározása: α=5% DF nő =15-1=14=DF 1 DF férfi =12-1=11=DF 2 F krit =2,72 Példa Mivel a számított érték (1,33), kisebb, mint a kritikus érték (2,72), így a nullhipotézist 5%-os szignifikancia szinten nincs jogunk elutasítani, vagyis a férfiak és nők kiszolgálási idejének szórása között nincs szignifikáns különbség.

33 Két film tetszési indexét hasonlítja össze egy közvéleménykutató intézet. Az első filmre, a Leányregény címűre 104 elemű mintát vettek, ebből 40 nő volt. A pontok átlaga 65, szórása 3,6 volt a mintában. A rém c. filmre 140 elemű mintát vettek, melyben a férfiak száma 96 volt, a pontok átlaga itt 74 volt, a szórás pedig 4,4. A pontok normális eloszlása mindkét csoportban feltételezhető. Teszteljük 1%-os szignifikancia szinten, hogy van-e különbség a két filmre adott pontok szórása között! Megoldás: Mivel a filmre adott pontszámok normalitása feltételezhető, így használhatjuk az F-próbát a sokasági szórások egyezőségének a vizsgálatára. 1-es indexszel jelöljük a A rém c. filmet, 2-es indexszel Leányregény c. filmet. Példa

34 Számított érték meghatározása: Kritikus érték meghatározása: α=1% DF 1 =140-1=139 DF 2 =104-1=103 F krit =1,53 Példa Mivel a számított érték (1,494), kisebb, mint a kritikus érték (1,53), így a nullhipotézist 1%-os szignifikancia szinten nincs jogunk elutasítani, vagyis a két filmre adott ponszámok szórása között nincs szignifikáns különbség.

35 FÜGGETLEN MINTÁK Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák  Az alkalmazási feltételek függvényében kétféle próba: – kétmintás z-próba  ha ismerjük az alapsokasági szórásokat (  1 és  2 ), vagy ha nem ismerjük, de nagy mintával dolgozunk (n 1,2 >30 és az ismeretlen alapsokasági szórásokat a korrigált tapasztalati szórásokkal becsüljük) – kétmintás t-próba  ha nem ismerjük az alapsokasági szórásokat, és kis mintáink vannak  Nullhipotézis: H 0 :  1 =  2 (vagyis a két sokasági várható érték egyenlő)  Lehetséges ellenhipotézisek: H 1 :  1 ≠ μ 2 H 1 :  1 > μ 2 H 1 :  1 < μ 2

36  Kétmintás z-próba  Alkalmazás feltétele: normális eloszlású alapsokaságok, ismert alapsokasági varianciák  Nullhipotézis: H 0 :  1 =  2  Lehetséges ellenhipotézisek és elfogadási tartományok:  A próbafüggvény N(0,1) eloszlású: Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák H 1 :  1 ≠  2 -z  /2  2 z sz { "@context": "http://schema.org", "@type": "ImageObject", "contentUrl": "http://images.slideplayer.hu/42/11597479/slides/slide_36.jpg", "name": " Kétmintás z-próba  Alkalmazás feltétele: normális eloszlású alapsokaságok, ismert alapsokasági varianciák  Nullhipotézis: H 0 :  1 =  2  Lehetséges ellenhipotézisek és elfogadási tartományok:  A próbafüggvény N(0,1) eloszlású: Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák H 1 :  1 ≠  2 -z  /2  2 z sz  2 z sz

37 Nézzük ismét az előző, két film tetszési indexét összehasonlító példánkat! Most teszteljük azt 1%-os szignifikancia szinten, hogy a van-e különbség a két film átlagos tetszési pontszáma között! Emlékeztetőül: Az első filmre, a Leányregény címűre 104 elemű mintát vettek, ebből 40 nő volt. A pontok átlaga 65, szórása 3,6 volt a mintában. A rém c. filmre 140 elemű mintát vettek, melyben a férfiak száma 96 volt, a pontok átlaga itt 74 volt, a szórás pedig 4,4. A pontok normális eloszlása mindkét csoportban feltételezhető. Megoldás: Mivel mindkét film esetében a mintaelemszám nagyobb, mint 30, továbbá feltételezhető a pontok normális eloszlása, így kétmintás z- próbát használhatunk (1-es index A rém c. film, 2-es index a Leányregény c. film).Példa

38  Hipotézisek: H 0 :  1 =  2 H 1 :  1 ≠  2  Számított érték meghatározása:  Kritikus értékek meghatározása: α=1% z α/2 =±2,34Példa Mivel a számított érték nem az elfogadási tartományba esik, így szignifikáns különbség van 1%-os szignifikancia szinten a két film tetszési indexe között.

39 Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák  Kétmintás t-próba  Alkalmazás feltétele: normális eloszlású alapsokaságok, ismeretlen alapsokasági varianciák – kis minták esetén akkor kezelhető, ha az ismeretlen szórásokról tudjuk, hogy azok egyenlőek (F-PRÓBA)  Nullhipotézis: H 0 :  1 =  2  Lehetséges ellenhipotézisek és elfogadási tartományok:  A próbafüggvény Student eloszlású (DF=n 1 +n 2 -2): H 1 :  1 ≠  2 -t  /2  2 t sz { "@context": "http://schema.org", "@type": "ImageObject", "contentUrl": "http://images.slideplayer.hu/42/11597479/slides/slide_39.jpg", "name": "Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák  Kétmintás t-próba  Alkalmazás feltétele: normális eloszlású alapsokaságok, ismeretlen alapsokasági varianciák – kis minták esetén akkor kezelhető, ha az ismeretlen szórásokról tudjuk, hogy azok egyenlőek (F-PRÓBA)  Nullhipotézis: H 0 :  1 =  2  Lehetséges ellenhipotézisek és elfogadási tartományok:  A próbafüggvény Student eloszlású (DF=n 1 +n 2 -2): H 1 :  1 ≠  2 -t  /2  2 t sz  2 t sz

40 Korábbi fodrászatos példánk (lásd sokasági szórások egyezésére irányuló próba) vizsgáljuk meg, hogy van-e különbség a kiszolgálási idő várható értéke között a férfiak és a nők esetében 5%-os szignifikancia szinten! n nő =15 n férfi =12 A kétmintás t-próba alkalmazási feltételei:  az alapsokaságok eloszlásának normalitása (nevezetesen a szolgáltatási idő eloszlása mind a férfiak, mind a nők esetében normális, ezt feltételeztük már az F-próba elvégzésénél is)   nő és  férfi nem ismert és n nő <30 és n férfi <30   nő =  férfi, ezt már bizonyítottuk F-próbával korábbanPélda

41  Hipotézisek felállítása: H 0 :  nő =  férfi H 1 :  nő ≠  férfi  Számított érték meghatározása:  Kritikus érték meghatározása: α=5% DF=15+12-2=25 t 0,975 =±2,06Példa Mivel a számított érték az elfogadási tartományba esik, így a H 0 hipotézist elfogadjuk, azaz 5%-os szignifikancia szinten nincs különbség a férfiak és a nők kiszolgálási idejének várható értéke között.

42  Hipotézisek felállítása: H 0 :  nő =  férfi H 1 :  nő >  férfi  Számított érték meghatározása:  Kritikus érték meghatározása: α=5% DF=15+12-2=25 t 0,95 =1,708Példa Mivel t sz =1,185<1,708, így a H 0 -t elfogadjuk, azaz nincs különbség a két várható érték között 5%-os szignifikancia szinten.

43  PÁROS MINTÁK  Páros mintáknál az egyik minta elemeinek kiválasztása maga után vonja a másik minta elemeinek kiválasztását.  n=n 1 =n 2  a két páros minta összetartozó elemeinek d i =y i -x i különbségeit képezzük  egy n elemű minta  Nullhipotézis: H 0 : μ 1 =μ 2 vagy H 0 : μ d =δ 0  Ellenhipotézis: egyoldali vagy kétoldali  Próbafüggvény Student eloszlást követ (DF=n-1): Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák

44 Egy speciális diéta hatásosságát vizsgálják. Ehhez minden vizsgálati személy testsúlyát megmérték a diéta előtt és után. A hipotetikus kísérlet eredménye 9 kísérleti személyen a következő táblázatban látható. Vizsgáljuk meg 1%-os szignifikancia szinten, hogy hatásos volt-e a diéta! Megoldás: Páros mintáról van szó, hiszen ugyanazon diétában résztvevő személyek testsúlyát mérték meg a diéta megkezdése előtt és után. Példa A vizsgált személy sorszáma Testsúly a diéta előtt Testsúly a diéta után 19590 27572 3110100 48175 59288 683 79493 88882 910599

45  A diéta megkezdése előtt a 9 résztvevő testsúlyának átlaga:  Hipotézisek: H 0 : μ e =μ u (μ e -μ u =0) H 1 : μ e >μ u (μ e -μ u >0) Példa A vizsgált személy sorszáma Testsúly a diéta előtt Testsúly a diéta után 19590 27572 3110100 48175 59288 683 79493 88882 910599

46  Számított érték meghatározása:  Kritikus érték: α=1% t α =2,896  Elfogadási tartomány: t sz < t α Példa A vizsgált személy sorszáma Testsúly a diéta előtt Testsúly a diéta után didi 195905 275723 311010010 481756 592884 683 0 794931 888826 9105996 Mivel a számított érték (1,511) nagyobb, mint a kritikus érték (2,896), így a nullhipotézist elutasítjuk, vagyis van szignifikáns különbség a páciensek testsúlyában a diéta előtt és után.

47 Tesztelendő paraméter Alkalmazási feltételekHipotézisekPróbafüggvényPróbafüggvény eloszlása Sokasági várható érték mindkét sokaság normális eloszlású,  1 és  2 ismert v. n 1 és n 2 >30, a minták függetlenek H 0 :  1 =  2 H 1 : (1)  1 ≠  2 (2)  1 >  2 (3)  1 <  2 standard normális (z) mindkét sokaság normális eloszlású,  1 és  2 nem ismert v. n 1 és n 2 <30  1 =  2, a minták függetlenek H 0 :  1 =  2 H 1 : (1)  1 ≠  2 (2)  1 >  2 (3)  1 <  2 Student t- eloszlás (DF=n 1 +n 2 -2) a sokaság normális eloszlású, páros minta H 0 :  1 =  2 (H 0 : μ d =δ 0 ) H 1 : (1)  1 ≠  2 (μ d ≠ δ 0 ) (2)  1 >  2 (μ d > δ 0 ) (3)  1 <  2 (μ d < δ 0 ) Student t- eloszlás (DF=n-1) Sokasági variancia Mindkét sokasági eloszlás normális, ahol s 1 *2 > s 2 *2 F-eloszlás (DF 1 =n 1 -1; DF 2 =n 2 -1)

48 Példa – Feladatgyűjtemény (32.) Kétféle oldat (A és B) pH értékét szeretnénk összehasonlítani. Hatelemű mintát elemezve az A oldatból 7,52-es átlagos pH értéket kaptunk 0,024 szórással. Ötelemű minta alapján a B oldat átlagos pH értéke 7,49 volt 0,032 szórással. Vizsgálja meg, hogy van-e különbség a két oldat pH értékében (α=5%)! Megoldás: kétmintás sokasági várható értékekre irányuló t-próba (n<30), amely előtt F-próbát kell végeznünk: H 0 :  A =  B H 1 :  A <  B α=5%DF számláló =4 DF nevező =5F krit =5,19 H 0 -t 95%-os megbízhatósági szinten elfogadjuk, rátérhetünk a t- próbára.

49  Kétmintás t-próba: H 0 :  A =  B H 1 :  A  B  Kritikus érték meghatározása: α=0,05DF=6+5-2=9t  /2 =±2,26 Mivel a számított érték (1,78) az elfogadási tartományba esik, H 0 -t 95%-os megbízhatósági szinten elfogadjuk, azaz nincs különbség a két oldat pH értéke között. Példa – Feladatgyűjtemény (32.)

50 Egy liter „A” márkájú benzin felhasználásával öt hasonló gépkocsi azonos feltételek mellett 11,5, 12,3, 10,2, 11,7 és 10,8 km-t tett meg. Ugyanezek az autók a „B” márkájú benzinnel 10,3, 9,8, 11,4, 10,1 és 10,7 km-t mentek. Vizsgálja meg, hogy az 1l-rel megtehető km-ek számát tekintve az „A” márka jobb-e, mint a „B”? Megoldás: Páros minta, kétmintás, sokasági várható értékek egyezésének vizsgálata Hipotézisek: H 0 : μ A =μ B (μ d =0) H 1 : μ A >μ B (μ d >0) Példa – Feladatgyűjtemény (31.)

51  Számított érték meghatározása:  Kritikus érték meghatározása: DF=4α=5% t krit =2,13  Elfogadási tartomány: t sz < t α Példa – Feladatgyűjtemény (31.) A benzinB benzin d i különbség 11,510,31,2 12,39,82,5 10,211,4-1,2 11,710,11,6 10,810,70,1 Mivel a próbafüggvény értéke az elfogadási tartományba esik, így H 0 -t elfogadjuk 95%-os megbízhatósági szinten, vagyis a két benzinmárka között nincsen különbség, az autók átlagos futásteljesítménye nem tér el egymástól.

52 Többmintás próbák A többmintás próbák annak a kérdésnek a vizsgálatára használhatók, hogy több – meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb.) – sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. A többmintás próbák kettőnél több sokaság egymással való összehasonlítására szolgálnak. – Több sokasági szórás (variancia) összehasonlítása – Több sokaság várható értékének összehasonlítása (varianciaanalízis)

53  Cochran próba: azt dönthetjük el, hogy a szórások között talált legnagyobb érték tekinthető-e a többivel azonos eloszlásból származónak.  Alkalmazási feltétel: normális eloszlású alapsokaságok, azonos n elemszámú minták (r db sokaságból r db mintánk van)  Nullhipotézis:  Ellenhipotézis: H 1 : nem minden variancia egyenlő  A próbafüggvény:  DF=n-1  Elfogadási tartomány: g sz < g krit Többmintás próbák – több sokasági szórás összehasonlítása

54 Egy áruházláncnál megvizsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fizetett összeg. Minden boltban kiválasztottak 6 véletlen mintát. A vásárláskor fizetett összegeket az alábbi táblázat mutatja (dollárban): Feltételezve, hogy a kifizetések normális eloszlásúak, van-e különbség a szórás tekintetében a 3 üzlet között 5%-os szignifikancia szinten? Példa – Cochran próba 1. bolt2. bolt3. bolt 12,0515,179,48 23,9418,526,92 14,6319,5710,47 25,7821,47,63 17,5213,5911,90 18,4520,575,92

55  Hipotézisek felállítása: H0:H0: H 1 : nem minden variancia egyenlő  Számított érték meghatározása: szükségünk van a korrigált tapasztalati szórásokra! Példa – Cochran próba 1. bolt2. bolt3. bolt 12,0515,179,48 23,9418,526,92 14,6319,5710,47 25,7821,47,63 17,5213,5911,90 18,4520,575,92

56  Kritikus érték meghatározása: α=5% n=6 (egy-egy minta azonos elemszáma) DF=n-1=6-1=5 r=3 (a minták száma) g krit =0,73  Döntés a nullhipotézisről: Mivel a számított érték (0,653) kisebb, mint a kritikus érték (0,73), a nullhipotézist elfogadjuk 5%-os szignifikancia szinten, azaz a sokasági szórások egyezése feltételezhető. Példa – Cochran próba

57 Egy egészségügyi kutatóközpont öt különböző fogyókúra eljárást kíván összehasonlítani. A vizsgálatra 25 túlsúlyos személyt kértek fel, akiket 5 csoportba soroltak be. Egy hónapon keresztül alkalmazták az egyes eljárásokat. Feltételezve a súlycsökkenés normális eloszlását vizsgáljuk meg, hogy van-e különbség a fogyókúrás terápiák által eredményezett súlycsökkenések varianciája között (α=5%)! Megoldás: EljárásSúlyveszteség (kg) A1316 15 B74789 C1286910 D6 577 E9111311 H 1 : nem minden variancia egyenlő

58 Minden fogyókúrás eljárásra ki kell számolnunk a súlycsökkenések átlagát és korrigált tapasztalati szórását: Példa – Cochran próba EljárásSúlyveszteség (kg) A1316 15 B74789 C1286910 D6 577 E9111311 Kritikus érték: α=5%, r=5, DF=n-1=4, g krit =0,56 5%-os szignifikancia szinten a különböző fogyókúrás eljárások eredményeként előálló súlycsökkenések varianciája között nincs különbség, mivel a számított érték kisebb, mint a kritikus.

59 Több sokaság várható értékének összehasonlítása - varianciaanalízis  Alkalmazási feltétel: független minta, normális eloszlású alapsokaságok, a sokasági szórások egyezése feltételezhető (lásd Cochran próba)  Nullhipotézis: – a nullhipotézis fennállása azt jelenti, hogy nincs kapcsolat az X mennyiségi ismérv és a sokaságokat megkülönböztető minőségi ismérv között – a próba a vegyes kapcsolat tesztelésének is tekinthető, a nullhipotézis elfogadása esetén a minőségi ismérv nem befolyásolja a mennyiségi ismérv alakulását, a két ismérv független egymástól  Ellenhipotézis: H 1 : bármely két várható érték nem egyenlő egymással – H 1 fennállása azt jelenti, hogy van kapcsolat az adott két ismérv között  A szórásnégyzet-felbontás módszerére épül (lásd heterogén sokaság vizsgálata)

60  Menete: – Főátlag számítása: – Teljes négyzetösszeg: – Csoportok közötti négyzetösszeg: a csoportok közti eltéréseket magyarázza, méri – Csoportokon belüli négyzetösszeg: a csoportokon belüli eltéréseket, a véletlen hatásokat mutatja Több sokaság várható értékének összehasonlítása - varianciaanalízis

61 SST = SSK + SSB  SSK: a csoportosítás hatása a szóródásra  Varianciahányados: H 2 =SSK/SST  SSB: a szóródás azon része, amelyet a csoportosítás nem magyaráz – a csoportosító ismérven kívül egyéb tényezők magyaráznak  A varianciaanalízis éppen arra keresi a választ, hogy a csoportosító ismérvnek köszönhető eltérésnégyzet-összeg (SSK) szignifikáns nagyságrendű-e. Több sokaság várható értékének összehasonlítása - varianciaanalízis

62  Ha H 0 igaz: – a csoporton belüli négyzetösszeg (SSB)  2 -eloszlású n-r szabadságfokkal – a csoportok közötti négyzetösszeg (SSK)  2 -eloszlású r-1 szabadságfokkal – a négyzetösszegek és a megfelelő szabadságfokok hányadosából képzett ún. külső (s k 2 ), ill. belső (s b 2 ) szórásnégyzetek egymástól függetlenek – a közös várható értékük az ismeretlen, de egyenlő alapsokasági szórás: M(s k 2 )=M(s b 2 )= . – A két szórás egyezésének vizsgálatával így ellenőrizhetjük eredeti hipotézisünket: a várható értékek azonosságát  A próbastatisztika (r-1, n-r) paraméterű F-eloszlású: Több sokaság várható értékének összehasonlítása - varianciaanalízis

63  ANOVA tábla Több sokaság várható értékének összehasonlítása - varianciaanalízis Négyzetösszeg neve NégyzetösszegekSzabadságfok Szórás becslése F értékp-érték Csoportok közötti * r-1sk2sk2 s k 2 /s b 2 p Csoporton belüli ** n-rsb2sb2 -- Teljesn-1---

64 Egy áruházláncnál megvizsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fizetett összeg. Minden boltban kiválasztottak 6 véletlen mintát. A vásárláskor fizetett összegeket az alábbi táblázat mutatja (dollárban): Feltételezve, hogy a kifizetések normális eloszlásúak, van-e különbség az eladások várható értékeinek tekintetében a 3 üzlet között 5%-os szignifikancia szinten? A varianciaanalízis alkalmazási feltételei között szerepel a sokasági szórások egyezése, ezt már igazoltuk Cochran-próbával, továbbá feltételeztük az értékesítések értékének normalitását. 1. bolt2. bolt3. bolt 12,0515,179,48 23,9418,526,92 14,6319,5710,47 25,7821,47,63 17,5213,5911,90 18,4520,575,92 Példa - Varianciaanalízis

65  Hipotézisek felállítása: H0:H0: H 1 : bármely két várható érték nem egyenlő egymással  Számított érték meghatározása: n 1 =n 2 =n 3 =6r=3 Példa - Varianciaanalízis 1. bolt2. bolt3. bolt 12,0515,179,48 23,9418,526,92 14,6319,5710,47 25,7821,47,63 17,5213,5911,90 18,4520,575,92

66 Példa - Varianciaanalízis

67 Négyzet- összegek Szabadságfok Szórás becslése F érték Csoportok közötti 378,4 Csoporton belüli 214,05- Teljes 592,45-- Példa - Varianciaanalízis r-1=3-1=2 n-r=18-3=15 17 189,2 14,3  =0,05 A számláló szabadságfoka (DF 1 ) = 2 A nevező szabadságfoka (DF 2 ) = 15 A kritikus érték: F kr =3,68 Mivel F sz >>F kr, a nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz az átlagok, ill. legalább egy átlag szignifikánsan különbözik a többitől. Esetünkben ez értelemszerűen a 3. bolt, ahol az egy vásárlásnál kifizetett összeg nagysága átlagosan kevesebb, mint a fele a másik két bolt átlagánál. 13,23

68 A Cochran-próbával is tesztelt fogyókúrás eljárásokat nézzük újra, és ellenőrizzük, hogy van-e különbség az egyes eljárások között a hatékonyság szempontjából 5%-os szignifikancia szinten! (vagyis van-e olyan, amelyik nagyobb átlagos súlycsökkenéssel jár, mint a többi?) Tegyük fel, hogy feltételezhető az eljárások okozta súlyveszteségek varianciájának azonossága, így folytathatjuk a várható értékek egyezésének vizsgálatával.Példa EljárásSúlyveszteség (kg)átlagokszórások A1316 15 1,22 B7478971,87 C128691092,36 D61057771,87 E9111311 1,41

69  Főátlag: Példa H 1 : bármely két várható érték nem egyenlő egymással EljárásSúlyveszteség (kg)átlagokszórások A1316 15 1,22 B7478971,87 C128691092,36 D61057771,87 E9111311 1,41 α=5% DF 1 =4 DF 2 =20 F krit =2,87 Mivel a számított érték nagyobb, mint a kritikus érték, így a nullhipotézist elutasítjuk. 5%-os szignifikancia szinten van különbség az egyes fogyókúrás eljárások által eredményezett súlycsökkenések várható értéke között, azaz valószínűleg van olyan, amelyik hatásosabb a másiknál.

70 Egy betongyárban 4 cementgyárból (A, B, C, D) vásárolnak cementet. A cement minőségét próbakockák gyártásával ellenőrzik. A beérkező „500-as cement” szállítmányokból mintát véve a próbakockák nyomószilárdság adatai [kg/cm 2 -ben] az alábbiak A szállító: 512, 716, 668, 726, 580 B szállító: 516, 664, 614, 586, 590 C szállító: 542, 684, 722, 600, 642 D szállító: 566, 744, 546, 610, 672. Van-e különbség a szállítók között? (Vagyis van-e különbség a különböző cementgyártók által beszállított cement(kockák) nyomószilárdságának várható értékei között?) Varianciaanalízis, előtte Cochran próba! Példa – Feladatgyűjtemény (37.)

71  A sokasági varianciák egyezőségének vizsgálata – Cochran próba Hipotézisek: H 0 :  A =  B =  D =  C H 1 : a legnagyobb szórású különbözik Példa – Feladatgyűjtemény (37.) Beszállító MintaMintaátlagKorr. tap. szórás A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, 672 640,4 594 638 627,6 92,113 53,5 70,44 81,06

72  Cochran próba  Számított érték meghatározása  Kritikus érték: α=5% n=5 DF=4r=4g krit =0,63  Döntés: mivel a számított érték kisebb, mint a kritikus érték, így a nullhipotézist elfogadjuk, 5%-os szignifikancia szint mellett a sokasági szórások megegyeznek. Példa – Feladatgyűjtemény (37.) Beszállító MintaMintaátlagKorr. tap. szórás A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, 672 640,4 594 638 627,6 92,113 53,5 70,44 81,06

73  Varianciaanalízis  Hipotézisek: H 0 :  A =  B =  C =  D H 1 : bármelyik kettő nem egyenlő Példa – Feladatgyűjtemény (37.) Beszállító MintaMintaátlagKorr. tap. szórás A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, 672 640,4 594 638 627,6 92,113 53,5 70,44 81,06

74  Varianciaanalízis Példa – Feladatgyűjtemény (37.) Beszállító MintaMintaátlagKorr. tap. szórás A512, 716, 668, 726, 580 B516, 664, 614, 586, 590 C542, 684, 722, 600, 642 D566, 744, 546, 610, 672 640,4 594 638 627,6 92,113 53,5 70,44 81,06

75  ANOVA tábla Példa – Feladatgyűjtemény (37.) Négyzet- összegek Szabadságfok Szórás becslése F érték Csoportok közötti Csoporton belüli - Teljes -- 6872,25 91518,32 98390,57 r-1=4-1=3 N-r=20-4=16 N-1=19  =0,05 DF 1 =3 DF 2 = 16 A kritikus érték: F kr =3,24 Mivel F sz =0,4 { "@context": "http://schema.org", "@type": "ImageObject", "contentUrl": "http://images.slideplayer.hu/42/11597479/slides/slide_75.jpg", "name": " ANOVA tábla Példa – Feladatgyűjtemény (37.) Négyzet- összegek Szabadságfok Szórás becslése F érték Csoportok közötti Csoporton belüli - Teljes -- 6872,25 91518,32 98390,57 r-1=4-1=3 N-r=20-4=16 N-1=19  =0,05 DF 1 =3 DF 2 = 16 A kritikus érték: F kr =3,24 Mivel F sz =0,4

76 Összefoglalás  A zárthelyin számonkérésére kerülő próbák  Nemparaméteres próbák: – Illeszkedésvizsgálat – Homogenitásvizsgálat – Függetlenségvizsgálat  Paraméteres próbák: – Egymintás Sokasági szórásra irányuló próba Várható értékre irányuló próbák (egymintás z- vagy t-próba) – Kétmintás Sokasági szórásokra irányuló próba (F-próba) Várható értékekre irányuló próba (kétmintás z-, vagy t-próba, páros mintás próba) – Többmintás Sokasági szórásokra (Cochran-próba) Várható értékekre irányuló próba (varianciaanalízis)


Letölteni ppt "Gazdaságstatisztika Hipotézisvizsgálatok Paraméteres próbák 2014. november 19., november 20., november 26."

Hasonló előadás


Google Hirdetések