Gazdaságstatisztika 18. előadás Hipotézisvizsgálatok Paraméteres próbák I. 18. előadás
Hol járunk?
Paraméteres próbák Statisztikai hipotézisen a vizsgált sokaság(ok)ra (valószínűség-eloszlásra) vagy ennek paramétere(i)re vonatkozó valamilyen feltevést értünk. Paraméteres próbák Ismerjük a valószínűségi változó eloszlásának típusát A nullhipotézis a valószínűségi változó eloszlásfüggvényének valamely paraméterére vagy paramétereire vonatkozik
Paraméteres próbák csoportosítása Az általunk tárgyalt hipotézisvizsgálatok az alábbiak szerint csoportosíthatók Nullhipotézis szerint szórásra, várható értékre vonatkozó próbák Minták száma szerint egy-, két-, ill. többmintás próbák Kétmintás próbáknál a minták kapcsolata alapján független és páros próbák
Egy minta adatai alapján teszteljük a nullhipotézist. Például: Egymintás próbák Egy minta adatai alapján teszteljük a nullhipotézist. Például: H0: M() = = 500 ml H1: M() = 500 ml H1: M() = > 500 ml H1: M() = < 500 ml
Ismert-e az elméleti szórás? Egymintás próbák normális eloszlású valószínűségi változó várható értékére z-próba t-próba Ismert-e az elméleti szórás? Igen (v. n > 30) Nem
Egymintás próbák normális eloszlású valószínűségi változó várható értékére Hipotézisvizsgálatok Nemparaméteres próbák Paraméteres próbák Többmintás próbák Illeszkedésvizsgálat χ2-próbával H0: F=F0 Több normális eloszlású valószínűségi változó várható értékeire Több normális eloszlású valószínűségi változó szórásnégyzeteire Homogenitásvizsgálat χ2-próbával H0: F(ξ)=G(η) Variancia analízis H0: μ1=μ2=…=μn σ1=σ2=…=σn Cochran-féle C próba H0: σ1=σ2=…=σr n1=n2=…=nr=n Függetlenségvizsgálat χ2-próbával H0: ξ és η független Egymintás próbák Kétmintás próbák Normális eloszlású valószínűségi változó várható értékére Normális eloszlású valószínűségi változó szórásnégyzetére Két normális eloszlású valószínűségi változó várható értékeire Két normális eloszlású valószínűségi változó szórásnégyzeteire Egymintás z-próba H0: μ=μ0 σ ismert,vagy n>30 χ2-próba a szórásnégyzetre H0: σ2=σ20 Független minták esetén Páros minták esetén F-próba H0: σ21 =σ22 Egymintás t-próba H0: μ=μ0 σ ismeretlen Kétmintás z-próba H0: μ1=μ2 σ1, σ2 ismert, vagy n1,n2>30 Páros t-próba H0: μ1-μ2=d0 Kétmintás t-próba H0: μ1=μ2 σ1,σ2 ismeretlen, σ1 = σ2
Feladat (egymintás z-próba) ROM chipek gyártása során az égetőkemence maximális hőmérsékletére vonatkozó n=8 elemű minta alapján a mixmális hőmérséklet átlaga 492°C-ra adódott. Korábbi vizsgálatok alapján tudjuk, hogy a folyamatban a maximum hőmérsékletek elméleti szórása 12°C. Feltehető-e, hogy a maximum hőmérséklet 500°C?
Feladat (egymintás z-próba) megoldása H0: = 500 °C H1: 500 °C 0 = 12 °C = 5% /2 = 2,5% z/2 = z0,975 = 1,96 Elfogadási tartomány: -1,96 ≤ zsz ≤ 1,96 Döntés: -z/2 ≤ zsz ≤ z/2 => H0-t elfogadjuk
Feladat (egymintás t-próba) Egy robogókat gyártó vállalat 50cm3 hengerűrtartalmú, “Speedy” nevű csúcsmodellje 45 mérföld/órás sebességet képes elérni. Egy másik robogó márka azonos hengerűrtartalmú “Quickest” nevű modelljének végsebességéről gyűjtött 16 elemű statisztikai minta alapján megállapítható, hogy a “Quickest” végsebességének mintából számított átlaga 43,5 mérföld/óra, korrigált empirikus szórása s* = 3,0 mérföld/óra. Elfogadható-e 5%-os szignifikancia szinten, hogy a “Quickest” modell maximális sebessége kisebb a “Speedy” modell végsebességénél, azaz 45 mérföld/óránál?
Feladat (egymintás t-próba) megoldása H0: = 45 m/h H1: < 45 m/h s* = 3,0 m/h = 5% DF=n-1=15 t =t0,95= 1,753 Elfogadási tartomány: tsz ≥-1,753 Döntés: tsz<-t => H0-t elutasítjuk
Egymintás próba normális eloszlású valószínűségi változó szórásnégyzetére H0: σ2= σ02 Próbastatisztika (próbafüggvény) n-1 szabadságfokú χ2 eloszlású Kritikus tartomány Ha
Egymintás próba normális eloszlású valószínűségi változó szórásnégyzetére Hipotézisvizsgálatok Nemparaméteres próbák Paraméteres próbák Többmintás próbák Illeszkedésvizsgálat χ2-próbával H0: F=F0 Több normális eloszlású valószínűségi változó várható értékeire Több normális eloszlású valószínűségi változó szórásnégyzeteire Homogenitásvizsgálat χ2-próbával H0: F(ξ)=G(η) Variancia analízis H0: μ1=μ2=…=μn σ1=σ2=…=σn Cochran-féle C próba H0: σ1=σ2=…=σr n1=n2=…=nr=n Függetlenségvizsgálat χ2-próbával H0: ξ és η független Egymintás próbák Kétmintás próbák Normális eloszlású valószínűségi változó várható értékére Normális eloszlású valószínűségi változó szórásnégyzetére Két normális eloszlású valószínűségi változó várható értékeire Két normális eloszlású valószínűségi változó szórásnégyzeteire Egymintás z-próba H0: μ=μ0 σ ismert,vagy n>30 χ2-próba a szórásnégyzetre H0: σ2=σ20 Független minták esetén Páros minták esetén F-próba H0: σ21 =σ22 Egymintás t-próba H0: μ=μ0 σ ismeretlen Kétmintás z-próba H0: μ1=μ2 σ1, σ2 ismert, vagy n1,n2>30 Páros t-próba H0: μ1-μ2=d0 Kétmintás t-próba H0: μ1=μ2 σ1,σ2 ismeretlen, σ1 = σ2
Két minta adatai alapján teszteljük a nullhipotézist. Például: Kétmintás próbák Két minta adatai alapján teszteljük a nullhipotézist. Például: H0: M(1) = M(2) 1 = 2 H1: M(1) M(2) 1 2 H1: M(1) > M(2) 1 > 2 H1: M(1) < M(2) 1 < 2
Ismert-e az elméleti szórás? Nem, de a szórások egyeznek Kétmintás próbák két normális eloszlású valószínűségi változó várható értékeinek egyenlőségére független minták esetén u(z)-próba t-próba Ismert-e az elméleti szórás? Igen (vagy n1 és n2 > 30) Nem, de a szórások egyeznek * ha az elméleti szórások nem ismertek, de n1 és n2>30, akkor 12s1*2és 22s2*2 ** DF=n1+n2-2
Kétmintás próbák két norm. elosz. val. vált Kétmintás próbák két norm. elosz. val. vált. várható értékeinek egyenlőségére Hipotézisvizsgálatok Nemparaméteres próbák Paraméteres próbák Többmintás próbák Illeszkedésvizsgálat χ2-próbával H0: F=F0 Több normális eloszlású valószínűségi változó várható értékeire Több normális eloszlású valószínűségi változó szórásnégyzeteire Homogenitásvizsgálat χ2-próbával H0: F(ξ)=G(η) Variancia analízis H0: μ1=μ2=…=μn σ1=σ2=…=σn Cochran-féle C próba H0: σ1=σ2=…=σr n1=n2=…=nr=n Függetlenségvizsgálat χ2-próbával H0: ξ és η független Egymintás próbák Kétmintás próbák Normális eloszlású valószínűségi változó várható értékére Normális eloszlású valószínűségi változó szórásnégyzetére Két normális eloszlású valószínűségi változó várható értékeire Két normális eloszlású valószínűségi változó szórásnégyzeteire Egymintás z-próba H0: μ=μ0 σ ismert,vagy n>30 χ2-próba a szórásnégyzetre H0: σ2=σ20 Független minták esetén Páros minták esetén F-próba H0: σ21 =σ22 Egymintás t-próba H0: μ=μ0 σ ismeretlen Kétmintás z-próba H0: μ1=μ2 σ1, σ2 ismert, vagy n1,n2>30 Páros t-próba H0: μ1-μ2=d0 Kétmintás t-próba H0: μ1=μ2 σ1,σ2 ismeretlen, σ1 = σ2
Feladat (kétmintás t-próba) A Fogyasztóvédelmi Felügyelőség két fajta cigaretta („A” és „B”) szén-monoxid (CO) emisszióját hasonlította össze. A minták statisztikai adatait az alábbi táblázat tartalmazza. Hasonlítsuk össze, hogy a két fajta cigaretta CO kibocsátása eltér-e egymástól?
Feladat (kétmintás t-próba) megoldása Az elméleti szórásokat nem ismerjük. Egyelőre tételezzük fel, hogy a két sokaságban a szórások megegyeznek (ezt a későbbiekben egy statisztikai próbával fogjuk ellenőrizni). Ekkor kétmintás t-próbát használhatunk. H0: 1 = 2 Kétoldali próba H1: 1 2 = 0,02 DF = 11+10-2 = 19 t/2 = 2,539 Elfogadási tartomány: -2,54 ≤ tsz ≤ 2,54 A két sokaság várható értékének egyezőségét 2%-os szignifikancia szinten elfogadjuk.
Feladat (kétmintás z-próba) Két gyártó egy-egy kávéfajtájának kiskereskedelmi egységárát szeretnénk összehasonlítani. Véletlenszerű mintát véve országszerte e kávéfajtákat áruló boltok közül, s feldolgozva az adatokat, a kapott statisztikai jellemzőket a következő táblázat mutatja. 1%-os szignifikancia szinten feltehető-e, hogy az „A” típusú kávé drágább, mint a „B”?
Feladat (kétmintás z-próba) megoldása Az elméleti szórásokat nem ismerjük, de a mintaszám elég nagy mindkét mintában, ezért kétmintás z-próbát használhatunk. H0: 1 = 2 Egyoldali próba H1: 1 > 2 = 0,01 z = 2,33 Elfogadási tartomány: zsz ≤ 2,33 Döntés: zsz az elutasítási tartományba esik, ezért a nullhipotézist elutasítjuk.
t-próba két normális eloszlású valószínűségi változó várható értékeinek egyenlőségére páros minták esetén (1) Az eddig tárgyalt kétmintás statisztikai próbák alkalmazásánál fontos feltétel volt a minták függetlensége. Páros minták esetén a minták nem függetlenek egymástól, „van bennük valamilyen közös tényező” (pl. ugyan az a mérőeszköz, ugyanazt az alkatrészt, embert stb. vizsgáljuk). Páros mintáknál az egyik minta elemeinek kiválasztása maga után vonja a másik minta elemeinek kiválasztását. A páros (összefüggő) sokaságokban a két sokaság (s ebből következően a két minta) elemei egymással kölcsönös és egyértelmű megfeleltetésbe hozhatók. Megközelítés: Képezzük a két minta különbségét és egymintás t-póbát alkalmazunk annak megállapítására, hogy a vizsgált valószínűségi változók várható értékeinek különbsége szignifikánsan eltér-e nullától.
t-próba két normális eloszlású valószínűségi változó várható értékeinek egyenlőségére páros minták esetén (2) H0: μ 1 = μ2 (μ 1 - μ2=0 ) n1=n2=n a két minta elemszáma : az i-edik összetartozó mintaelem-pár különbsége (i=1,..,n). Ezekből áll az a minta, amelyre az egymintás t-próbát alkalmazzuk. : a értékek számtani közepe (i=1,..,n) a értékekből száított korrigált tapasztalati szórás Próbastatisztika: Ha H0 teljesül, akkor tsz n-1 szabadságfokú student eloszlású A döntési elv megegyezik az egymintás t-próba döntési elvével.
Páros t-próba két norm. elosz. val. vált Páros t-próba két norm. elosz. val. vált. várható értékeinek egyenlőségére Hipotézisvizsgálatok Nemparaméteres próbák Paraméteres próbák Többmintás próbák Illeszkedésvizsgálat χ2-próbával H0: F=F0 Több normális eloszlású valószínűségi változó várható értékeire Több normális eloszlású valószínűségi változó szórásnégyzeteire Homogenitásvizsgálat χ2-próbával H0: F(ξ)=G(η) Variancia analízis H0: μ1=μ2=…=μn σ1=σ2=…=σn Cochran-féle C próba H0: σ1=σ2=…=σr n1=n2=…=nr=n Függetlenségvizsgálat χ2-próbával H0: ξ és η független Egymintás próbák Kétmintás próbák Normális eloszlású valószínűségi változó várható értékére Normális eloszlású valószínűségi változó szórásnégyzetére Két normális eloszlású valószínűségi változó várható értékeire Két normális eloszlású valószínűségi változó szórásnégyzeteire Egymintás z-próba H0: μ=μ0 σ ismert,vagy n>30 χ2-próba a szórásnégyzetre H0: σ2=σ20 Független minták esetén Páros minták esetén F-próba H0: σ21 =σ22 Egymintás t-próba H0: μ=μ0 σ ismeretlen Kétmintás z-próba H0: μ1=μ2 σ1, σ2 ismert, vagy n1,n2>30 Páros t-próba H0: μ1-μ2=d0 Kétmintás t-próba H0: μ1=μ2 σ1,σ2 ismeretlen, σ1 = σ2
Feladat (páros t-próba)* Egy sportcipőket gyártó cég szeretné meghatározni, hogy egy új típusú cipő („A”) élettartama nagyobb-e az előzőtől („B”)? Felkértek tíz kocogót, hogy teszteljék a termékeket. Az eredményeket (az élettartamokat hetekben mérve) az alábbi táblázat mutatja (az élettartamok normális eloszlást követnek). 95%-os megbízhatósági szinten vizsgálva elfogadható-e, hogy az új típusú cipők élettartama nagyobb a régieknél? * Forrás: Sincich, T.:Statistics by Example, Dellen Publishing Company, San Fransisco, 1990
Feladat (páros t-próba) megoldása A cipők élettartama normális eloszlású. Páros minta áll rendelkezésre (közös tényező a kocogó), ezért páros t-próbát alkalmazunk. H0: 1 = 2 Egyoldali próba H1: 1 > 2 = 0,05 DF=10-1=9 t = 1,83 Elfogadási tartomány: tsz ≤ 1,83 Mivel tsz az elutasítási tartományba esik, H0-t 5%-os szignifikancia szinten nem fogadjuk el, azaz elfogadható, hogy az új cipők élettartama nagyobb, mint a régieké.
Gondolkodtató feladat A helyes megoldás 3 plusz pontot ér az elért összpontszámban, de nem helyettesít pontokat a zárthelyi dolgozatban A megoldások a november 27-ei előadáson adhatóak le (papíron)