Gazdaságstatisztika Hipotézisvizsgálatok Nemparaméteres próbák II. 17. előadás
Teljes eseményrendszer valószínűségeinek tesztelése Illeszkedésvizsgálatok Tiszta Becsléses Homogenitásvizsgálat Függetlenségvizsgálat χ 2 -próbák alkalmazásai Mi ezekkel foglalkozunk. 2
Döntési elv χ 2 -próbák esetén f( 2 ) 22 DF 2 krit 2 szám =1- P( 2 szám < 2 krit ( )|H 0 igaz) = 1- = 3 Illeszkedésvizsgálat esetén:
r: a sorok száma f i· : az i-edik sor peremgyakorisága (sorösszege) f ·j : a j-edik oszlop peremgyakorisága (oszlopösszege) N: minta elemszáma F ij : az elméleti gyakoriságok DF = r-1 Homogenitásvizsgálat χ 2 -próbával 4 Homogenitásvizsgálat segítségével eldönthetjük, hogy két valószínűségi változó azonos eloszlásúnak tekinthető-e. H 0 : a vizsgált valószínűségi változók azonos eloszlásúak H 1 : a vizsgált valószínűségi változók nem azonos eloszlásúak A közösnek feltételezett eloszlásfüggvényre nincs kikötés Az adatokat úgynevezett kontingencia táblázatba rendezzük A kontingencia táblázat cellái tartalmazzák A tapasztalati gyakoriságokat, a bal felső sarokban; a számított elméleti gyakoriságokat, a jobb alsó sarokban Döntési elv: H 0 -át elfogadjuk, ha 2 szám ≤ 2 krit ; egyébként H 0 -át elvetjük.
f 1· f ·1 f ·2 Homogenitásvizsgálat χ 2 -próbával Kontingencia táblázat Perem- gyakoriságok 5
Homogenitásvizsgálat a “szakácskönyvben” 6 Hipotézisvizsgálatok Nemparaméteres próbákParaméteres próbák Egymintás próbákKétmintás próbák Többmintás próbák Normális eloszlású valószínűségi változó várható értékére Normális eloszlású valószínűségi változó szórásnégyzetére Egymintás z-próba H 0 : μ=μ 0 σ ismert,vagy n>30 Egymintás t-próba H 0 : μ=μ 0 σ ismeretlen χ 2 -próba a szórásnégyzetre H 0 : σ 2 =σ 2 0 Két normális eloszlású valószínűségi változó várható értékeire Két normális eloszlású valószínűségi változó szórásnégyzeteire Kétmintás z-próba H 0 : μ 1 =μ 2 σ 1, σ 2 ismert, vagy n 1,n 2 >30 Kétmintás t-próba H 0 : μ 1 =μ 2 σ 1 = σ 2 Független minták eseténPáros minták esetén Páros t-próba H 0 : μ 1 -μ 2 =d 0 F-próba H 0 : σ 2 1 =σ 2 2 Több normális eloszlású valószínűségi változó várható értékeire Több normális eloszlású valószínűségi változó szórásnégyzeteire Illeszkedésvizsgálat χ 2 - próbával H 0 : F=F 0 Homogenitásvizsgálat χ 2 - próbával H 0 : F(ξ)=G(η) Függetlenségvizsgálat χ 2 - próbával H 0 : ξ és η független Variancia analízis H 0 : μ 1 =μ 2 =…=μ n Cochran-féle C próba H 0 : σ 1 =σ 2 =…=σ n
Az engedéllyel rendelkező budai és pesti virágárusok közül egymástól függetlenül egy-egy mintát vettek a virágárak vizsgálata céljából. A két mintába került árusoktól - többek között - a rózsa szálankénti árát is megkérdezték. Vizsgáljuk meg 1%-os szignifikancia szinten annak a hipotézisnek a helyességét, hogy a rózsaárak nagyság szerinti eloszlása a budai és pesti virágárusok körében azonos. Az adatokat a következő táblázat tartalmazza. 1 Forrás: Hunyadi – Vita: Statisztika közgazdászoknak, KSH, Budapest, 2002 Példa 1 7
Példa (adatok) 8
H 0 : F budai = G pesti n 1 =72n 2 =84r =7 DF= r-1= 6 = 0,01 2 krit = 16,8 Példa - megoldás 9
F ij = ? Pl.: F 11 = 72·8/156 = 3,69 F 21 = 72·28/156 = 12,92 2 szám = ( 3-3,69) 2 /3, = Példa - megoldás Következtetés: 1%-os szignifikancia szint mellett elvetjük azt a hipotézist, hogy a rózsaárak nagyság szerinti eloszlása a budai és pesti virágárusok körében azonos. Következtetés: 1%-os szignifikancia szint mellett elvetjük azt a hipotézist, hogy a rózsaárak nagyság szerinti eloszlása a budai és pesti virágárusok körében azonos. 10
A Gazdaságstatisztika példatárban VII. Hipotézisvizsgálatok Nemparaméteres próbák 4. feladat Homogenistásvizsgálat χ 2 -próbával Kapcsolódó feladat 11
Függetlenségvizsgálat χ 2 -próbával 12 Két minősítő ismérv között van-e sztochasztikus kapcsolat? Diszkért, azaz minősítéses, illetve csoportosított (kategorizált) folytonos változók közötti kapcsolat vizsgálatára alkalmas a függetlenségvizsgálat χ2 –próbával A hipotézsiek: H 0 : a két változó független H 1 : a két változó nem független A próba végrehajtása hasonló a homogenitásvizsálathoz DF=(r-1)(s-1), ahol r a kontingencia táblázat sorainak, s pedig az oszlopainak száma Döntési elv: H 0 -át elfogadjuk, ha 2 szám ≤ 2 krit ; egyébként H 0 -át elvetjük.
Függetlenségvizsgálat a “szakácskönyvben” 13 Hipotézisvizsgálatok Nemparaméteres próbákParaméteres próbák Egymintás próbákKétmintás próbák Többmintás próbák Normális eloszlású valószínűségi változó várható értékére Normális eloszlású valószínűségi változó szórásnégyzetére Egymintás z-próba H 0 : μ=μ 0 σ ismert,vagy n>30 Egymintás t-próba H 0 : μ=μ 0 σ ismeretlen χ 2 -próba a szórásnégyzetre H 0 : σ 2 =σ 2 0 Két normális eloszlású valószínűségi változó várható értékeire Két normális eloszlású valószínűségi változó szórásnégyzeteire Kétmintás z-próba H 0 : μ 1 =μ 2 σ 1, σ 2 ismert, vagy n 1,n 2 >30 Kétmintás t-próba H 0 : μ 1 =μ 2 σ 1 = σ 2 Független minták eseténPáros minták esetén Páros t-próba H 0 : μ 1 -μ 2 =d 0 F-próba H 0 : σ 2 1 =σ 2 2 Több normális eloszlású valószínűségi változó várható értékeire Több normális eloszlású valószínűségi változó szórásnégyzeteire Illeszkedésvizsgálat χ 2 - próbával H 0 : F=F 0 Homogenitásvizsgálat χ 2 - próbával H 0 : F(ξ)=G(η) Függetlenségvizsgálat χ 2 - próbával H 0 : ξ és η független Variancia analízis H 0 : μ 1 =μ 2 =…=μ n Cochran-féle C próba H 0 : σ 1 =σ 2 =…=σ n
Egy szociológiai vizsgálatban a mintába került személyektől megkérdezték a saját és szüleik iskolai végzettségét. A megkérdezettek és az apjuk iskolai végzettsége közötti összefüggést a következő táblázat tartalmazza.Vizsgáljuk meg 1%-os szignifikancia szinten, azt a nullhipotézist, hogy a megkérdezettek és apjuk iskolai végzettsége független egymástól. * Forrás: Hunyadi – Vita: Statisztika közgazdászoknak, KSH, Budapest, 2002 Példa 1 14
Példa (adatok) 15
H 0 : a megkérdezettek iskolai végzettsége független apjuk iskolai végzettségétől N = 2723r =4s = 4 DF= (r-1)(s-1) = 9 = 0,01 2 krit = 21,7 Elméleti értékek: Pl.: F 11 = 462·1435/2723 = 244 F 21 = 462·438/2723 = 74 : F 12 = 644·1435/2723 = 339 F 22 = 644·438/2723 = 104 : 2 szám = 710,4 Példa - megoldás 16
Példa - megoldás 17
Minőségi ismérvek asszociációja q = min(r,s) N = 2723 2 = 710,4 r = s = 4 q = 4 18 A minőségi ismérvek között kapcsolat szorossága a minőségi ismérvek közötti asszociációval vizsgálható Cramer-féle asszociációs együttható 0 és 1 közötti értéket vesz fel. Minél közelebb esik 1-hez, annál szorosabb a kapcsolat
Példa (*) A csokoládé, a vanília és az eper-fagylaltok iránti preferenciát vizsgálták kisiskolások körében. 4 korcsoportban, összesen 289 kisiskolástól kérdezték meg, hogy melyik fagylaltok kedveli a leginkább. A felmérés eredményét a következő táblázat összegzi. Feltételezhető-e, hogy a fagylaltok iránti preferencia független a kisiskolás korától? osztály2. osztály3. osztály4. osztály Csokoládé Vanília Eper
20 Hipotézisvizsgálatok Nemparaméteres próbákParaméteres próbák Egymintás próbákKétmintás próbák Többmintás próbák Normális eloszlású valószínűségi változó várható értékére Normális eloszlású valószínűségi változó szórásnégyzetére Egymintás z-próba H 0 : μ=μ 0 σ ismert,vagy n>30 Egymintás t-próba H 0 : μ=μ 0 σ ismeretlen χ 2 -próba a szórásnégyzetre H 0 : σ 2 =σ 2 0 Két normális eloszlású valószínűségi változó várható értékeire Két normális eloszlású valószínűségi változó szórásnégyzeteire Kétmintás z-próba H 0 : μ 1 =μ 2 σ 1, σ 2 ismert, vagy n 1,n 2 >30 Kétmintás t-próba H 0 : μ 1 =μ 2 σ 1,σ 2 ismeretlen, σ 1 = σ 2 Független minták eseténPáros minták esetén Páros t-próba H 0 : μ 1 -μ 2 =d 0 F-próba H 0 : σ 2 1 =σ 2 2 Több normális eloszlású valószínűségi változó várható értékeire Több normális eloszlású valószínűségi változó szórásnégyzeteire Illeszkedésvizsgálat χ 2 - próbával H 0 : F=F 0 Homogenitásvizsgálat χ 2 - próbával H 0 : F(ξ)=G(η) Függetlenségvizsgálat χ 2 - próbával H 0 : ξ és η független Variancia analízis H 0 : μ 1 =μ 2 =…=μ n σ 1 =σ 2 =…=σ n Cochran-féle C próba H 0 : σ 1 =σ 2 =…=σ r n 1 =n 2 =…=n r =n
Példa (*) - megoldás r = 3;s = 4; DF = (3-1)*(4-1) = 6 = 5% osztály2. osztály3. osztály4. osztály Csokoládé Vanília Eper f 1· f 2· f 3· f ·1 f ·2 f ·3 f ·4 F 11 = 148*50/289 = 25,606 F 21 = 44*50/289 = 7,612 … F 34 =97*29/289=9,734 χ 2 0,05 = 12,592 χ 2 sz ≤ χ 2 0,05 =>a nullhipotézis elfogadható: a fagylaltok iránti preferencia független a kisiskolás korától.
A Gazdaságstatisztika példatárban VII. Hipotézisvizsgálatok Nemparaméteres próbák 3. és 6. feladatok Homogenistásvizsgálat χ 2 -próbával Kapcsolódó feladatok 22