Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak Nemparaméteres próbák I. 16. előadás
Hol járunk?
Nyitó gondolatok a témakörhöz Adottak feltevések, melyek igazak (elfogadhatók), vagy nem igazak (nem elfogadhatók) Ezeket a feltevéseket hipotéziseknek nevezzük Azokat a statisztikai eljárásokat, amelyek segítségével hipotézisek elfogadásáról döntünk hipotézisvizsgálatoknak nevezzük Ezeket másként statisztikai próbáknak nevezzük Terminológia “Szakácskönyv” Mikor, melyik próbát alkalmazzuk Olyan műveleteket végezzünk és olyan módszereket alkalmazzunk, amelyeket értünk A képletek… a képletgyűjtemény… és a táblázatok
A “szakácskönyv” (elöljáróban) Hipotézisvizsgálatok Nemparaméteres próbák Paraméteres próbák Többmintás próbák Illeszkedésvizsgálat χ2-próbával H0: F=F0 Több normális eloszlású valószínűségi változó várható értékeire Több normális eloszlású valószínűségi változó szórásnégyzeteire Homogenitásvizsgálat χ2-próbával H0: F(ξ)=G(η) Variancia analízis H0: μ1=μ2=…=μn Cochran-féle C próba H0: σ1=σ2=…=σn Függetlenségvizsgálat χ2-próbával H0: ξ és η független Egymintás próbák Kétmintás próbák Normális eloszlású valószínűségi változó várható értékére Normális eloszlású valószínűségi változó szórásnégyzetére Két normális eloszlású valószínűségi változó várható értékeire Két normális eloszlású valószínűségi változó szórásnégyzeteire Egymintás z-próba H0: μ=μ0 σ ismert,vagy n>30 χ2-próba a szórásnégyzetre H0: σ2=σ20 Független minták esetén Páros minták esetén F-próba H0: σ21 =σ22 Egymintás t-próba H0: μ=μ0 σ ismeretlen Kétmintás z-próba H0: μ1=μ2 σ1, σ2 ismert, vagy n1,n2>30 Páros t-próba H0: μ1-μ2=d0 Kétmintás t-próba H0: μ1=μ2 σ1 = σ2
Hipotézis Statisztikai hipotézisen a vizsgált sokaság(ok)ra (valószínűség-eloszlásra) vagy ennek paramétere(i)re vonatkozó valamilyen feltevést értünk.
Mintából következtetünk !!! Bevezetés A nullhipotézis a sokaság alapján Döntés a minta alapján „igaz” „hamis” „elfogadás” „elutasítás” Nincs hiba e Elsőfajú hiba Másodfajú hiba Minta-1 Mintából következtetünk !!! Minta-2 Hibát követhetünk el !!! Minta-3 Másodfajú hiba () Elsőfajú hiba ()
Hipotézisvizsgálatok fajtái Paraméteres próbák A vizsgált valószínűségi változó (vagy változók) eloszlása ismert, de ismeretlen paramétert vagy paramétereket tartalmaz, és a hipotézisvizsgálat ezekre a paraméterekre irányul. Ilyenek például a középérték(ek)re vonatkozó szórás(ok)ra vonatkozó egyéb paraméterekre vonatkozó próbák Nemparaméteres próbák A vizsgált valószínűségi változó (vagy változók) eloszlása ismeretlen, a hipotézis magára az eloszlásra vonatkozik. Ilyenek például az illeszkedésvizsgálat homogenitásvizsgálat függetlenségvizsgálat.
Statisztikai próbák általános menete (1) egy valószínűségi változó eloszlására, vagy az eloszlás paramétereire vonatkozó hipotézisek (H0, H1) felállítása H0 : nullhipotézis H1 : alternatív hipotézis (ellenhipotézis) Próba kiválasztása szignifikancia szint kiválasztása , jellemzően 0,1; 0,05; 0,01 értékű Mintavétel A valószínűségi változóra vonatkozó statisztikai minta felvétele. Próbastatisztika kiszámítása próbastatisztika kiszámítása, , ahol az összes n elemű statisztikai minta halmaza
Statisztikai próbák általános menete (2) kritikus tartomány (elutasítási tartomány) meghatározása úgy, hogy Azt jelenti, hogy ha H0 igaz, akkor a próbastatisztika legfeljebb valószínűséggel esik a kritikus tartományba A kritikus tartomány lehet egy- vagy kétoldali Kétoldali: a nullhipotézisben feltételezett helyzettől való eltérés ténye a fontos. Egyoldali: a nullhipotézisben feltételezett helyzettől való meghatározott irányú eltérés a fontos. az elfogadási tartomány Azt jelenti, hogy ha H0 igaz, akkor a próbastatisztika -nál nagyobb valószínűséggel esik az elfogadási tartományba
Statisztikai próbák általános menete (3) Egy- és kétoldali kritikus (elutasítási) tartományok
Statisztikai próbák általános menete (4) Döntés a nullhipotézisről A próbastatisztika kritikus tartományba történő esése alapján. (A jegyzet ezt a megközelítést követi.) H0 –át elfogadjuk, ha H0 –át elutasítjuk, ha Az úgynevezett p érték és a szignifikancia szint összehasonlítása alapján. (Statisztikai programcsomagok.) A p érték az a legnagyobb szignifikancia szint, amely mellet a nullhipotézist még elfogadjuk.
χ2 -próbák alkalmazásai Teljes eseményrendszer valószínűségeinek tesztelése Illeszkedésvizsgálatok Tiszta Becsléses Homogenitásvizsgálat Függetlenségvizsgálat Mi ezekkel foglalkozunk.
Döntési elv χ2 -próbák esetén f(2) P(2szám< 2krit()|H0 igaz) = 1- = DF =1- 2 szám 2 szám 2 2 krit
Illeszkedésvizsgálat χ2 -próbával Az illeszkedésvizsgálat olyan statisztikai próba, amelynek során arról döntünk, hogy egy valószínűségi változó F eloszlásfüggvénye adott F0 eloszlásfüggvénnyel egyezik meg. H0: F=F0 Fajtái Tiszta illeszkedésvizsgálat A nullhipotézis az eloszlás paramétereinek ismeretét is feltételezi. Például: egy gyártósoron elkészített tengelyek hossza 200mm várható értékű, 13mm szórású normális eloszlású valószínűségi változónak tekinthető. Becsléses illeszkedésvizsgálat A nullhipotézis csak az eloszlás jellegét tételezi fel. Például: egy gyártósoron elkészített tengelyek hossza normális eloszlású valószínűségi változónak tekinthető. Ilyenkor az eloszlás paramétereit a mintából becsüljük.
Példa (*) Egy dobókockáról szeretnénk megtudni, hogy szabályos-e, azaz minden szám előfordulásának valószínűsége azonos-e. Ennek eldöntése céljából 600 dobást hajtottunk végre a kockával. A dobások eredményeit az alábbi táblázat összegzi.
Példa (*) - megoldás Jelölje a valószínűségi változó a kockával dobott számértéket. Ha a kocka szabályos, akkor minden dobható érték bekövetkezési valószínűsége azonos, 1/6-od értékű. Ekkor diszkért egyenletes eloszlású valószínűségi változó. A feladatot tehát formalizálhatjuk a következő null- és alternatív hipotézis felállításával: H0: diszkrét egyenletes eloszlású H1: nem diszkrét egyenletes eloszlású Ebben a felírásban a feladat egy illeszkedésvizsgálat végrehajtása A diszkrét egyenletes eloszlásnak nincs paramétere, ezért tiszta illeszkedésvizsgálatot hajtunk végre
Példa (*) - megoldás DF = r-l-l Szabadsági fok fi = tapasztalati gyakoriság Fi = elméleti gyakoriság (most minden kategóriában 100) Szabadsági fok r = kategóriák, osztályok száma (most 6) l = becsült paraméterek száma (most 0)
Példa (*) - megoldás összesen 600 dobás
H0-t elfogadjuk, azaz a kocka szabályos. Példa (*) - megoldás 2 szám= 2,02 DF = 6 - 1 = 5 2 krit= 11,1 = 0,05 2 szám << 2 krit H0-t elfogadjuk, azaz a kocka szabályos.
Példa (*) A Tiszán adott időszakban levonuló árhullámok számát vizsgálva az elmúlt 68 év során, az alábbi eredményeket kapták: 30 év volt, amikor nem volt árhullám, 25 olyan év volt , amikor 1 árhullám vonult le az adott időszakban, 9 év volt amikor 2 és 4 olyan év volt, amikor 3, vagy annál több árhullám következett be. Feltehető-e, hogy adott időszakban a folyón levonuló árhullámok száma Poisson-eloszlással modellezhető?
Hipotézisvizsgálatok Nemparaméteres próbák Paraméteres próbák Többmintás próbák Illeszkedésvizsgálat χ2-próbával H0: F=F0 Több normális eloszlású valószínűségi változó várható értékeire Több normális eloszlású valószínűségi változó szórásnégyzeteire Homogenitásvizsgálat χ2-próbával H0: F(ξ)=G(η) Variancia analízis H0: μ1=μ2=…=μn Cochran-féle C próba H0: σ1=σ2=…=σn Függetlenségvizsgálat χ2-próbával H0: ξ és η független Egymintás próbák Kétmintás próbák Normális eloszlású valószínűségi változó várható értékére Normális eloszlású valószínűségi változó szórásnégyzetére Két normális eloszlású valószínűségi változó várható értékeire Két normális eloszlású valószínűségi változó szórásnégyzeteire Egymintás z-próba H0: μ=μ0 σ ismert,vagy n>30 χ2-próba a szórásnégyzetre H0: σ2=σ20 Független minták esetén Páros minták esetén F-próba H0: σ21 =σ22 Egymintás t-próba H0: μ=μ0 σ ismeretlen Kétmintás z-próba H0: μ1=μ2 σ1, σ2 ismert, vagy n1,n2>30 Páros t-próba H0: μ1-μ2=d0 Kétmintás t-próba H0: μ1=μ2 σ1 = σ2
Példa (*) - megoldás Jelölje a valószínűségi változó a Tiszán adott időszakban levonuló árhullámok számát. A feladatot formalizálhatjuk a következő null- és alternatív hipotézis felállításával: H0: Poisson-eloszlású H1: nem Poisson-eloszlású Mivel a feladat nem azt kérdezi, hogy egy konkért Poiosson-eloszlást követ-e, hanem csak annyit, hogy Poisson-eloszlást követ-e, ezért becsléses illeszkedésvizsgálatot hajtunk végre
2 krit= 5,99 Példa (*) - megoldás H0: Poisson-eloszlás = ? 0,8 = 0.05 2 krit= 5,99 DF = r-l-l = 4-1-1 = 2
0,8 Példa (*) - megoldás k fi Fi pk 0 30 1 25 2 9 3- 4 0,4493 0 30 1 25 2 9 3- 4 0,4493 30,55 0,3595 0,1438 0,0474 24,45 9,78 3,22 0,8 0,273 2 krit= 5,99 2 sz = 0,273 H0-t elfogadjuk, az árhullámok száma 0,8 paraméterű Poisson-eloszlással modellezhető.
Illeszkedésvizsgálat χ2 -próbával Kapcsolódó feladatok A Gazdaságstatisztika példatárban VII. Hipotézisvizsgálatok Nemparaméteres próbák 1., 2., 5., feladatok Paraméteres és nemparaméteres feladatok 1.a), 2.a) feladatok