Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Gazdaságstatisztika Hipotézisvizsgálatok Alapfogalamak Nemparaméteres próbák I. 16. előadás.

Hasonló előadás


Az előadások a következő témára: "Gazdaságstatisztika Hipotézisvizsgálatok Alapfogalamak Nemparaméteres próbák I. 16. előadás."— Előadás másolata:

1 Gazdaságstatisztika Hipotézisvizsgálatok Alapfogalamak Nemparaméteres próbák I. 16. előadás

2 Hol járunk? 2

3 Nyitó gondolatok a témakörhöz Adottak feltevések, melyek igazak (elfogadhatók), vagy nem igazak (nem elfogadhatók) Ezeket a feltevéseket hipotéziseknek nevezzük Azokat a statisztikai eljárásokat, amelyek segítségével hipotézisek elfogadásáról döntünk hipotézisvizsgálatoknak nevezzük Ezeket másként statisztikai próbáknak nevezzük Terminológia “Szakácskönyv”  Mikor, melyik próbát alkalmazzuk  Olyan műveleteket végezzünk és olyan módszereket alkalmazzunk, amelyeket értünk  A képletek… a képletgyűjtemény… és a táblázatok 3

4 A “szakácskönyv” (elöljáróban) 4 Hipotézisvizsgálatok Nemparaméteres próbákParaméteres próbák Egymintás próbákKétmintás próbák Többmintás próbák Normális eloszlású valószínűségi változó várható értékére Normális eloszlású valószínűségi változó szórásnégyzetére Egymintás z-próba H 0 : μ=μ 0 σ ismert,vagy n>30 Egymintás t-próba H 0 : μ=μ 0 σ ismeretlen χ 2 -próba a szórásnégyzetre H 0 : σ 2 =σ 2 0 Két normális eloszlású valószínűségi változó várható értékeire Két normális eloszlású valószínűségi változó szórásnégyzeteire Kétmintás z-próba H 0 : μ 1 =μ 2 σ 1, σ 2 ismert, vagy n 1,n 2 >30 Kétmintás t-próba H 0 : μ 1 =μ 2 σ 1 = σ 2 Független minták eseténPáros minták esetén Páros t-próba H 0 : μ 1 -μ 2 =d 0 F-próba H 0 : σ 2 1 =σ 2 2 Több normális eloszlású valószínűségi változó várható értékeire Több normális eloszlású valószínűségi változó szórásnégyzeteire Illeszkedésvizsgálat χ 2 - próbával H 0 : F=F 0 Homogenitásvizsgálat χ 2 - próbával H 0 : F(ξ)=G(η) Függetlenségvizsgálat χ 2 - próbával H 0 : ξ és η független Variancia analízis H 0 : μ 1 =μ 2 =…=μ n Cochran-féle C próba H 0 : σ 1 =σ 2 =…=σ n

5 Hipotézis Statisztikai hipotézisen a vizsgált sokaság(ok)ra (valószínűség-eloszlásra) vagy ennek paramétere(i)re vonatkozó valamilyen feltevést értünk. 5

6 Bevezetés Mintából következtetünk !!! Elsőfajú hiba (  ) Másodfajú hiba (  ) Minta-2 Minta-1 Minta-3 Hibát követhetünk el !!! A nullhipotézis a sokaság alapján Döntés a minta alapján „igaz” „hamis” „elfogadás” „ elutasítás ” Nincs hiba  e Elsőfajú hiba  Másodfajú hiba  6

7 Hipotézisvizsgálatok fajtái Paraméteres próbák  A vizsgált valószínűségi változó (vagy változók) eloszlása ismert, de ismeretlen paramétert vagy paramétereket tartalmaz, és a hipotézisvizsgálat ezekre a paraméterekre irányul.  Ilyenek például a középérték(ek)re vonatkozó szórás(ok)ra vonatkozó egyéb paraméterekre vonatkozó próbák Nemparaméteres próbák  A vizsgált valószínűségi változó (vagy változók) eloszlása ismeretlen, a hipotézis magára az eloszlásra vonatkozik.  Ilyenek például az illeszkedésvizsgálat homogenitásvizsgálat függetlenségvizsgálat. 7

8 Statisztikai próbák általános menete (1) egy valószínűségi változó eloszlására, vagy az eloszlás paramétereire vonatkozó hipotézisek (H 0, H 1 ) felállítása  H 0 : nullhipotézis  H 1 : alternatív hipotézis (ellenhipotézis) Próba kiválasztása szignifikancia szint kiválasztása , jellemzően 0,1; 0,05; 0,01 értékű Mintavétel  A valószínűségi változóra vonatkozó statisztikai minta felvétele. Próbastatisztika kiszámítása  próbastatisztika kiszámítása,, ahol az összes n elemű statisztikai minta halmaza  8

9 Statisztikai próbák általános menete (2) kritikus tartomány (elutasítási tartomány) meghatározása úgy, hogy   Azt jelenti, hogy ha H 0 igaz, akkor a próbastatisztika legfeljebb valószínűséggel esik a kritikus tartományba  A kritikus tartomány lehet egy- vagy kétoldali Kétoldali: a nullhipotézisben feltételezett helyzettől való eltérés ténye a fontos. Egyoldali: a nullhipotézisben feltételezett helyzettől való meghatározott irányú eltérés a fontos. az elfogadási tartomány   Azt jelenti, hogy ha H 0 igaz, akkor a próbastatisztika -nál nagyobb valószínűséggel esik az elfogadási tartományba  9

10 Statisztikai próbák általános menete (3) Egy- és kétoldali kritikus (elutasítási) tartományok  10

11 Statisztikai próbák általános menete (4) Döntés a nullhipotézisről  A próbastatisztika kritikus tartományba történő esése alapján. (A jegyzet ezt a megközelítést követi.) H 0 –át elfogadjuk, ha H 0 –át elutasítjuk, ha  Az úgynevezett p érték és a szignifikancia szint összehasonlítása alapján. (Statisztikai programcsomagok.) A p érték az a legnagyobb szignifikancia szint, amely mellet a nullhipotézist még elfogadjuk.  11

12 Teljes eseményrendszer valószínűségeinek tesztelése Illeszkedésvizsgálatok  Tiszta  Becsléses Homogenitásvizsgálat Függetlenségvizsgálat χ 2 -próbák alkalmazásai Mi ezekkel foglalkozunk. 12

13 Döntési elv χ 2 -próbák esetén f(  2 ) 22 DF   2 krit  2 szám   =1-  P(  2 szám <  2 krit (  )|H 0 igaz) = 1-  =  13

14 Illeszkedésvizsgálat χ 2 -próbával  Az illeszkedésvizsgálat olyan statisztikai próba, amelynek során arról döntünk, hogy egy valószínűségi változó F eloszlásfüggvénye adott F 0 eloszlásfüggvénnyel egyezik meg. H 0 : F=F 0 Fajtái  Tiszta illeszkedésvizsgálat A nullhipotézis az eloszlás paramétereinek ismeretét is feltételezi. Például: egy gyártósoron elkészített tengelyek hossza 200mm várható értékű, 13mm szórású normális eloszlású valószínűségi változónak tekinthető.  Becsléses illeszkedésvizsgálat A nullhipotézis csak az eloszlás jellegét tételezi fel. Például: egy gyártósoron elkészített tengelyek hossza normális eloszlású valószínűségi változónak tekinthető. Ilyenkor az eloszlás paramétereit a mintából becsüljük. 14

15  15 Egy dobókockáról szeretnénk megtudni, hogy szabályos-e, azaz minden szám előfordulásának valószínűsége azonos-e. Ennek eldöntése céljából 600 dobást hajtottunk végre a kockával. A dobások eredményeit az alábbi táblázat összegzi. Példa (*)

16  16 Jelölje a valószínűségi változó a kockával dobott számértéket. Ha a kocka szabályos, akkor minden dobható érték bekövetkezési valószínűsége azonos, 1/6-od értékű. Ekkor diszkért egyenletes eloszlású valószínűségi változó. A feladatot tehát formalizálhatjuk a következő null- és alternatív hipotézis felállításával:  H 0 : diszkrét egyenletes eloszlású  H 1 : nem diszkrét egyenletes eloszlású Ebben a felírásban a feladat egy illeszkedésvizsgálat végrehajtása A diszkrét egyenletes eloszlásnak nincs paramétere, ezért tiszta illeszkedésvizsgálatot hajtunk végre Példa (*) - megoldás

17 DF = r- -l f i = tapasztalati gyakoriság F i = elméleti gyakoriság (most minden kategóriában 100) r = kategóriák, osztályok száma (most 6) Szabadsági fok  l = becsült paraméterek száma (most 0) 17 Példa (*) - megoldás

18 összesen 600 dobás  18 Példa (*) - megoldás

19 DF = = 5  = 0,05  2 krit = 11,1  2 szám = 2,02  2 szám <<  2 krit H 0 -t elfogadjuk, azaz a kocka szabályos.  19 Példa (*) - megoldás

20 A Tiszán adott időszakban levonuló árhullámok számát vizsgálva az elmúlt 68 év során, az alábbi eredményeket kapták: 30 év volt, amikor nem volt árhullám, 25 olyan év volt, amikor 1 árhullám vonult le az adott időszakban, 9 év volt amikor 2 és 4 olyan év volt, amikor 3, vagy annál több árhullám következett be. Feltehető-e, hogy adott időszakban a folyón levonuló árhullámok száma Poisson-eloszlással modellezhető?  20 Példa (*)

21 21 Hipotézisvizsgálatok Nemparaméteres próbákParaméteres próbák Egymintás próbákKétmintás próbák Többmintás próbák Normális eloszlású valószínűségi változó várható értékére Normális eloszlású valószínűségi változó szórásnégyzetére Egymintás z-próba H 0 : μ=μ 0 σ ismert,vagy n>30 Egymintás t-próba H 0 : μ=μ 0 σ ismeretlen χ 2 -próba a szórásnégyzetre H 0 : σ 2 =σ 2 0 Két normális eloszlású valószínűségi változó várható értékeire Két normális eloszlású valószínűségi változó szórásnégyzeteire Kétmintás z-próba H 0 : μ 1 =μ 2 σ 1, σ 2 ismert, vagy n 1,n 2 >30 Kétmintás t-próba H 0 : μ 1 =μ 2 σ 1 = σ 2 Független minták eseténPáros minták esetén Páros t-próba H 0 : μ 1 -μ 2 =d 0 F-próba H 0 : σ 2 1 =σ 2 2 Több normális eloszlású valószínűségi változó várható értékeire Több normális eloszlású valószínűségi változó szórásnégyzeteire Illeszkedésvizsgálat χ2- próbával H 0 : F=F 0 Homogenitásvizsgálat χ 2 - próbával H 0 : F(ξ)=G(η) Függetlenségvizsgálat χ 2 - próbával H 0 : ξ és η független Variancia analízis H 0 : μ 1 =μ 2 =…=μ n Cochran-féle C próba H 0 : σ 1 =σ 2 =…=σ n

22  22 Jelölje a valószínűségi változó a Tiszán adott időszakban levonuló árhullámok számát. A feladatot formalizálhatjuk a következő null- és alternatív hipotézis felállításával:  H 0 : Poisson-eloszlású  H 1 : nem Poisson-eloszlású Mivel a feladat nem azt kérdezi, hogy egy konkért Poiosson-eloszlást követ-e, hanem csak annyit, hogy Poisson-eloszlást követ-e, ezért becsléses illeszkedésvizsgálatot hajtunk végre Példa (*) - megoldás

23 H 0 : Poisson-eloszlás = ?  0,8  DF = r- l -l = = 2  = 0.05  2 krit = 5,99 23 Példa (*) - megoldás

24  2 krit = 5,99  2 sz = 0,273  2 krit = 5,99  2 sz = 0,273 kf i F i pkpk  0,8 0,4493 0,3595 0,1438 0, ,55 24,45 9,78 3,22  H 0 -t elfogadjuk, az árhullámok száma  0,8 paraméterű Poisson-eloszlással modellezhető. 24 0,273 Példa (*) - megoldás

25 A Gazdaságstatisztika példatárban  VII. Hipotézisvizsgálatok Nemparaméteres próbák  1., 2., 5., feladatok Paraméteres és nemparaméteres feladatok  1.a), 2.a) feladatok Illeszkedésvizsgálat χ 2 -próbával Kapcsolódó feladatok 25


Letölteni ppt "Gazdaságstatisztika Hipotézisvizsgálatok Alapfogalamak Nemparaméteres próbák I. 16. előadás."

Hasonló előadás


Google Hirdetések