Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
Nemparaméteres próbák
Konzultáció október 30. Nemparaméteres próbák
2
A zh-n számonkérésre kerülő nemparaméteres próbák
Illeszkedésvizsgálat Kolmogorov-próbával Sorozatpróba Rangösszegpróba
3
Illeszkedésvizsgálat Kolmogorov próbával
Az olyan statisztikai próbát, amelynek alapján arról döntünk, hogy valamely valószínűségi változó F (tapasztalati) eloszlása lehet-e adott F0 (elméleti) eloszlásfüggvénnyel jellemzett eloszlás, illeszkedésvizsgálatnak nevezzük. Minták száma: egymintás Alkalmazás feltétele: kismintás, csak folytonos eloszlásokra, legalább 5 osztályba kell sorolni az adatokat Hipotézisek: H0: F = F0 H1: F ≠ F0 A próbafüggvény: Fn(t) a tapasztalati, F(t) az elméleti eloszlásfüggvény
4
Kolmogorov próba Menete:
Az osztályokba sorolt adatokra minden osztály felső határához kiszámítjuk a tapasztalati eloszlásfüggvényt (kumulált relatív gyakoriság). Minden osztály felső határához kiszámítjuk az elméleti eloszlásfüggvény értékét. Az Fn(t) - F(t) értéket kiszámítjuk minden osztályra. A maximális Fn(t) - F(t) értéket összevetjük az adott szignifikancia szinthez tartozó Dkrit értékkel A döntési elv: Ha , akkor a nullhipotézist elfogadjuk. Ha , akkor a nullhipotézist elvetjük.
5
Kolmogorov-próba
6
Példa Egy vasúti átjáróban 48 órán át vizsgálták az egy óra alatt áthaladó járművek számát, egységjárműben kifejezve (egy egységjármű=egy személyautó. Az ennél nagyobb járművek nagyobb, a kisebbek kisebb, törtszámú egységjárműnek számítanak, szükségképp a megfigyelés eredménye lehet nem egész szám). Leírható-e az egy óra alatt áthaladó járművek száma normális eloszlással, 10% szignifikancia szinten? A megfigyelések eredményeit az alábbi tábla közli: Megoldás: illeszkedésvizsgálat
7
Példa Nullhipotézisek felállítása:
H0: A megfigyelt vasúti átjáróban áthaladó egységjárművek száma N(80, 37,131) eloszlást követ. H1: A megfigyelt vasúti átjáróban áthaladó egységjárművek száma nem N(80, 37,131) eloszlást követ.
8
Eloszlásfüggvények értékei a felső határra:
9
Kumulált relatív gyakorisági értékek:
10
Elméleti eloszlás-függvény (Fi) Tapasztalati eloszlás-függvény (Fn) Di
10%-os szignifikancia szinten nincs okunk a nullhipotézist elutasítani, azaz a megfigyelt vasúti átjáróban az egy óra alatt áthaladt egységjárművek száma valóban leírható N(80, 37,131) eloszlással Egység-jármű Osztály-közép Gyako-riság Elméleti eloszlás-függvény (Fi) Tapasztalati eloszlás-függvény (Fn) Di 10 5 0,052616 0,104 30 3 0,140071 0,167 50 6 0,294599 0,2917 70 0,5 0,4167 90 12 0,705401 0,667 110 9 0,859929 0,854167 130 7 0,947384 1 0,051384 0,026929 0, 0,0833 0,038401 0,005762 0,
11
Sorozatpróba Egy alternatív ismérvre vonatkozó n elemű megfigyelés-sorozat egymást követő elemei véletlenszerű sorrendben követik-e egymást. Hipotézisek: H0: a sorrend véletlenszerű H1: a sorrend nem véletlenszerű, szabályszerűséget mutat (a megfigyelés-sorozat elemei vagy nem függetlenek, vagy nem azonos eloszlásúak) Minták száma: egymintás Alkalmazás feltétele: kismintás kétoldali próba A mintaelemek sorrendje egyértelműen értelmezhető legyen A mintaelemek mindegyike két osztály (az alternatív ismérv két lehetséges értéke) valamelyikébe legyen besorolható
12
Sorozatpróba A próba végrehajtása a mintában előforduló sorozatok számának vizsgálatán alapszik, jelölése: r A minta 1. osztályba tartozó elemeinek számát n1-gyel, a 2. osztályba tartozó elemeinek számát n2-vel jelöljük. n1+n2=n Egy sorozatnak a megszakítás nélküli – vagy csak 1-esekből, vagy csak 2-esekből álló – jelszakaszokat tekintjük, ez lesz az r értéke. A próbastatisztika értéke: r = a sorozatok száma a jelsorozatban A sorozatoknak a hossza is és adott n hosszúságú jelsorozatban a száma is valószínűségi változó.
13
Sorozatpróba ha n1 és n2 > 10, akkor r eloszlása aszimptotikusan normális μr várható értékkel és σr szórással: A próbafüggvény ilyenkor: A kritikus érték: ±zα/2 (standard normális eloszlás táblázatból)
14
Példa A hétalvó Dórinak két macskája van, Kókusz és Mancsi. Mivel Dóri minden reggel elalszik, az egyik macska az ágyra felugorva hangos dorombolással ébreszti fel Őt. Dóri szeptemberben minden nap feljegyezte, hogy melyik macskája ébresztette fel őt. 5%-os szignifikancia szinten véletlenszerűnek tekinthető-e, hogy szeptemberben melyik macska ébresztette fel Dórit? Dóri feljegyzése arról, hogy melyik macska ébresztette őt: K M M M K K M K K M M M M K K M K M M K K K M K K M M K K K Megoldás: sorozatpróba
15
Példa Ho: A sorozat véletlenszerű H1: A sorozat nem véletlenszerű A megfigyelések száma (a hónap napjainak száma): n=30. Azon napok száma, amikor Kókusz ébresztette fel Dórit: n1=16 Azon napok száma, amikor Mancsi ébresztette fel Dórit: n2=14 A sorozatok száma: 15 K | M M M | K K | M | K K |M M M M | K K | M | K | M M | K K K | M | K K | M M | K K K n1>10, n2>10 „r” aszimptotikusan normális eloszlást követ
16
Példa Az elfogadási tartomány meghatározása:
5% szignifikancia szinten elfogadjuk a nullhipotézist, vagyis véletlenszerűnek tekinthető annak sorrendje, hogy melyik nap melyik macska ébresztette Dórit.
17
Példa Tekinthető-e véletlenszerűnek az alábbi minta? (A medián alatti és feletti értékek véletlenszerűen váltakoznak.) Legyen a szignifikancia szint 5%! Megoldás: sorozatpróba A medián értéke: 7,2 A medián alá eső értékek száma: 15 A medián felé eső értékek száma: 15 14,2 9,6 4,7 9,1 11,3 2,6 16 10,5 12,4 7,9 3,6 2,4 8,4 2,5 3,5 25,6 1,5 5,5 4,5 22,1 23,2 2,8 24,8 4,8 10,3 4,1 9,4 4,2 4,6 6,5 1,5 4,6 10,3 2,4 4,7 10,5 2,5 4,8 11,3 2,6 5,5 12,4 2,8 6,5 14,2 3,5 7,9 16 3,6 8,4 22,1 4,1 9,1 23,2 4,2 9,4 24,8 4,5 9,6 25,6
18
Példa A mintavétel sorrendjében a medián alatti(A) és feletti(F) értékek sorozata: F,F,A,F,F,A,F,F,F,F,A,A,F,A,A,F,A,A,A,F,F,A,F,A,F,A,F,A,A,A H0: a sorozat véletlenszerű H1: a sorozat nem véletlenszerű A sorozatok száma: r = 18 nA = 15, nF = 15 Normális eloszlással közelítünk A nullhipotézist 95%-os megbízhatósági szint mellett elfogadjuk, a sorozat véletlenszerű. z/2 = ±1,96 14,2 9,6 4,7 9,1 11,3 2,6 16 10,5 12,4 7,9 3,6 2,4 8,4 2,5 3,5 25,6 1,5 5,5 4,5 22,1 23,2 2,8 24,8 4,8 10,3 4,1 9,4 4,2 4,6 6,5
19
Mann-Whitney féle U próba – (Wilcoxon-féle) rangösszegpróba
A kétmintás t-próba nemparaméteres megfelelője Két sokaság helyzetének a különbségét vizsgálja két független minta alapján Minták száma: kétmintás Egyoldali és kétoldali próbaként is Hipotézisek: H0: F(x) = G(x) F(x)=P(Y<x) az egyik, G(x)=P(X<x) pedig a másik sokaság eloszlásának a függvénye, ha az egyik sokaságban a vizsgált változót Y-nal, a másikban pedig X-szel jelöljük.
20
Mann-Whitney próba Lehetséges ellenhipotézisek:
Felírhatjuk valószínűségekre, magukra az eloszlásfüggvényekre, vagy közel azonos alakú eloszlásfüggvények esetén a várható értékekre (mediánokra) H1: P(X>Y)<1/2 H1: P(X>Y)≠1/2 H1: P(X>Y)>1/2 H1: G(x)>F(x) H1: G(x)≠F(x) H1: G(x)<F(x) H1: μx<μy H1: μx ≠ μy H1: μx > μy Mindig G(x)-nek az F(x)-hez képesti helyzetét vizsgáljuk. M() M() g(x) f(x) M() M() g(x) f(x)
21
Mann-Whitney próba Próbafüggvény: a mintaelemek rangösszegén alapul
Egyesítjük a két mintát, és az így kapott nX+nY elemű minta elemeit rangsorba állítjuk. Ezután minden mintaelemhez hozzárendeljük annak rangsorbeli számát, azaz a rangszámot. Meghatározzuk az Y sokaságból való minta elemeihez tartozó rangszámok összegét, és azt RY-nak jelöljük. Az UY és UX próbafüggvény meghatározása: (ha nY < nX) (ha nX < nY)
22
Mann-Whitney próba Kritikus értékek:
Ha a mintaelemszámok <10, akkor speciális táblázatokból Ha mindkét mintaelemszám ≥10, akkor az U mintavételi eloszlása közelítőleg normális eloszlású μU várható értékkel és σU szórással: Kapcsolt rangok esetén: A próbafüggvény: Kritikus érték(ek): adott α szignifikancia szinthez tartozó zα vagy zα/2 értékek
23
Példa Egy nagyváros közlekedésbiztonsági osztálya szeretné megvizsgálni, hogy változott-e egy bizonyos balesettípusban okozott kár nagysága az új közlekedési szabályok bevezetése után. Egy forgalmas kereszteződés baleseti statisztikái közül véletlenszerűen kiválasztottak 10-et az új szabály bevezetése előtti, és 10-et az utána következő időszakból. Az egy balesetben okozott kár nagyságát az alábbi táblázat mutatja. Vizsgáljuk meg, hogy van-e változás a balesetben okozott kár nagyságát tekintve a szabály bevezetését követően! Kár a szabály bevezetése előtt, [eFt] Kár a szabály bevezetése után, [eFt] 150 145 500 390 250 680 301 560 242 899 435 1250 100 290 402 963 716 180 200 550 Megoldás: Mann-Whitney-féle U próba (rangösszegpróba) Miért nem kétmintás várható értékekre irányuló próba? Mert nem ismert, hogy az alapsokaságok szórása normális-e. H0: a két minta eloszlása azonos H1: a bevezetést követően eltolódott az eloszlás az eredetitől valamelyik irányba (a középértékek nem egyenlők)
24
Példa z értéke az elfogadási tartományba esik, 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, nincs változás az egy balesetben okozott kár nagyságának eloszlásában az új szabály bevezetésével A rendezett minta rangszámai (csoport: E=a bevezetés előtti kár, U=bevezetés utáni kár) Érték 100 145 150 180 200 242 250 290 301 390 Csop. E U Rangsz. 1 2 3 4 5 6 7 8 9 10 402 435 500 550 560 680 716 899 963 1250 11 12 13 14 15 16 17 18 19 20 RE = 84 RU = 126 z/2 = 1,96, az elfogadási tartomány: -1,96 – 1,96
25
Példa Egy csavargyárban minden elkészült darabos tétel után egy maroknyi mintát vesznek. A vállalat azt kívánja megvizsgálni, hogy a két gépkezelő, Xavér és Yvonne által kivett minta nagysága -10%-os szignifikancia szinten- azonosnak tekinthető-e. A vizsgált időszakban Xavér darab csavart gyártott, így 10-szer vett egy maroknyi mintát, Yvonne pedig darab csavart készített, így 13-szor vett mintát. A kivett minta nagysága az alábbi táblázatban szerepel. Megoldás: rangösszegpróba, mert az alapsokaságok eloszlása nem ismert Xavér 50 64 81 36 48 54 45 88 59 56 Yvonne 40 47 84 44 41 38 58 66 42 51 67 46 69
26
Példa H0: F(x)=G(y), a két eloszlás azonos, a két gépkezelő által kivett maréknyi minta elemszáma azonosnak tekinthető. H1: F(x)≠G(y), a két eloszlás helyzete nem azonos, a két gépkezelő által kivett maréknyi minta elemszámában különbség van. Egyesítjük a mintát, nagyság szerint növekvő sorrendbe rendezzük, majd hozzárendeljük a rangszámokat (Rsz=rangszám, db. a kivett minta darabszáma, Gk a gépkezelő). RX= =133 RY= =143 Rsz. db Gk. 1 36 X 7 45 13 54 19 67 Y 2 38 8 46 14 56 20 69 3 40 9 47 15 58 21 81 4 41 10 48 16 59 22 84 5 42 11 50 17 64 23 88 6 44 12 51 18 66
27
Példa 10%-os szignifikancia szinten:
Mivel a számított érték eleme e tartománynak, 10%-os szignifikancia szinten a nullhipotézist elfogadjuk, a Xavér és az Yvonne által kivett maroknyi minta azonos darabszámúnak tekinthető
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.