Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
Nemparaméteres próbák 2.
Adatelemzés
2
NEMPARAMÉTERES PRÓBÁK
Ha az eddig tanult paraméteres próbák elvégzésének feltételei nem teljesülnek, vagy eleve más volt a kérdésfeltevésünk, az ún. nemparaméteres próbák alkalmazása jöhet szóba. Más elnevezés: eloszlásfüggetlen (distribution-free) próbák. Fontos: ezek elvégzésének is vannak feltételei! Bizonyos speciális esetekben eleve a rangszámok a kiinduló adataink (ilyen eset lehet pl. összetartozó mintáknál), de gyakran származnak folytonos skálán mért adatokból a rangszámok. Statisztikai szoftverek bizonyos esetben csak rangszámokat fogadnak el bemenő adatként, tehát ha szükséges, külön kell elvégezni a folytonos skálán mért adatok rangszámokká transzformálását, máskor ezt a transzformációt beépítik azokba a menüpontokba amelyben elvégezhetők ezek a próbák.
3
NEMPARAMÉTERES PRÓBÁK
A nemparaméteres próbák közé sorolhatók az eloszlásokra tanult khi-négyzet-próbák, és sok más próba is. A továbbiakban az ún. rangpróbákról lesz szó, amelyeknél a próbastatisztika kiszámítása a mintaelemek rangszámaiból történik. A szóba jövő legfontosabb próbákat rendszerezhetjük a vizsgált minták száma és viszonya szempontjából: • egy minta vagy két összefüggő (párosítható) minta: Wilcoxon-féle előjeles rangpróba (Wilcoxon signed rank test) • két független minta: Mann–Whitney-féle U-próba (más néven: Wilcoxonféle rangösszeg-próba /Wilcoxon’s rank sum test/ vagy Wilcoxon–Mann–Whitney-próba) • kettőnél több független minta: Kruskal–Wallis-féle H-próba • kettőnél több összefüggő minta: Friedman-próba
4
Két független minta homogenitásának vizsgálata Mann-Whitney próbával
Egy X minta adatait két részre osztjuk egy Y csoport-képző változó segítségével. Megvizsgáljuk, hogy a két minta azonos eloszlásfüggvényhez tartozik-e. Pl. azonos eloszlást követ-e a GDP eloszlása a latin-amerikai és a kelet-európai országok esetében?
5
Két független minta homogenitásának vizsgálata Mann-Whitney próbával
Tekintsük az és mintákat! Legyen N=n+m. A két minta "összefésüléséből" képezzük a rendezett mintát! a két mintához tartozó rangszámösszegek
6
Két független minta homogenitásának vizsgálata Mann-Whitney próbával
Abban az esetben, ha n, m elég nagy, az RX eloszlása aszimptotikusan normális lesz és paraméterekkel, így standard normális eloszlású! Kis minták esetén a Mann-Whitney táblázatot használjuk.
7
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
Ellenőrizni szeretnénk azt a nullhipotézist, hogy p független minta ugyanabból az eloszlásból származik-e, vagyis a mintáknak közös-e az eloszlásfüggvényük. Pl. A gépkocsik fogyasztása azonos eloszlást követ-e a gyártási hely szerint? A dolgozói fizetések azonosak-e a munkabeosztásokban? a gdp eloszlása azonos-e az egyes földrészeken?
8
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
A p független mintát egy Y tördelő változó segítségével fogjuk előállítani. Az egyes mintákhoz az X változó azon esetei tartoznak majd, amelyiknél az Y azonos értéket vesz fel.
9
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
Egy X változó eseteit egy Y tördelő változó segítségével p részre csoportosítunk. X folytonos változó Y diszkrét (kategória) változó, csoportképző változó a p rész-minta , ,…, N az adatmátrix összes esetszáma
10
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
jelöli az X minta rendezett realizáltját r1 például azt adja meg, hogy az első minta első eleme a teljes rendezett mintában a hányadik helyen áll! az első minta rangszámai a második minta rangszámai a p-edik minta rangszámai a megfelelő rangszámösszegek
11
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
Megmutatható, hogy a minták homogenitásának feltételezése mellett a rendstatisztika aszimptotikusan p -1 szabadságfokú 2-eloszlást követ.
12
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
Kis mintaelemszámok esetén a próbastatisztika pontos eloszlását kiszámolták és táblázatolták, nagy minták esetén az eloszlás a (k-1) szabadsági fokú khi-négyzet eloszlással közelíthető. A nullhipotézisnek a „nagy” H-értékek mondanak ellent (→ a kritikus tartomány az eloszlás jobb oldalán van!) Szignifikáns eredmény esetén a páronkénti összehasonlításokra is nemparaméteres módszerek jönnek szóba – a hibavalószínűség megfelelő korrigálásával. (Ezek a kiegészítések a statisztikai szoftverek nem mindegyikébe vannak beépítve! → De az SPSS egyik menüpontjában van erre is lehetőség!) Amennyiben az egyesített minta elemei között azonosak is vannak, akkor az ún. kapcsolt rangokkal kell számolni, és ilyenkor a H próbastatisztika kiszámolásánál egy korrekciós tényezőt kell alkalmazni.
13
Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával
Nullhipotézis: az adatmátrix X és Y változója azonos eloszlásfüggvényhez tartozik-e? az X,Y változópár adatsora a differenciák sora az előjelek sora az abszolút eltérések sora
14
Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával
az abszolút eltérések rendezett mintája az abszolút eltérések rangszámai a pozitív differenciák rangszám-összege a negatív differenciák rangszám-összege
15
Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával
Ezután a Wilcoxon-táblázatból adott >0 elsőfajú hiba megválasztás után kiolvassuk a megfelelő kritikus értékeket, és a nullhipotézist akkor fogadjuk el, ha R+ a két kritikus érték közé esik. Pl. =0,01 esetén n=6-hoz a 1<R+ <20 relációnak kell fennállnia.
16
Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával
Ha az n minta elemszám nagy (több mint 25), akkor megmutatható, hogy R+ közel normális eloszlású lesz paraméterekkel. Ilyenkor a nullhipotézis eldöntéséhez az reláció teljesülését kell ellenőrizni, ahol
17
Több összetartozó minta homogenitásának ellenőrzése Friedman próbával
Összesen p változó azonos eloszláshoz tartozását ellenőrizzük. az adatmátrix Pl. a különböző időpontokban vett súlyok azonos eloszlásúak-e.
18
Több összetartozó minta homogenitásának ellenőrzése Friedman próbával
Készítsük el az adatmátrix minden sorának rangszámait: azt a rangszámot jelenti, hogy hányadik legkisebb elem az adatmátrix első sorában.
19
Több összetartozó minta homogenitásának ellenőrzése Friedman próbával
az egyes oszlopokhoz tartozó rangszám-összegek. Ha a homogenitás feltétele (a nullhipotézis) igaz, rangstatisztika aszimptotikusan p-1 szabadságfokú 2-eloszlást követ.
20
Több összetartozó minta homogenitásának ellenőrzése Friedman próbával
Ha az n minta elemszám kicsi, akkor a Friedman-táblázatot használjuk. Abban az esetben, ha a homogenitást el kellett vetni, akkor az összes (i,j) párokra vonatkozó kétdimenziós mintákon egyenként ellenőrizzük a homogenitás fennállását, pl. Wilcoxon próbával.
21
Példa Mann-Whitney próbára
Azonos eloszlást követ-e a GDP eloszlása a latin-amerikai és a kelet-európai országok esetében? A world 95 adatmátrixban most X a gdp_cap, az Y csoportképző változó pedig a region.
22
Példa Mann-Whitney próbára
23
Példa Mann-Whitney próbára
Kelet-Európában magasabbak a GDP értékek! A próba nem fogadható el!
24
Példa Kruskal-Wallis próba alkalmazására
Ellenőrizzük, hogy a world 95 állományban a férfiak és a nők várható élettartamai azonos eloszlást követnek-e a különböző éghajlati viszonyok között! A lifeexpm, lifeexpf változók vannak az X szerepében, A climate változó lesz az Y tördelő változó. Az uralkodó klima szerint fogjuk csoportosítani a lifeexpm és lifeexpf értékeit!
25
Példa Kruskal-Wallis próba alkalmazására
X Y
27
Példa Kruskal-Wallis próba alkalmazására
Alacsonyak a szignifikancia szintek, azaz az életkorok másként alakulnak más klimatikus régiókban! Alacsonyak a szignifikancia szintek, azaz az életkorok másként alakulnak más klimatikus régiókban!
28
Példa a Wilcoxon próba alkalmazására
Ellenőrizzük, hogy a dietstudy állományban a kezdetisúly és végsúly azonos eloszlást követnek-e! A vizsgált összetar-tozó változók A vizsgált összetar-tozó változók
29
Példa a Wilcoxon próba alkalmazására
30
Példa a Wilcoxon próba alkalmazására
Természetesen a szignifikancia szint ennek megfelelően 0! Mindegyik differencia negatív volt, vagyis mind a 16 páciens fogyott!
31
Példa a Friedman próba alkalmazására
Ellenőrizzük, hogy a dietstudy állományban a különböző időpontokban mért testsúlyok azonos eloszlást követnek-e!
32
Példa a Friedman próba alkalmazására
33
Példa a Friedman próba alkalmazására
a súlyok rangszámai csökkenő trendet mutatnak A nullhipotézist elutasítjuk
34
Páronkénti Wilcoxon-próbák
Az összes párosítást beállítjuk!
35
Egyik párnál sem fogadható el a homogenitás!
36
A fontosabb nemparaméteres próbák áttekintő táblázata
37
A fontosabb nemparaméteres próbák áttekintő táblázata
38
A fontosabb nemparaméteres próbák áttekintő táblázata
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.