Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Nemparaméteres próbák 2.

Hasonló előadás


Az előadások a következő témára: "Nemparaméteres próbák 2."— Előadás másolata:

1 Nemparaméteres próbák 2.
Adatelemzés

2 NEMPARAMÉTERES PRÓBÁK
Ha az eddig tanult paraméteres próbák elvégzésének feltételei nem teljesülnek, vagy eleve más volt a kérdésfeltevésünk, az ún. nemparaméteres próbák alkalmazása jöhet szóba. Más elnevezés: eloszlásfüggetlen (distribution-free) próbák. Fontos: ezek elvégzésének is vannak feltételei! Bizonyos speciális esetekben eleve a rangszámok a kiinduló adataink (ilyen eset lehet pl. összetartozó mintáknál), de gyakran származnak folytonos skálán mért adatokból a rangszámok. Statisztikai szoftverek bizonyos esetben csak rangszámokat fogadnak el bemenő adatként, tehát ha szükséges, külön kell elvégezni a folytonos skálán mért adatok rangszámokká transzformálását, máskor ezt a transzformációt beépítik azokba a menüpontokba amelyben elvégezhetők ezek a próbák.

3 NEMPARAMÉTERES PRÓBÁK
A nemparaméteres próbák közé sorolhatók az eloszlásokra tanult khi-négyzet-próbák, és sok más próba is. A továbbiakban az ún. rangpróbákról lesz szó, amelyeknél a próbastatisztika kiszámítása a mintaelemek rangszámaiból történik. A szóba jövő legfontosabb próbákat rendszerezhetjük a vizsgált minták száma és viszonya szempontjából: • egy minta vagy két összefüggő (párosítható) minta: Wilcoxon-féle előjeles rangpróba (Wilcoxon signed rank test) • két független minta: Mann–Whitney-féle U-próba (más néven: Wilcoxonféle rangösszeg-próba /Wilcoxon’s rank sum test/ vagy Wilcoxon–Mann–Whitney-próba) • kettőnél több független minta: Kruskal–Wallis-féle H-próba • kettőnél több összefüggő minta: Friedman-próba

4 Két független minta homogenitásának vizsgálata Mann-Whitney próbával
Egy X minta adatait két részre osztjuk egy Y csoport-képző változó segítségével. Megvizsgáljuk, hogy a két minta azonos eloszlásfüggvényhez tartozik-e. Pl. azonos eloszlást követ-e a GDP eloszlása a latin-amerikai és a kelet-európai országok esetében?

5 Két független minta homogenitásának vizsgálata Mann-Whitney próbával
Tekintsük az és mintákat! Legyen N=n+m. A két minta "összefésüléséből" képezzük a rendezett mintát! a két mintához tartozó rangszámösszegek

6 Két független minta homogenitásának vizsgálata Mann-Whitney próbával
Abban az esetben, ha n, m elég nagy, az RX eloszlása aszimptotikusan normális lesz és paraméterekkel, így standard normális eloszlású! Kis minták esetén a Mann-Whitney táblázatot használjuk.

7 Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
Ellenőrizni szeretnénk azt a nullhipotézist, hogy p független minta ugyanabból az eloszlásból származik-e, vagyis a mintáknak közös-e az eloszlásfüggvényük. Pl. A gépkocsik fogyasztása azonos eloszlást követ-e a gyártási hely szerint? A dolgozói fizetések azonosak-e a munkabeosztásokban? a gdp eloszlása azonos-e az egyes földrészeken?

8 Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
A p független mintát egy Y tördelő változó segítségével fogjuk előállítani. Az egyes mintákhoz az X változó azon esetei tartoznak majd, amelyiknél az Y azonos értéket vesz fel.

9 Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
Egy X változó eseteit egy Y tördelő változó segítségével p részre csoportosítunk. X folytonos változó Y diszkrét (kategória) változó, csoportképző változó a p rész-minta , ,…, N az adatmátrix összes esetszáma

10 Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
jelöli az X minta rendezett realizáltját r1 például azt adja meg, hogy az első minta első eleme a teljes rendezett mintában a hányadik helyen áll! az első minta rangszámai a második minta rangszámai a p-edik minta rangszámai a megfelelő rangszámösszegek

11 Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
Megmutatható, hogy a minták homogenitásának feltételezése mellett a rendstatisztika aszimptotikusan p -1 szabadságfokú 2-eloszlást követ.

12 Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával
Kis mintaelemszámok esetén a próbastatisztika pontos eloszlását kiszámolták és táblázatolták, nagy minták esetén az eloszlás a (k-1) szabadsági fokú khi-négyzet eloszlással közelíthető. A nullhipotézisnek a „nagy” H-értékek mondanak ellent (→ a kritikus tartomány az eloszlás jobb oldalán van!) Szignifikáns eredmény esetén a páronkénti összehasonlításokra is nemparaméteres módszerek jönnek szóba – a hibavalószínűség megfelelő korrigálásával. (Ezek a kiegészítések a statisztikai szoftverek nem mindegyikébe vannak beépítve! → De az SPSS egyik menüpontjában van erre is lehetőség!) Amennyiben az egyesített minta elemei között azonosak is vannak, akkor az ún. kapcsolt rangokkal kell számolni, és ilyenkor a H próbastatisztika kiszámolásánál egy korrekciós tényezőt kell alkalmazni.

13 Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával
Nullhipotézis: az adatmátrix X és Y változója azonos eloszlásfüggvényhez tartozik-e? az X,Y változópár adatsora a differenciák sora az előjelek sora az abszolút eltérések sora

14 Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával
az abszolút eltérések rendezett mintája az abszolút eltérések rangszámai a pozitív differenciák rangszám-összege a negatív differenciák rangszám-összege

15 Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával
Ezután a Wilcoxon-táblázatból adott  >0 elsőfajú hiba megválasztás után kiolvassuk a megfelelő kritikus értékeket, és a nullhipotézist akkor fogadjuk el, ha R+ a két kritikus érték közé esik. Pl.  =0,01 esetén n=6-hoz a 1<R+ <20 relációnak kell fennállnia.

16 Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával
Ha az n minta elemszám nagy (több mint 25), akkor megmutatható, hogy R+ közel normális eloszlású lesz paraméterekkel. Ilyenkor a nullhipotézis eldöntéséhez az reláció teljesülését kell ellenőrizni, ahol

17 Több összetartozó minta homogenitásának ellenőrzése Friedman próbával
Összesen p változó azonos eloszláshoz tartozását ellenőrizzük. az adatmátrix Pl. a különböző időpontokban vett súlyok azonos eloszlásúak-e.

18 Több összetartozó minta homogenitásának ellenőrzése Friedman próbával
Készítsük el az adatmátrix minden sorának rangszámait: azt a rangszámot jelenti, hogy hányadik legkisebb elem az adatmátrix első sorában.

19 Több összetartozó minta homogenitásának ellenőrzése Friedman próbával
az egyes oszlopokhoz tartozó rangszám-összegek. Ha a homogenitás feltétele (a nullhipotézis) igaz, rangstatisztika aszimptotikusan p-1 szabadságfokú 2-eloszlást követ.

20 Több összetartozó minta homogenitásának ellenőrzése Friedman próbával
Ha az n minta elemszám kicsi, akkor a Friedman-táblázatot használjuk. Abban az esetben, ha a homogenitást el kellett vetni, akkor az összes (i,j) párokra vonatkozó kétdimenziós mintákon egyenként ellenőrizzük a homogenitás fennállását, pl. Wilcoxon próbával.

21 Példa Mann-Whitney próbára
Azonos eloszlást követ-e a GDP eloszlása a latin-amerikai és a kelet-európai országok esetében? A world 95 adatmátrixban most X a gdp_cap, az Y csoportképző változó pedig a region.

22 Példa Mann-Whitney próbára

23 Példa Mann-Whitney próbára
Kelet-Európában magasabbak a GDP értékek! A próba nem fogadható el!

24 Példa Kruskal-Wallis próba alkalmazására
Ellenőrizzük, hogy a world 95 állományban a férfiak és a nők várható élettartamai azonos eloszlást követnek-e a különböző éghajlati viszonyok között! A lifeexpm, lifeexpf változók vannak az X szerepében, A climate változó lesz az Y tördelő változó. Az uralkodó klima szerint fogjuk csoportosítani a lifeexpm és lifeexpf értékeit!

25 Példa Kruskal-Wallis próba alkalmazására
X Y

26

27 Példa Kruskal-Wallis próba alkalmazására
Alacsonyak a szignifikancia szintek, azaz az életkorok másként alakulnak más klimatikus régiókban! Alacsonyak a szignifikancia szintek, azaz az életkorok másként alakulnak más klimatikus régiókban!

28 Példa a Wilcoxon próba alkalmazására
Ellenőrizzük, hogy a dietstudy állományban a kezdetisúly és végsúly azonos eloszlást követnek-e! A vizsgált összetar-tozó változók A vizsgált összetar-tozó változók

29 Példa a Wilcoxon próba alkalmazására

30 Példa a Wilcoxon próba alkalmazására
Természetesen a szignifikancia szint ennek megfelelően 0! Mindegyik differencia negatív volt, vagyis mind a 16 páciens fogyott!

31 Példa a Friedman próba alkalmazására
Ellenőrizzük, hogy a dietstudy állományban a különböző időpontokban mért testsúlyok azonos eloszlást követnek-e!

32 Példa a Friedman próba alkalmazására

33 Példa a Friedman próba alkalmazására
a súlyok rangszámai csökkenő trendet mutatnak A nullhipotézist elutasítjuk

34 Páronkénti Wilcoxon-próbák
Az összes párosítást beállítjuk!

35 Egyik párnál sem fogadható el a homogenitás!

36 A fontosabb nemparaméteres próbák áttekintő táblázata

37 A fontosabb nemparaméteres próbák áttekintő táblázata

38 A fontosabb nemparaméteres próbák áttekintő táblázata


Letölteni ppt "Nemparaméteres próbák 2."

Hasonló előadás


Google Hirdetések