Nemparaméteres próbák 2. Adatelemzés
NEMPARAMÉTERES PRÓBÁK Ha az eddig tanult paraméteres próbák elvégzésének feltételei nem teljesülnek, vagy eleve más volt a kérdésfeltevésünk, az ún. nemparaméteres próbák alkalmazása jöhet szóba. Más elnevezés: eloszlásfüggetlen (distribution-free) próbák. Fontos: ezek elvégzésének is vannak feltételei! Bizonyos speciális esetekben eleve a rangszámok a kiinduló adataink (ilyen eset lehet pl. összetartozó mintáknál), de gyakran származnak folytonos skálán mért adatokból a rangszámok. Statisztikai szoftverek bizonyos esetben csak rangszámokat fogadnak el bemenő adatként, tehát ha szükséges, külön kell elvégezni a folytonos skálán mért adatok rangszámokká transzformálását, máskor ezt a transzformációt beépítik azokba a menüpontokba amelyben elvégezhetők ezek a próbák.
NEMPARAMÉTERES PRÓBÁK A nemparaméteres próbák közé sorolhatók az eloszlásokra tanult khi-négyzet-próbák, és sok más próba is. A továbbiakban az ún. rangpróbákról lesz szó, amelyeknél a próbastatisztika kiszámítása a mintaelemek rangszámaiból történik. A szóba jövő legfontosabb próbákat rendszerezhetjük a vizsgált minták száma és viszonya szempontjából: • egy minta vagy két összefüggő (párosítható) minta: Wilcoxon-féle előjeles rangpróba (Wilcoxon signed rank test) • két független minta: Mann–Whitney-féle U-próba (más néven: Wilcoxonféle rangösszeg-próba /Wilcoxon’s rank sum test/ vagy Wilcoxon–Mann–Whitney-próba) • kettőnél több független minta: Kruskal–Wallis-féle H-próba • kettőnél több összefüggő minta: Friedman-próba
Két független minta homogenitásának vizsgálata Mann-Whitney próbával Egy X minta adatait két részre osztjuk egy Y csoport-képző változó segítségével. Megvizsgáljuk, hogy a két minta azonos eloszlásfüggvényhez tartozik-e. Pl. azonos eloszlást követ-e a GDP eloszlása a latin-amerikai és a kelet-európai országok esetében?
Két független minta homogenitásának vizsgálata Mann-Whitney próbával Tekintsük az és mintákat! Legyen N=n+m. A két minta "összefésüléséből" képezzük a rendezett mintát! a két mintához tartozó rangszámösszegek
Két független minta homogenitásának vizsgálata Mann-Whitney próbával Abban az esetben, ha n, m elég nagy, az RX eloszlása aszimptotikusan normális lesz és paraméterekkel, így standard normális eloszlású! Kis minták esetén a Mann-Whitney táblázatot használjuk.
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával Ellenőrizni szeretnénk azt a nullhipotézist, hogy p független minta ugyanabból az eloszlásból származik-e, vagyis a mintáknak közös-e az eloszlásfüggvényük. Pl. A gépkocsik fogyasztása azonos eloszlást követ-e a gyártási hely szerint? A dolgozói fizetések azonosak-e a munkabeosztásokban? a gdp eloszlása azonos-e az egyes földrészeken?
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával A p független mintát egy Y tördelő változó segítségével fogjuk előállítani. Az egyes mintákhoz az X változó azon esetei tartoznak majd, amelyiknél az Y azonos értéket vesz fel.
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával Egy X változó eseteit egy Y tördelő változó segítségével p részre csoportosítunk. X folytonos változó Y diszkrét (kategória) változó, csoportképző változó a p rész-minta , ,…, N az adatmátrix összes esetszáma
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával jelöli az X minta rendezett realizáltját r1 például azt adja meg, hogy az első minta első eleme a teljes rendezett mintában a hányadik helyen áll! az első minta rangszámai a második minta rangszámai a p-edik minta rangszámai a megfelelő rangszámösszegek
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával Megmutatható, hogy a minták homogenitásának feltételezése mellett a rendstatisztika aszimptotikusan p -1 szabadságfokú 2-eloszlást követ.
Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával Kis mintaelemszámok esetén a próbastatisztika pontos eloszlását kiszámolták és táblázatolták, nagy minták esetén az eloszlás a (k-1) szabadsági fokú khi-négyzet eloszlással közelíthető. A nullhipotézisnek a „nagy” H-értékek mondanak ellent (→ a kritikus tartomány az eloszlás jobb oldalán van!) Szignifikáns eredmény esetén a páronkénti összehasonlításokra is nemparaméteres módszerek jönnek szóba – a hibavalószínűség megfelelő korrigálásával. (Ezek a kiegészítések a statisztikai szoftverek nem mindegyikébe vannak beépítve! → De az SPSS egyik menüpontjában van erre is lehetőség!) Amennyiben az egyesített minta elemei között azonosak is vannak, akkor az ún. kapcsolt rangokkal kell számolni, és ilyenkor a H próbastatisztika kiszámolásánál egy korrekciós tényezőt kell alkalmazni.
Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával Nullhipotézis: az adatmátrix X és Y változója azonos eloszlásfüggvényhez tartozik-e? az X,Y változópár adatsora a differenciák sora az előjelek sora az abszolút eltérések sora
Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával az abszolút eltérések rendezett mintája az abszolút eltérések rangszámai a pozitív differenciák rangszám-összege a negatív differenciák rangszám-összege
Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával Ezután a Wilcoxon-táblázatból adott >0 elsőfajú hiba megválasztás után kiolvassuk a megfelelő kritikus értékeket, és a nullhipotézist akkor fogadjuk el, ha R+ a két kritikus érték közé esik. Pl. =0,01 esetén n=6-hoz a 1<R+ <20 relációnak kell fennállnia.
Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával Ha az n minta elemszám nagy (több mint 25), akkor megmutatható, hogy R+ közel normális eloszlású lesz paraméterekkel. Ilyenkor a nullhipotézis eldöntéséhez az reláció teljesülését kell ellenőrizni, ahol
Több összetartozó minta homogenitásának ellenőrzése Friedman próbával Összesen p változó azonos eloszláshoz tartozását ellenőrizzük. az adatmátrix Pl. a különböző időpontokban vett súlyok azonos eloszlásúak-e.
Több összetartozó minta homogenitásának ellenőrzése Friedman próbával Készítsük el az adatmátrix minden sorának rangszámait: azt a rangszámot jelenti, hogy hányadik legkisebb elem az adatmátrix első sorában.
Több összetartozó minta homogenitásának ellenőrzése Friedman próbával az egyes oszlopokhoz tartozó rangszám-összegek. Ha a homogenitás feltétele (a nullhipotézis) igaz, rangstatisztika aszimptotikusan p-1 szabadságfokú 2-eloszlást követ.
Több összetartozó minta homogenitásának ellenőrzése Friedman próbával Ha az n minta elemszám kicsi, akkor a Friedman-táblázatot használjuk. Abban az esetben, ha a homogenitást el kellett vetni, akkor az összes (i,j) párokra vonatkozó kétdimenziós mintákon egyenként ellenőrizzük a homogenitás fennállását, pl. Wilcoxon próbával.
Példa Mann-Whitney próbára Azonos eloszlást követ-e a GDP eloszlása a latin-amerikai és a kelet-európai országok esetében? A world 95 adatmátrixban most X a gdp_cap, az Y csoportképző változó pedig a region.
Példa Mann-Whitney próbára
Példa Mann-Whitney próbára Kelet-Európában magasabbak a GDP értékek! A próba nem fogadható el!
Példa Kruskal-Wallis próba alkalmazására Ellenőrizzük, hogy a world 95 állományban a férfiak és a nők várható élettartamai azonos eloszlást követnek-e a különböző éghajlati viszonyok között! A lifeexpm, lifeexpf változók vannak az X szerepében, A climate változó lesz az Y tördelő változó. Az uralkodó klima szerint fogjuk csoportosítani a lifeexpm és lifeexpf értékeit!
Példa Kruskal-Wallis próba alkalmazására X Y
Példa Kruskal-Wallis próba alkalmazására Alacsonyak a szignifikancia szintek, azaz az életkorok másként alakulnak más klimatikus régiókban! Alacsonyak a szignifikancia szintek, azaz az életkorok másként alakulnak más klimatikus régiókban!
Példa a Wilcoxon próba alkalmazására Ellenőrizzük, hogy a dietstudy állományban a kezdetisúly és végsúly azonos eloszlást követnek-e! A vizsgált összetar-tozó változók A vizsgált összetar-tozó változók
Példa a Wilcoxon próba alkalmazására
Példa a Wilcoxon próba alkalmazására Természetesen a szignifikancia szint ennek megfelelően 0! Mindegyik differencia negatív volt, vagyis mind a 16 páciens fogyott!
Példa a Friedman próba alkalmazására Ellenőrizzük, hogy a dietstudy állományban a különböző időpontokban mért testsúlyok azonos eloszlást követnek-e!
Példa a Friedman próba alkalmazására
Példa a Friedman próba alkalmazására a súlyok rangszámai csökkenő trendet mutatnak A nullhipotézist elutasítjuk
Páronkénti Wilcoxon-próbák Az összes párosítást beállítjuk!
Egyik párnál sem fogadható el a homogenitás!
A fontosabb nemparaméteres próbák áttekintő táblázata
A fontosabb nemparaméteres próbák áttekintő táblázata
A fontosabb nemparaméteres próbák áttekintő táblázata