Nemparaméteres próbák 2.

Slides:



Advertisements
Hasonló előadás
Gazdaságstatisztika Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák november 6. és november 13.
Advertisements

Becsléselmélet - gyakorlat október 14.. Példa 1 - Feladatgyűjtemény Egy nagyvállalat személyzeti osztályvezetője azt gyanítja, hogy különbség van.
Kvantitatív módszerek Hipotézisvizsgálatok - Nemparaméteres próbák október 16.
Paraméteres próbák- konzultáció október 21..
Munkalapok védelme az Excelben
A szerkezetátalakítási programban bekövetkezett változások
Valószínűségi kísérletek
Muraközy Balázs: Mely vállalatok válnak gazellává?
2. előadás Viszonyszámok
Adatbázis normalizálás
Leíró statisztika Becslés
Becslés gyakorlat november 3.
Mintavétel és becslés október 25. és 27.
Kvantitatív módszerek
A közigazgatással foglalkozó tudományok
Egy üzemben sok gyártósoron gyártanak egy bizonyos elektronikai alkatrészt. Az alkatrészek ellenállását időnként ellenőrzik úgy, hogy egy munkás odamegy.
Szigorlati felkészítő Kvantitatív módszerek
Becsléselmélet - Konzultáció
Kockázat és megbízhatóság
Kockázat és megbízhatóság
A legnagyobb közös osztó
Végeselemes modellezés matematikai alapjai
Kvantitatív módszerek
Hipotézisvizsgálat.
Statisztika 10 évf. 3 osztály 82 tanuló 9 évf. 4+1 osztály 118 tanuló Minden osztályt külön pedagógus javított 8 fő - részben of, ha vállalta.
Piaci kockázat tőkekövetelménye
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
Gazdaságstatisztika Korreláció- és regressziószámítás II.
Egy test forgómozgást végez, ha minden pontja ugyanazon pont, vagy egyenes körül kering. Például az óriáskerék kabinjai nem forgómozgást végeznek, mert.
Összefüggés vizsgálatok
Varianciaanalízis- ANOVA (Analyze Of VAriance)
Kvantitatív módszerek
Szerkezetek Dinamikája
Kvantitatív módszerek
Közigazgatási alapvizsga a Probono rendszerben
Kvantitatív módszerek
Érték-, ár-, volumenindexek
Regressziós modellek Regressziószámítás.
POLINÓMOK.
Sztochasztikus kapcsolatok I. Asszociáció
Tilk Bence Konzulens: Dr. Horváth Gábor
AVL fák.
3, u-próba, t-próba Kemometria 2016/2017 3, u-próba, t-próba
Dr. Varga Beatrix egy. docens
Új pályainformációs eszközök - filmek
Matematikai statisztika előadó: Ketskeméty László
Nemparaméteres próbák
Gazdaságinformatikus MSc
Háztartási termelés, család, életciklus
Alkalmazott statisztikai alapok
A kutatási projekt címe Név Oktató neve Tanulmányi intézmény neve
SZAKKÉPZÉSI ÖNÉRTÉKELÉSI MODELL I. HELYZETFELMÉRŐ SZINT FOLYAMATA 8
I. HELYZETFELMÉRÉSI SZINT FOLYAMATA 3. FEJLESZTÉSI FÁZIS 10. előadás
Dr. Varga Beatrix egyetemi docens
Matematika 11.évf. 1-2.alkalom
Binomiális fák elmélete
KRÉTA-ESL Bemutató.
Műveletek, függvények és tulajdonságaik Mátrix struktúrák:
SQL jogosultság-kezelés
Paraméteres próbák Adatelemzés.
Ki mit tud?- művészeti nap december 15. szombat
Kísérlettervezés 2018/19.
Hagyományos megjelenítés
AZ ORSZÁGOS KOMPETENCIAMÉRÉSEK MEGSZERVEZÉSE A TANODÁBAN
OpenBoard Kezelő Tananyag közzététele a KRÉTA rendszerben.
Hipotéziselmélet Adatelemzés.
KOHÉZIÓS POLITIKA A POLGÁROK SZOLGÁLATÁBAN
Vargha András KRE és ELTE, Pszichológiai Intézet
Üzlezi információelemző specializió
A statisztikus elemző specializió
Előadás másolata:

Nemparaméteres próbák 2. Adatelemzés

NEMPARAMÉTERES PRÓBÁK Ha az eddig tanult paraméteres próbák elvégzésének feltételei nem teljesülnek, vagy eleve más volt a kérdésfeltevésünk, az ún. nemparaméteres próbák alkalmazása jöhet szóba. Más elnevezés: eloszlásfüggetlen (distribution-free) próbák. Fontos: ezek elvégzésének is vannak feltételei! Bizonyos speciális esetekben eleve a rangszámok a kiinduló adataink (ilyen eset lehet pl. összetartozó mintáknál), de gyakran származnak folytonos skálán mért adatokból a rangszámok. Statisztikai szoftverek bizonyos esetben csak rangszámokat fogadnak el bemenő adatként, tehát ha szükséges, külön kell elvégezni a folytonos skálán mért adatok rangszámokká transzformálását, máskor ezt a transzformációt beépítik azokba a menüpontokba amelyben elvégezhetők ezek a próbák.

NEMPARAMÉTERES PRÓBÁK A nemparaméteres próbák közé sorolhatók az eloszlásokra tanult khi-négyzet-próbák, és sok más próba is. A továbbiakban az ún. rangpróbákról lesz szó, amelyeknél a próbastatisztika kiszámítása a mintaelemek rangszámaiból történik. A szóba jövő legfontosabb próbákat rendszerezhetjük a vizsgált minták száma és viszonya szempontjából: • egy minta vagy két összefüggő (párosítható) minta: Wilcoxon-féle előjeles rangpróba (Wilcoxon signed rank test) • két független minta: Mann–Whitney-féle U-próba (más néven: Wilcoxonféle rangösszeg-próba /Wilcoxon’s rank sum test/ vagy Wilcoxon–Mann–Whitney-próba) • kettőnél több független minta: Kruskal–Wallis-féle H-próba • kettőnél több összefüggő minta: Friedman-próba

Két független minta homogenitásának vizsgálata Mann-Whitney próbával Egy X minta adatait két részre osztjuk egy Y csoport-képző változó segítségével. Megvizsgáljuk, hogy a két minta azonos eloszlásfüggvényhez tartozik-e. Pl. azonos eloszlást követ-e a GDP eloszlása a latin-amerikai és a kelet-európai országok esetében?

Két független minta homogenitásának vizsgálata Mann-Whitney próbával Tekintsük az és mintákat! Legyen N=n+m. A két minta "összefésüléséből" képezzük a rendezett mintát! a két mintához tartozó rangszámösszegek

Két független minta homogenitásának vizsgálata Mann-Whitney próbával Abban az esetben, ha n, m elég nagy, az RX eloszlása aszimptotikusan normális lesz és paraméterekkel, így standard normális eloszlású! Kis minták esetén a Mann-Whitney táblázatot használjuk.

Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával Ellenőrizni szeretnénk azt a nullhipotézist, hogy p független minta ugyanabból az eloszlásból származik-e, vagyis a mintáknak közös-e az eloszlásfüggvényük. Pl. A gépkocsik fogyasztása azonos eloszlást követ-e a gyártási hely szerint? A dolgozói fizetések azonosak-e a munkabeosztásokban? a gdp eloszlása azonos-e az egyes földrészeken?

Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával A p független mintát egy Y tördelő változó segítségével fogjuk előállítani. Az egyes mintákhoz az X változó azon esetei tartoznak majd, amelyiknél az Y azonos értéket vesz fel.

Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával Egy X változó eseteit egy Y tördelő változó segítségével p részre csoportosítunk. X folytonos változó Y diszkrét (kategória) változó, csoportképző változó a p rész-minta , ,…, N az adatmátrix összes esetszáma

Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával jelöli az X minta rendezett realizáltját r1 például azt adja meg, hogy az első minta első eleme a teljes rendezett mintában a hányadik helyen áll! az első minta rangszámai a második minta rangszámai a p-edik minta rangszámai a megfelelő rangszámösszegek

Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával Megmutatható, hogy a minták homogenitásának feltételezése mellett a rendstatisztika aszimptotikusan p -1 szabadságfokú 2-eloszlást követ.

Több független minta együttes homogenitás-vizsgálata Kruskal-Wallis próbával Kis mintaelemszámok esetén a próbastatisztika pontos eloszlását kiszámolták és táblázatolták, nagy minták esetén az eloszlás a (k-1) szabadsági fokú khi-négyzet eloszlással közelíthető. A nullhipotézisnek a „nagy” H-értékek mondanak ellent (→ a kritikus tartomány az eloszlás jobb oldalán van!) Szignifikáns eredmény esetén a páronkénti összehasonlításokra is nemparaméteres módszerek jönnek szóba – a hibavalószínűség megfelelő korrigálásával. (Ezek a kiegészítések a statisztikai szoftverek nem mindegyikébe vannak beépítve! → De az SPSS egyik menüpontjában van erre is lehetőség!) Amennyiben az egyesített minta elemei között azonosak is vannak, akkor az ún. kapcsolt rangokkal kell számolni, és ilyenkor a H próbastatisztika kiszámolásánál egy korrekciós tényezőt kell alkalmazni.

Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával Nullhipotézis: az adatmátrix X és Y változója azonos eloszlásfüggvényhez tartozik-e? az X,Y változópár adatsora a differenciák sora az előjelek sora az abszolút eltérések sora

Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával az abszolút eltérések rendezett mintája az abszolút eltérések rangszámai a pozitív differenciák rangszám-összege a negatív differenciák rangszám-összege

Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával Ezután a Wilcoxon-táblázatból adott  >0 elsőfajú hiba megválasztás után kiolvassuk a megfelelő kritikus értékeket, és a nullhipotézist akkor fogadjuk el, ha R+ a két kritikus érték közé esik. Pl.  =0,01 esetén n=6-hoz a 1<R+ <20 relációnak kell fennállnia.

Két összetartozó minta homogenitásának ellenőrzése Wilcoxon próbával Ha az n minta elemszám nagy (több mint 25), akkor megmutatható, hogy R+ közel normális eloszlású lesz paraméterekkel. Ilyenkor a nullhipotézis eldöntéséhez az reláció teljesülését kell ellenőrizni, ahol

Több összetartozó minta homogenitásának ellenőrzése Friedman próbával Összesen p változó azonos eloszláshoz tartozását ellenőrizzük. az adatmátrix Pl. a különböző időpontokban vett súlyok azonos eloszlásúak-e.

Több összetartozó minta homogenitásának ellenőrzése Friedman próbával Készítsük el az adatmátrix minden sorának rangszámait: azt a rangszámot jelenti, hogy hányadik legkisebb elem az adatmátrix első sorában.

Több összetartozó minta homogenitásának ellenőrzése Friedman próbával az egyes oszlopokhoz tartozó rangszám-összegek. Ha a homogenitás feltétele (a nullhipotézis) igaz, rangstatisztika aszimptotikusan p-1 szabadságfokú 2-eloszlást követ.

Több összetartozó minta homogenitásának ellenőrzése Friedman próbával Ha az n minta elemszám kicsi, akkor a Friedman-táblázatot használjuk. Abban az esetben, ha a homogenitást el kellett vetni, akkor az összes (i,j) párokra vonatkozó kétdimenziós mintákon egyenként ellenőrizzük a homogenitás fennállását, pl. Wilcoxon próbával.

Példa Mann-Whitney próbára Azonos eloszlást követ-e a GDP eloszlása a latin-amerikai és a kelet-európai országok esetében? A world 95 adatmátrixban most X a gdp_cap, az Y csoportképző változó pedig a region.

Példa Mann-Whitney próbára

Példa Mann-Whitney próbára Kelet-Európában magasabbak a GDP értékek! A próba nem fogadható el!

Példa Kruskal-Wallis próba alkalmazására Ellenőrizzük, hogy a world 95 állományban a férfiak és a nők várható élettartamai azonos eloszlást követnek-e a különböző éghajlati viszonyok között! A lifeexpm, lifeexpf változók vannak az X szerepében, A climate változó lesz az Y tördelő változó. Az uralkodó klima szerint fogjuk csoportosítani a lifeexpm és lifeexpf értékeit!

Példa Kruskal-Wallis próba alkalmazására X Y

Példa Kruskal-Wallis próba alkalmazására Alacsonyak a szignifikancia szintek, azaz az életkorok másként alakulnak más klimatikus régiókban! Alacsonyak a szignifikancia szintek, azaz az életkorok másként alakulnak más klimatikus régiókban!

Példa a Wilcoxon próba alkalmazására Ellenőrizzük, hogy a dietstudy állományban a kezdetisúly és végsúly azonos eloszlást követnek-e! A vizsgált összetar-tozó változók A vizsgált összetar-tozó változók

Példa a Wilcoxon próba alkalmazására

Példa a Wilcoxon próba alkalmazására Természetesen a szignifikancia szint ennek megfelelően 0! Mindegyik differencia negatív volt, vagyis mind a 16 páciens fogyott!

Példa a Friedman próba alkalmazására Ellenőrizzük, hogy a dietstudy állományban a különböző időpontokban mért testsúlyok azonos eloszlást követnek-e!

Példa a Friedman próba alkalmazására

Példa a Friedman próba alkalmazására a súlyok rangszámai csökkenő trendet mutatnak A nullhipotézist elutasítjuk

Páronkénti Wilcoxon-próbák Az összes párosítást beállítjuk!

Egyik párnál sem fogadható el a homogenitás!

A fontosabb nemparaméteres próbák áttekintő táblázata

A fontosabb nemparaméteres próbák áttekintő táblázata

A fontosabb nemparaméteres próbák áttekintő táblázata