Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek.

Hasonló előadás


Az előadások a következő témára: "Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek."— Előadás másolata:

1 Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek erre az eloszlásra nézve v ellenőrizzük, hogy az adatok mennyire támasztják alá a hipotéziseket

2 A hibák táblázata v Adott próbastatisztika mellett az első ill. másodfajú hiba csak egymás rovására csökkenthető. Az elsőfajút írjuk elő kicsinek, ezért az elutasítás a szignifikáns eredmény

3 Megvalósítás v próbastatisztika: az adatok függvénye v elutasítási (kritikus) vs. elfogadási tartomány nem tipikus értékek vs. tipikus értékek v szignifikancia szint = az elsőfajú hibát előírtan alacsony szinten kívánom tartani

4 A p-érték fogalma van egy olyan legkisebb szigni- fikanciaszint, amelyen már biztosan el kell fogadnunk a nullhipotézist elfogadási tartomány Ez az ún. p-érték a p-érték nagy a p-érték kicsi H 0 -t elfogadjuk H 0 -t elvetjük

5 Statisztikai próbák t-próbaF-próba

6 t-próba v Ismert m várható érték és  szórás mellett a normális eloszlású minta standardizált átlaga standard normális eloszlású lesz. v m-et a H 0 hipotézisben feltételezett értékével,  -t a tapasztalati szórásnégyzettel (ez már valváltozó) helyettesítve Student féle t eloszlást kapunk - ennek kritikus értéke felett utasítunk el

7 A normális eloszlás és a Student-féle t-eloszlás standard normális eloszlás 1 szabadsági fokú Student- eloszlás 3 szabadsági fokú Student- eloszlás

8 Az F-eloszlás

9 Hotelling féle T 2 próba v A normális eloszlású minta standardizált átlagának négyzete egy  2 n eloszlású változó n-edrészével egyező eloszlású v Ennek analógiájára, normális eloszlású vektor értékű mintából elkészítjük az v statisztikát, melynek eloszlása Hotelling féle T 2 lesz - ennek kritikus értéke felett utasítunk el

10 Szórásanalízis(ANOVA) Hatások vizsgálata Regresszió X Y

11 Szóráselemzés v Azt vizsgáljuk, hogy egy bizonyos faktornak (körülménynek) van-e hatása a kimeneti változó (válasz) várható értékére v a faktort különböző szintekre állitjuk be és méréseket végzünk v nullhipotézis: a faktornak nincs hatása, azaz a várható értékek egyenlőek v az adatok alapján ezt megpróbáljuk megcáfolni

12 Egy faktor esete Az adatok: Y i,j Az adat sorszáma a i = 1,..., N j csoporton belül (egy rögzített faktorbeállítás melletti mérések) A csoport sorszáma j = 1,..., k (a faktor különböző beállításai, szintjei)

13 A Nullhipotézis v A modell szerint a mért érték az elméleti érték + a megfigyelési zaj összegeként adódik v A zaj független értékű, normális eloszlású v Y i,j = m j +e i,j v A nullhipotézisben az elméleti (várható) értékek egyenlőségét feltételezük (a faktor nem hat) v H 0 : m 1 =...= m k v Ennek elutasítása a szignifikáns eredmény

14 A döntés elve v A várható értékek egyenlőségéről döntünk a szórások elemzésének segítségével. v Ha valóban n független azonos eloszlású mintánk van az egyes csoportokban, akkor a csoportátlagok szórásnégyzete a minta szórásnégyzetének n-edrésze. v Ha igaz a nullhipotézis, akkor ugyanez a becsült szórásnégyzetekre is áll - szorozzuk be tehát őket n-nel és teszteljük az egyenlőségüket. v Független normális eloszlású minták szórásnégyzeteinek egyenlőségét F-próbával tesztelhetjük. v A Fisher-Cohran tétel biztosítja, hogy az átlagokból számolt tapasztalati szórásnégyzet független legyen az összevont mintából származó tapasztalati szórásnégyzettől - de ez csak normális eloszlású minta esetén igaz!

15 A négyzetösszegek felosztása Az átlagok felbontása: A négyzetösszegek felbontása:

16 A négyzetösszegek felosztása Másképpen: SS össz = SS csb +SS csk SS össz = SS csb +SS csk A “szabadsági fokok”:

17 Az F-próba A H 0 mellett a “csk” csoportok közötti és “csb” csoporton belüli szórásnégyzetek aránya kicsi és az eloszlása ismert: MS csk MS csb F df csk,df csb eloszlása F df csk,df csb (n-k)SS csk (k-1)SS csb =

18 Egy példa ipari alkalmazások közül v A gyártmány súlya a keverék sűrűségének függvényében v A gyártmány súlyának elemzése a keverék sűrűségének függvényében. Különböző sűrűségbeállítások mellett próbagyártást végeztek, és mérték a súlyt. A kapott eredmények láthatóak az ábrán. A kék pont az adott beállítás melletti átlag.

19 A szórások v Az egyes oszlopokra elkészít- jük a mintaátlagokat. (Kék). v Becsüljük a mintaátlagokból a teljes minta szórásnégyzetét. v Majd a zöld oszlopokra szá- mítjuk a négyzetösszegeket, ezeket összeadjuk és osztunk a szabadsági fokkal – Újra a sárga összevont minta szórásnégyzetét becsüljük. v A kétféleképp számított szórásnégyzet eltérésének szignifikanciáját F-próbával teszteljük.

20 MINITAB-os elemzés eredménye v Szabadsági fokok: 7 Mix csoport van: => k=7 df csk =k-1=6 v Összesen 70 megfigyelésünk van : => N=70, df csb =N-k=63 v A csoportok átlagainak az összevont átlagtól vett négyzetes eltéréseinek összege SS csk = ebből a négyzetes hiba: MS csk =SS csk /df csk = v Ugyanígy: A csoportokon belüli átlagoktól vett négyzetes eltérések összege (a csoportokra is összeadva) SS csb = ebből a négyzetes hiba: MS csb =SS csb /df csb = One-way ANOVA: Wt3 versus Mix Source DF SS MS F P Mix Error Total

21 Az F-próba v A fenti két mennyiség MS csk /MS csb hányadosa az F-statisztika értéke: v Ez adja az adott df csk, df csb szabadságfokok szerinti F-eloszlásból F(df csk,df csb ) a es p értéket

22 Multi-Faktor ANOVA Egy tipikus kísérletben nem csak egyetlen hanem több faktort is figyelembe kell veni. Ezen faktorok hatását kell ellenőrzés alatt tartani.

23 A kísérleti eredmények változékonyságának négy forrását ismerhetjük fel ebben az esetben: (1) hiba – azaz a csoporton belüli változékonyság, (2) 1 típusú csoport tagságból adódó változékonyság (3) 2 típusú csoport tagságból változékonyság (4) kölcsönhatás

24 Az F-próba A H 0 eldöntésére az F próbát éppúgy alkalmazhatjuk mint az előzőekben: eloszlása F df csk,df csb eloszlása F df csk,df csb MS csk MS csb (n-k)SS csk (k-1)SS csb =

25 Szóráselemzés tábla v Ha elutasítjuk H 0 -t, akkor mely csoportok különböznek? A változékonyság négy lehetséges forrása ( 2 főhatás + kölcsönhatás + hiba) közül melyek hatnak és mennyire? v Megtehetjük, hogy mind a három lehetséges faktor (csoport tagság, nemek, kölcsönhatás) szerint szóráselemzést végzünk és ennek segítségével döntünk a ható faktorokról

26 Többváltozós szóráselemzés Multivariate ANOVA = MANOVA v Most is azt vizsgáljuk, hogy egy bizonyos faktornak (körülménynek) van-e hatása a kimeneti változó (válasz) várható értékére, de a válasz most vektor értékű, tehát többféle mennyiséget mérünk v Ekkor nem szórásunk, hanem szórásmátrixunk van. v Ha a nullhipotézis fennáll, a csoportátlagokból számolt szórásmátrix becslés a teljes mintából számolt n-edrésze (+ a becslési ingadozás) v Ezért egyik szorozva a másik inverzével közel az egységmátrixot kell hogy adja - de ezt hogyan teszteljük?

27 MANOVA próbák v A szorzatmátrix sajátértékeinek kell 1-hez közelinek lennie v Ezt tesztelik a –Wilk –Lawley- Hotelling –Pillai –Roy próbák v Nincs közöttük egyenletesen legerősebb és ilyet nem is lehet konstruálni

28 Lineáris regresszió

29 A legkisebb négyzetek módszere Y X

30 Regresszió v Az Y eredményváltozó (függő változó) közelítése az X faktorokkal (magyarázó változók). Általában lineáris regressziót keresünk (ekkor a magyarázó változók lineáris függvényével közelítünk). v Azt az egyenest keressük, amelyre az egyenes által adott közelítés és a ténylegesen megfigyelt pontok közötti négyzetes eltérés minimális. A megoldás: v Ez a hatásos becslés is, ha a modellbeli hiba független, azonos, normális eloszlású.

31 A becslés standard hibája v A független, azonos, normális eloszlású hiba esetén sok minden jól számolható, például az egyenes együtthatóinak standard hibája: ahol ahol v Ebből a becsült regressziós együtthatók szignifikanciáját t- próbával vizsgálhatjuk.

32 Az illeszkedés mérőszáma v Ez igen lényeges, mert hiba lenne valójában nem illeszkedő modellből következtetéseket levonni. Az illeszkedés mérőszáma az R 2 statisztika, ill. ennek korrigált változata, (adjusted R 2) amikor a magyarázó változók számát is figyelembe vesszük.

33 „Lack of fit” teszt v Az illesztett regressziós egyenes, illetve az átlag, mint vízszintes egyenes körüli szórásokat hasonlítjuk össze. A szórások egyezését F-próbával teszteljük. v Amennyiben a lineáris kapcsolat ténylegesen jelen van, úgy az egyenes körüli szórás kisebb, tehát a szórások egyezését elutasítjuk.


Letölteni ppt "Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek."

Hasonló előadás


Google Hirdetések