3. Varianciaanalízis (ANOVA)

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Hipotézisvizsgálat az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi az adatok ismeretében megfogalmazódnak bizonyos hipotézisek erre.
4. Két összetartozó minta összehasonlítása
I. előadás.
II. előadás.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Egy faktor szerinti ANOVA
Összetett kísérleti tervek és kiértékelésük
Összetett kísérleti tervek és kiértékelésük: Háromszempontos variancia analízis modellek.
Kvantitatív módszerek
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Feladat Egy új kísérleti készítmény hatását szeretnék vizsgálni egereken. 5 féle dózist adnak be 5 vizsgált egérnek, de nem sikerült mindegyik egérnek.
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Általános lineáris modellek
Becsléselméleti ismétlés
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. II. Dr. Szalka Éva, Ph.D..
III. előadás.
Regresszióanalízis 10. gyakorlat.
Varianciaanalízis 12. gyakorlat.
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Kovarianciaanalízis Tételezzük fel, hogy a kvalitatív tényező(k) hatásának azonosítása után megmaradó szóródás egy részének eredete ismert, és nem lehet,
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Kvantitatív módszerek

108 A kísérletek célja egy speciális anyag optimális előállítási körülményeinek meghatározása volt. A célfüggvény a kihozatal %. melynek maximális értékét.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Egytényezős variancia-analízis
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 18. előadás Hipotézisvizsgálatok
RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Következtető statisztika 9.
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Lineáris regresszió.
Többtényezős ANOVA.
t A kétoldalú statisztikai próba alapfogalmai
Két kvantitatív változó kapcsolatának vizsgálata
Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek.
I. előadás.
A szóráselemzés gondolatmenete
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Valószínűségszámítás II.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Összetett kísérleti tervek és kiértékelésük Többszempontos varianciaanalízis-modellek (keresztosztályozások, blokkelrendezések)
Paraméteres próbák- gyakorlat
Hipotézisvizsgálatok Paraméteres próbák
Lineáris regressziós modellek
Kiváltott agyi jelek informatikai feldolgozása 2016
II. előadás.
Becsléselmélet - Konzultáció
Gazdaságstatisztika konzultáció
Kvantitatív módszerek
I. Előadás bgk. uni-obuda
III. előadás.
Szabályozott és képes termékek/szolgáltatások, folyamatok, rendszerek
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Dr. Varga Beatrix egyetemi docens
1.3. Hipotézisvizsgálat, statisztikai próbák
Előadás másolata:

3. Varianciaanalízis (ANOVA) A kétmintás t-próbával két csoportot hasonlítottunk össze, hogy a mögöttük álló két sokaság várható értéke azonos-e. A varianciaanalízis (vagy szóráselemzés) több csoport összehasonlítására is alkalmas. Faktor: (tényező) független változó, aminek a hatását vizsgáljuk. Célváltozó: olyan megfigyelhető vagy mérhető változó, amely alkalmas a tényezők hatásának mérésére.

Egytényezős varianciaelemzés v. egy faktor szerinti osztályozás Feltételek: a minták függetlenek, a célváltozó normális eloszlású, a szórások azonosak. Nullhipotézis: nincs különbség a csoportok átlagai között H0: m1 = m2 = … = mk Ellenhipotézis: nem minden átlag egyenlő, a csoportok között különbség van H1: nem minden mi egyenlő egymással.

3-1. példa Három különböző műtrágyát vizsgáltak, mindegyiket 5 kukorica esetén. Az egyéb körülmények azonosak voltak. Egy hónap elteltével mérték a növények magasságát. Határozzuk meg, hogy van-e különbség a három műtrágya között. Adatok, jelölések: Műtrágya ( i) 1. 2. 3. 23 16 18 Magasság 21 22 ( j ) 24 20 25 17 19

A sokaság varianciáját kétféleképpen becsülhetjük: a) A csoportokon belüli ingadozásokból (within groups) csoporton belüli eltérés négyzetösszeg csoporton belüli átlag négyzetes eltérés (csoporton belüli szórásnégyzet) Ha azonos a csoportokban a mérések száma, MSW a csoportok szórásnégyzeteinek az átlaga k(n-1) szabadsági fokkal:

b) A csoportok átlagainak eltéréséből (between groups) csoportok közötti eltérés négyzetösszeg csoportok közötti átlag négyzetes eltérés (csoportok közötti szórásnégyzet) Ha azonos a csoportokban a mérések száma, MSB a csoportátlagok szórásnégyzetének n-szerese k-1 szabadsági fokkal:

Ha a csoportok között nincs különbség, az átlagok eltérését ugyanaz a véletlen ingadozás okozza, mint a csoportokon belüli ismétlések különbözőségét. Ekkor MSB és MSW egyaránt a sokaság varianciája körül ingadozik, hányadosuk F-eloszlású. Ha a csoportok között van különbség, akkor az MSB / MSW hányados sokkal nagyobb, mint amekkora az F-eloszlás szerint lehetne. Ezt vizsgáljuk majd statisztikai próbával. A próbastatisztika:

A példában: A példában: 0.468 < 3.89, a nullhipotézist elfogadjuk, nincs különbség a műtrágyák hatásában.

Eltérés-négyzetösszeg ANOVA táblázat Kiegyensúlyozott terv esetére, azaz amikor a faktor egyes szintjein a kísérletek száma azonos. Az eltérés forrása Eltérés-négyzetösszeg Szabadsági fok Szórásnégyzet F0 Csoportok között Csoporton belül Teljes

Excel eredmény Egytényezős varianciaanalízis ÖSSZESÍTÉS Csoportok Darabszám Összeg Átlag Variancia Oszlop 1 5 104 20.8 8.2 Oszlop 2 98 19.6 7.3 Oszlop 3 106 21.2 6.7 VARIANCIAANALÍZIS Tényezők SS df MS F p-érték F krit. Csoportok között 6.933333 2 3.467 0.46847 0.637 3.885 Csoporton belül 88.8 12 7.4 Összesen 95.73333 14  

Öt ismétlést végeztek minden egyes módszer esetén. 3-2. példa Egy összehasonlító tanulmányban négy különböző módszerrel (A, B, C és D) mérték az ivóvízben a fluor mennyiségét. Öt ismétlést végeztek minden egyes módszer esetén. Az eredmények (ppm): A B C D 2 5 1 3 4 6 Ekvivalensek a módszerek? Használjon 5%-s szignifikancia szintet.

4. Faktoros kísérleti tervek Kísérlet: szándékosan változtatunk egy vagy több változót, faktort, hogy hatását megfigyeljük a minőséget jellemző egy vagy több válasz változón. Kísérlettervezés (Design of Experiments, DOE): egy hatékony eljárás a kísérletek megtervezésére és elemzésére úgy, hogy a kapott adatok valós és objektív konklúziók levonását tegyék lehetővé.   Kísérletterv: a részletes, a beállításokat, sorrendet tartalmazó terv, amelynek még a kísérletek elvégzése előtt rendelkezésre kell állnia.

A kísérletek célja: - Független változók optimális működési tartományának megkeresése (optimalizálás) - A függő változók egyes független változók megváltozására való érzékenységének meghatározása - Függő változók becslése (intrepolálás) - Függő változó bizonytalanságának becslése

a, Hagyományos kísérletezés: egyszerre csak egy faktor szintjét változtatják b, Faktoros kísérleti tervek: egyszerre több faktor szintjét változtatjuk a, b,

2p típusú teljes faktoros kísérleti tervek p faktor; két szint; N = 2p pont Lineáris modell 4-1. példa 22 kísérleti terv során két célfüggvényt vizsgáltak, és az alábbi eredményeket kapták: i z1 z2 y1 y2 1 0.2 25 23 26 2 0.3 19 12 3 30 31 4 27 32

Transzformáció: i z1 z2 y1 y2 1 0.2 25 23 26 2 0.3 19 12 3 30 31 4 27 32 i x1 x2 y1 y2 1 - 23 26 2 + 19 12 3 31 30 4 27 32

Lineáris modell, az elméleti regressziós függvény: A példában: becslés: Az egységes kezelés érdekében bevezetünk egy x0 változó, mely értéke +1. i x0 x1 x2 y1 y2 1 + - 23 26 2 19 12 3 31 30 4 27 32

A paraméterek becslése többváltozós lineáris regresszióval : x0 x1 x2 y1 y2 1 + - 23 26 2 19 12 3 31 30 4 27 32 I. Értékeljük ki először a tervet az y1 változóra: A becsült sík egyenlete:

i x0 x1 x2 y1 1 + - 23 2 19 3 31 4 27

A faktorok hatása: Könnyen belátható, hogy: A faktorok hatásának szemléltetése grafikusan:

A faktorok kölcsönhatásának szemléltetése grafikusan: x0 x1 x2 y1 1 + - 23 2 19 3 31 4 27 X2 alsó és felső szintjéhez tartozó egyenesek párhuzamosak, azaz az x1 faktor hatása azonos az x2 faktor mindkét szintjén, tehát nincs a faktorok között kölcsönhatás (interakció)

II. Végezzük el az értékelést az y2 változóra is: A lineáris modell paramétereinek becslése i x0 x1 x2 y2 1 + - 26 2 12 3 30 4 32 A becsült sík egyenlete:

A faktorok hatásának szemléltetése grafikusan: x0 x1 x2 y2 1 + - 26 2 12 3 30 4 32 A faktorok hatása: A faktorok hatásának szemléltetése grafikusan:

A faktorok kölcsönhatásának szemléltetése grafikusan: x0 x1 x2 y2 1 + - 26 2 12 3 30 4 32 X2 alsó és felső szintjéhez tartozó egyenesek nem párhuzamosak, azaz az x1 faktor hatása függ az x2 faktor beállításától, tehát a faktorok között van kölcsönhatás (interakció)

A becsült modell egyenlete: A modellt finomítani kell, figyelembe véve, hogy a faktorok között kölcsönhatás van: i x0 x1 x2 x1x2 y2 1 + - 26 2 12 3 30 4 32 A becsült modell egyenlete:

Ha a faktorok között nincs kölcsönhatás, az illesztett modell két faktor esetén egy sík egyenlete. Ha a faktorok között kölcsönhatás van, a felület csavarodott. A becsült modellek használhatók interpolációra, extrapolációra.

A becsült paraméterek szignifikanciájának vizsgálata bj szignifikánsan különbözik-e zérustól? A vizsgálatokhoz szükség van az együtthatók szórására (sb), amely y szórásából (sy) számítható: sy ismételt mérésekkel meghatározható. Az ismételt méréseket célszerű a terv centrumában elvégezni, ahol a faktorok szintje 0. Példánkban y1-re a centrumban végzett mérések: 25, 25, 26.

bj szignifikánsan különbözik-e zérustól? Nullhipotézis: Próbastatisztika: A nullhipotézist akkor utasítjuk el, ha: t0.025(2) = 4.3; tehát azon együtthatókat tekinthetjük zérustól szignifikánsan különbözőnek, amelyek abszolút értéke 0.289 X 4.3 = 1.243-nál nagyobb. Példánkban b1 = -2 és b2 = 4 egyaránt szignifikáns.

Adekvát-e a lineáris modell? Nincs-e szükség másodfokú tagra? A terv centrumát vizsgáljuk. Ha az Y1 felület a valóságban is lineáris, akkor b0 várható értéke megegyezik a centrumbeli y1 mérések várható értékével. Nullhipotézis: Ellenhipotézis: A próbastatisztika (a kétmintás t-próba analógiájára): ahol: df: l: a modell paramétereinek a száma, kc: a centrumban végzett mérések száma

Példánkban: t0 < t0.025, elfogadjuk a nullhipotézist, nem kell másodfokú tag a modellbe.

A centrumban végzett mérések átlaga eltér a b0-tól, a modell nem adekvát.

4-2. példa Vizsgáljuk egy reaktorban a kitermelést négy faktor függvényében: z1 hőmérséklet 40 és 60°C z2 reakcióidő 10 és 20 min z3 kiindulási komponens koncentrációja 45 és 65% z4 nyomás 2 és 6 bar

A 24 kísérleti terv és a mérési eredmények:

A b1 paraméter kiszámítása: Hasonlóan a többi becsült paraméter: Az x1 faktor hatása:

A faktorok hatása:

A becsült regressziós sík egyenlete: A 16 kísérletből így csak öt paramétert becsültünk, lehetséges egy több paramétert tartalmazó kibővített függvény illesztése is: Interakciós tagok

A kibővített kísérleti terv: pl.:

Hasonlóan: Mindegyik paraméter szignifikánsan különbözik-e zérustól. (Gauss-háló)