3. Varianciaanalízis (ANOVA) A kétmintás t-próbával két csoportot hasonlítottunk össze, hogy a mögöttük álló két sokaság várható értéke azonos-e. A varianciaanalízis (vagy szóráselemzés) több csoport összehasonlítására is alkalmas. Faktor: (tényező) független változó, aminek a hatását vizsgáljuk. Célváltozó: olyan megfigyelhető vagy mérhető változó, amely alkalmas a tényezők hatásának mérésére.
Egytényezős varianciaelemzés v. egy faktor szerinti osztályozás Feltételek: a minták függetlenek, a célváltozó normális eloszlású, a szórások azonosak. Nullhipotézis: nincs különbség a csoportok átlagai között H0: m1 = m2 = … = mk Ellenhipotézis: nem minden átlag egyenlő, a csoportok között különbség van H1: nem minden mi egyenlő egymással.
3-1. példa Három különböző műtrágyát vizsgáltak, mindegyiket 5 kukorica esetén. Az egyéb körülmények azonosak voltak. Egy hónap elteltével mérték a növények magasságát. Határozzuk meg, hogy van-e különbség a három műtrágya között. Adatok, jelölések: Műtrágya ( i) 1. 2. 3. 23 16 18 Magasság 21 22 ( j ) 24 20 25 17 19
A sokaság varianciáját kétféleképpen becsülhetjük: a) A csoportokon belüli ingadozásokból (within groups) csoporton belüli eltérés négyzetösszeg csoporton belüli átlag négyzetes eltérés (csoporton belüli szórásnégyzet) Ha azonos a csoportokban a mérések száma, MSW a csoportok szórásnégyzeteinek az átlaga k(n-1) szabadsági fokkal:
b) A csoportok átlagainak eltéréséből (between groups) csoportok közötti eltérés négyzetösszeg csoportok közötti átlag négyzetes eltérés (csoportok közötti szórásnégyzet) Ha azonos a csoportokban a mérések száma, MSB a csoportátlagok szórásnégyzetének n-szerese k-1 szabadsági fokkal:
Ha a csoportok között nincs különbség, az átlagok eltérését ugyanaz a véletlen ingadozás okozza, mint a csoportokon belüli ismétlések különbözőségét. Ekkor MSB és MSW egyaránt a sokaság varianciája körül ingadozik, hányadosuk F-eloszlású. Ha a csoportok között van különbség, akkor az MSB / MSW hányados sokkal nagyobb, mint amekkora az F-eloszlás szerint lehetne. Ezt vizsgáljuk majd statisztikai próbával. A próbastatisztika:
A példában: A példában: 0.468 < 3.89, a nullhipotézist elfogadjuk, nincs különbség a műtrágyák hatásában.
Eltérés-négyzetösszeg ANOVA táblázat Kiegyensúlyozott terv esetére, azaz amikor a faktor egyes szintjein a kísérletek száma azonos. Az eltérés forrása Eltérés-négyzetösszeg Szabadsági fok Szórásnégyzet F0 Csoportok között Csoporton belül Teljes
Excel eredmény Egytényezős varianciaanalízis ÖSSZESÍTÉS Csoportok Darabszám Összeg Átlag Variancia Oszlop 1 5 104 20.8 8.2 Oszlop 2 98 19.6 7.3 Oszlop 3 106 21.2 6.7 VARIANCIAANALÍZIS Tényezők SS df MS F p-érték F krit. Csoportok között 6.933333 2 3.467 0.46847 0.637 3.885 Csoporton belül 88.8 12 7.4 Összesen 95.73333 14
Öt ismétlést végeztek minden egyes módszer esetén. 3-2. példa Egy összehasonlító tanulmányban négy különböző módszerrel (A, B, C és D) mérték az ivóvízben a fluor mennyiségét. Öt ismétlést végeztek minden egyes módszer esetén. Az eredmények (ppm): A B C D 2 5 1 3 4 6 Ekvivalensek a módszerek? Használjon 5%-s szignifikancia szintet.
4. Faktoros kísérleti tervek Kísérlet: szándékosan változtatunk egy vagy több változót, faktort, hogy hatását megfigyeljük a minőséget jellemző egy vagy több válasz változón. Kísérlettervezés (Design of Experiments, DOE): egy hatékony eljárás a kísérletek megtervezésére és elemzésére úgy, hogy a kapott adatok valós és objektív konklúziók levonását tegyék lehetővé. Kísérletterv: a részletes, a beállításokat, sorrendet tartalmazó terv, amelynek még a kísérletek elvégzése előtt rendelkezésre kell állnia.
A kísérletek célja: - Független változók optimális működési tartományának megkeresése (optimalizálás) - A függő változók egyes független változók megváltozására való érzékenységének meghatározása - Függő változók becslése (intrepolálás) - Függő változó bizonytalanságának becslése
a, Hagyományos kísérletezés: egyszerre csak egy faktor szintjét változtatják b, Faktoros kísérleti tervek: egyszerre több faktor szintjét változtatjuk a, b,
2p típusú teljes faktoros kísérleti tervek p faktor; két szint; N = 2p pont Lineáris modell 4-1. példa 22 kísérleti terv során két célfüggvényt vizsgáltak, és az alábbi eredményeket kapták: i z1 z2 y1 y2 1 0.2 25 23 26 2 0.3 19 12 3 30 31 4 27 32
Transzformáció: i z1 z2 y1 y2 1 0.2 25 23 26 2 0.3 19 12 3 30 31 4 27 32 i x1 x2 y1 y2 1 - 23 26 2 + 19 12 3 31 30 4 27 32
Lineáris modell, az elméleti regressziós függvény: A példában: becslés: Az egységes kezelés érdekében bevezetünk egy x0 változó, mely értéke +1. i x0 x1 x2 y1 y2 1 + - 23 26 2 19 12 3 31 30 4 27 32
A paraméterek becslése többváltozós lineáris regresszióval : x0 x1 x2 y1 y2 1 + - 23 26 2 19 12 3 31 30 4 27 32 I. Értékeljük ki először a tervet az y1 változóra: A becsült sík egyenlete:
i x0 x1 x2 y1 1 + - 23 2 19 3 31 4 27
A faktorok hatása: Könnyen belátható, hogy: A faktorok hatásának szemléltetése grafikusan:
A faktorok kölcsönhatásának szemléltetése grafikusan: x0 x1 x2 y1 1 + - 23 2 19 3 31 4 27 X2 alsó és felső szintjéhez tartozó egyenesek párhuzamosak, azaz az x1 faktor hatása azonos az x2 faktor mindkét szintjén, tehát nincs a faktorok között kölcsönhatás (interakció)
II. Végezzük el az értékelést az y2 változóra is: A lineáris modell paramétereinek becslése i x0 x1 x2 y2 1 + - 26 2 12 3 30 4 32 A becsült sík egyenlete:
A faktorok hatásának szemléltetése grafikusan: x0 x1 x2 y2 1 + - 26 2 12 3 30 4 32 A faktorok hatása: A faktorok hatásának szemléltetése grafikusan:
A faktorok kölcsönhatásának szemléltetése grafikusan: x0 x1 x2 y2 1 + - 26 2 12 3 30 4 32 X2 alsó és felső szintjéhez tartozó egyenesek nem párhuzamosak, azaz az x1 faktor hatása függ az x2 faktor beállításától, tehát a faktorok között van kölcsönhatás (interakció)
A becsült modell egyenlete: A modellt finomítani kell, figyelembe véve, hogy a faktorok között kölcsönhatás van: i x0 x1 x2 x1x2 y2 1 + - 26 2 12 3 30 4 32 A becsült modell egyenlete:
Ha a faktorok között nincs kölcsönhatás, az illesztett modell két faktor esetén egy sík egyenlete. Ha a faktorok között kölcsönhatás van, a felület csavarodott. A becsült modellek használhatók interpolációra, extrapolációra.
A becsült paraméterek szignifikanciájának vizsgálata bj szignifikánsan különbözik-e zérustól? A vizsgálatokhoz szükség van az együtthatók szórására (sb), amely y szórásából (sy) számítható: sy ismételt mérésekkel meghatározható. Az ismételt méréseket célszerű a terv centrumában elvégezni, ahol a faktorok szintje 0. Példánkban y1-re a centrumban végzett mérések: 25, 25, 26.
bj szignifikánsan különbözik-e zérustól? Nullhipotézis: Próbastatisztika: A nullhipotézist akkor utasítjuk el, ha: t0.025(2) = 4.3; tehát azon együtthatókat tekinthetjük zérustól szignifikánsan különbözőnek, amelyek abszolút értéke 0.289 X 4.3 = 1.243-nál nagyobb. Példánkban b1 = -2 és b2 = 4 egyaránt szignifikáns.
Adekvát-e a lineáris modell? Nincs-e szükség másodfokú tagra? A terv centrumát vizsgáljuk. Ha az Y1 felület a valóságban is lineáris, akkor b0 várható értéke megegyezik a centrumbeli y1 mérések várható értékével. Nullhipotézis: Ellenhipotézis: A próbastatisztika (a kétmintás t-próba analógiájára): ahol: df: l: a modell paramétereinek a száma, kc: a centrumban végzett mérések száma
Példánkban: t0 < t0.025, elfogadjuk a nullhipotézist, nem kell másodfokú tag a modellbe.
A centrumban végzett mérések átlaga eltér a b0-tól, a modell nem adekvát.
4-2. példa Vizsgáljuk egy reaktorban a kitermelést négy faktor függvényében: z1 hőmérséklet 40 és 60°C z2 reakcióidő 10 és 20 min z3 kiindulási komponens koncentrációja 45 és 65% z4 nyomás 2 és 6 bar
A 24 kísérleti terv és a mérési eredmények:
A b1 paraméter kiszámítása: Hasonlóan a többi becsült paraméter: Az x1 faktor hatása:
A faktorok hatása:
A becsült regressziós sík egyenlete: A 16 kísérletből így csak öt paramétert becsültünk, lehetséges egy több paramétert tartalmazó kibővített függvény illesztése is: Interakciós tagok
A kibővített kísérleti terv: pl.:
Hasonlóan: Mindegyik paraméter szignifikánsan különbözik-e zérustól. (Gauss-háló)