Összetett kísérleti tervek és kiértékelésük:

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük: Háromszempontos variancia analízis modellek.
Advertisements

Összetett kísérleti tervek és kiértékelésük Többszempontos varianciaanalízis-modellek (keresztosztályozások, blokkelrendezések)
Motiváció a kísérlet előtt Motiváció a kísérlet után Iskolai kötődés a kísérlet előtt Iskolai kötődés a kísérlet után Iskolai kötődés motiváció kontroll.
Számvitel S ZÁMVITEL. Számvitel Ormos Mihály, Budapesti Műszaki és Gazdaságtudományi Egyetem, Hol tartunk... Hiányzik egy jól strukturált rendszer.
TÖMÖRÍTÉS. Fogalma A tömörítés egy olyan eljárás, amelynek segítségével egy fájlból egy kisebb fájl állítható elő. A tömörítési arány függ a fájl típusától,
Gazdaságstatisztika, 2015 RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA Gazdaságstatisztika október 20.
NRC Omnibusz – november. Okostelefon használat  A éves internetezők 64%-a használ okostelefont (saját/céges okostelefont, vagy más készülékét).
Paraméteres próbák- konzultáció október 21..
Gazdasági informatika - bevezető
Palotás József elnök Felnőttképzési Szakértők Országos Egyesülete
Reflexiók a társadalmi és a nonbusiness marketing fogalmi kérdéseihez
tananyag =előadások és gyakorlatok anyaga (írott és elmondott is)
Muraközy Balázs: Mely vállalatok válnak gazellává?
A kérdőívek, a kérdőívszerkesztés szabályai
2. előadás Viszonyszámok
Adatbázis normalizálás
Leíró statisztika Becslés
Becslés gyakorlat november 3.
Mintavétel és becslés október 25. és 27.
A FELÜGYELŐBIZOTTSÁG BESZÁMOLÓJA A VSZT
videós team Team vezetője: Tariné Péter Judit Tagok:
A szórás típusú egyenlőtlenségi mutatók
Egy üzemben sok gyártósoron gyártanak egy bizonyos elektronikai alkatrészt. Az alkatrészek ellenállását időnként ellenőrzik úgy, hogy egy munkás odamegy.
Kockázat és megbízhatóság
Becsléselmélet - Konzultáció
Struktúra predikció ápr. 6.
Mintavételes eljárások
Csak nem-szignifikáns próba
Kvantitatív módszerek
Hipotézisvizsgálat.
A földrajzi kísérletek szervezése és végrehajtása
Mintavételes eljárások
Gazdaságstatisztika Korreláció- és regressziószámítás II.
SZÁMVITEL.
Tartalékolás 1.
Összefüggés vizsgálatok
Varianciaanalízis- ANOVA (Analyze Of VAriance)
dr. Jeney László egyetemi adjunktus Európa regionális földrajza
Kvantitatív módszerek
Kvantitatív módszerek
Standardizálás.
Algoritmusok és Adatszerkezetek I.
Érték-, ár-, volumenindexek
Regressziós modellek Regressziószámítás.
Rendszerfejlesztés gyakorlat
Sztochasztikus kapcsolatok I. Asszociáció
Tájékoztató az Önkormányzati ASP Projektről
Informatikai gyakorlatok 11. évfolyam
Készletek - Rendelési tételnagyság számítása -1
Környezeti Kontrolling
A csoportok tanulása, mint a szervezeti tanulás alapja
Gazdaságinformatikus MSc
3. előadás.
Szerzője Konzulens neve
Megfigyelés és kísérlet
Alkalmazott statisztikai alapok
SZAKKÉPZÉSI ÖNÉRTÉKELÉSI MODELL I. HELYZETFELMÉRŐ SZINT FOLYAMATA 8
Járműtelepi rendszermodell 2.
A szállítási probléma.
Dr. Varga Beatrix egyetemi docens
Matematika 11.évf. 1-2.alkalom
Paraméteres próbák Adatelemzés.
Lorenz-görbe dr. Jeney László egyetemi adjunktus
Kísérlettervezés 2018/19.
3. előadás.
Áramlástan mérés beszámoló előadás
A geometriai transzformációk
Pszichológia BA műhelymunka és szakdolgozat tájékoztató
Vargha András KRE és ELTE, Pszichológiai Intézet
Intuitív szakértői módszerek
Előadás másolata:

Összetett kísérleti tervek és kiértékelésük: Két és több szempontos variancia analízis modellek Elején elméleti lehetőségek ismertetése Utána rövid ismétlés: a variancia analízis alapjai.

Miért tervezzünk több szempontos ANOVÁt? A „szempont”: független, csoportosítási változó, hatását keressük A hatást vizsgáljuk, egy vagy több változóként függő, mért vagy megfigyelt Ha teljesülnek a feltételezések, akkor a leghatékonyabb eljárás Jobban véd a véletlen okozta tévedésektől, mint a sok egyszerűbb vizsgálat Többszörös összehasonlítások veszélyeiről most nem beszélek

Sok féle ANOVA van Egy szempontos – egy csoportosító, kategória változó Több szempontos – több csoportosító változó Például 2x2: férfi - nő és kontroll - kezelt Egy változós – egy a mért, függő változó Több változós – egy alanyon n ≥ 2 mért függő változó Repeated measures – alanyok többszöri kezelése vagy mérése Randomizált blokk elrendezésű Kovarianciaanalízis (ANCOVA), függő segédváltozóval Változókról beszélünk mind a két oldalon: csoportosító és mért változókról Az egyes kezelések egymástól való függetlensége is fontos elem, az ANOVA feltételei között szerepel!. Gazdaságos, jobb hatásfokú a több szempont együttes tervezett vizsgálata. Jó hatásfokú, ha a szóródást kontrollálni tudjuk: blokk kialakítása, repeated, kovariáns mérése

A szempontok és a mérések Csoport Mérés A1 M1 M2 …. … A2 M3 M4 A3 M5 M6 A4 M7 M8 Csoport Mérés A1 B1 C1 M1 N1 O1 C2 M2 N2 O2 C3 M3 N3 O3 B2 M4 N4 O4 M5 N5 O5 M6 N6 O6 A2 M7 N7 O7 M8 N8 M9 N9 O9 M10 N10 O10 M11 N11 O11 M12 N12 O12 Minden egyes sor – egy különböző egyén/alany. Ha 4 kezelésünk van ez rendszerint egy kontroll és 3 vizsgálat csoport. Ha három szempontunk van és akár több mérésünk minden alanyon, akkor itt egy 2x2x3 kezeléses elrendezés, minden egyénen 3 méréssel.

Illusztráció a négyzetes összeg felbontásához Adat = véletlen komponens Átlag csoportosítási komponens Nagy átlag Ismételjük át az elvi alapokat: A négyzetes összeg gondolati összetevői: az adat távolságai. A távolság összegezhető, elemeire bontható rögzített érték Egy vizsgált csoport

A négyzetes összeg felbontása, viszonya a varianciához A minta elemek szórásában összetevőket vizsgálunk négyzetes eltéréseket (adat átlagtól mért távolságát) összegzett négyzetes eltéréseket "átlagos" négyzetes eltérés a variancia A variancia négyzetgyöke a szórás (standard deviáció). A négyzetes összeg particionálható, felbontható (additív) komponensekre Az átlagolt négyzetes összegek (variancia = szórásnégyzet) általában nem additívak, mert súlyozottan átlagoltak A komponensek a szóródást létrehozó különféle tényezőkről, vizsgálandó "okokról" tájékoztatnak gondolati sorrend: miből áll össze a szóródás? Hogyan bontjuk hasznos összetevőkre? Ezekből a kezelések hatását jellemző átlagos távolságokat számolunk, amelyek a belső varianciával osztva adnak használható (F) statisztikát.

A négyzetes összeg összetevői egy szempont esetén Az A szempont szóródása A véletlen okozta szóródás

A négyzetes összeg összetevői két szempont esetén Az A szempont szóródása A B szempont szóródása Az A x B szempontok kölcsönhatásának szóródása A véletlen okozta szóródás

A négyzetes összeg összetevői három szempont esetén Az A szempont szóródása A B szempont szóródása A C szempont szóródása A szempontok (A, B, C) kölcsönhatásainak szóródása A véletlen okozta szóródás

ANOVA modellek Ahol: i, j, k, l jelöli azt hogy a többes előfordulásból melyikről beszélünk xijkl, stb = Az egyes megfigyelések értéke (például x2,5 a második csoportban az 5. megfigyelés M = nagyátlag A, B, C = a kezelések szempontjai, amin belül 2, vagy több kezelés lehet (i darab, j darab, k darab) A x B jelöli az A és B szempontba sorolt kezelések kölcsönhatásait  jelzi a véletlennek tulajdonítható, normál eloszlású szóródás változóját Az egy, kettő, három szempontos modell képletei így könnyen összehasonlíthatók. Ne ijedjenek meg az indexektől. Az utolsó tag mindig a csoportokon belüli szóródást jelöli, a legnagyobb elemszámú kellene legyen A bal oldalon egy x-el jelölt megfigyelés van, a jobb oldalon azok a részek, amiből ez az egy megfigyelés összeáll.

Az egyszempontos ANOVA modellje Ai lehet rögzített érték, a kezelés adott nagyságú hatása Ai lehet véletlentől függő valószínűségi változó maga is

Több szempontú analizisek Fix modellek Két szempontú osztályozás Tovább bontja a kezelések négyzetes összegét, magyarázva két kezelés-osztályt Véletlen szempont (II. típusú modell) Például a reprodukálhatóság, a pontosság mérése A két féle ANOVA kissé más elemző módszert és értékelést igényel

Két szempontos ANOVA elrendezése (kezelések kiosztása 3x4-es esetben) B szempont  A szempont  B1 B2 B3 B4 A1 A1B1 (n11) A1B2 (n12) A1B3 (n13) A1B4 (n14) A2 A2B1 (n21) A2B2 (n22) A2B3 (n23) A2B4 (n24) A3 A3B1 (n31) A3B2 (n32) A3B3 (n33) A3B4 (n34) Mindegyik cellában legyen megfigyelés, nem kötelező, de ajánlott, hogy mindenütt kb. ugyanannyi

Két szempontos ANOVA feltételezései xij=Nagyátlag+Ai+Bj+(AxB)ij+ij (ahol (AxB)ij az Ai és Bj kezelések interakciója) Feltételezések 1. A mérések populációi normális eloszlásúak 2. a mérések populációinak eloszlásai homogének 3. A megfigyelések egymástól függetlenek. 4. A szórások nem különbözőek (homoscedascitás) Hipotézis(ek) A nullhipotézis Ai=Bj=(AiBj)=0, (ij) =0, minden i-re és j-re Az alternativ hipotézis Ai, Bj, (AiBj) <>0, (ij) =0, legalább egy i-re vagy j-re Itt a két szempontú kezelést egymástól függetlenül valósítjuk meg. Minden lehetséges kombinációt alkalmazunk. A feltételezések ugyanazok, mint az egy szempontos ANOVÁnál A hipotézisek kisség bővültek, a modell minden összetevőjére kell null-hipotézis is, elemzés is.

ANOVA tábla Forrás sz.fok(df) Négyzetes összeg variancia F P A kezelés QA s2A s2A/s2b B kezelés j-1 QB s2B s2B/s2b AxB interakció (i-1)*(j-1) QAB s2AB s2AB/s2b Mintákon belül ij(n-1) s2b Összes ijn-1 Qö S2ö A lábjegyzetben az angol terminológia, ahol a négyzetes összeg: sum of squares A mintákon belüli varianciával osztjuk a többi varianciát, hogy megkapjuk az F értéket., aminek két szabadságfoka van, a számláló és a nevező szabadságfoka. Négyzetes összeg= Sum of Squares (SS) Variancia=Mean Squares (MS), (SSwithin) másképpen (SSerror), (MSwithin) másképpen (MSerror)

Példa: plazma kortikoszteron (μg/dl) stresszben

A szempontok és a mérések Csoport Mérés A1 M1 M2 …. … A2 M3 M4 A3 M5 M6 A4 M7 M8 Csoport Mérés A1 B1 C1 M1 N1 O1 C2 M2 N2 O2 C3 M3 N3 O3 B2 M4 N4 O4 M5 N5 O5 M6 N6 O6 A2 M7 N7 O7 M8 N8 M9 N9 O9 M10 N10 O10 M11 N11 O11 M12 N12 O12 Minden egyes sor – egy különböző egyén/alany. Ha 4 kezelésünk van ez rendszerint egy kontroll és 3 vizsgálat csoport. Ha három szempontunk van és akár több mérésünk minden alanyon, akkor itt egy 2x2x3 kezeléses elrendezés, minden egyénen 3 méréssel.

Ez a kép mutatja a STATISTICA programban a két féle elrendezést és a mért adatokat. Ebből a fájlból mind két elemzés elvégezhető egymás után. A szoftverhasználat buktatói: q faktoriális modell alkalmazandő. Kivétel, ritka…

Faktoriális ANOVA Célja Számos faktor hatásainak és interakciójának szimultán vizsgálata. A legegyszerübb elrendezésben k darab faktort, mindegyiket 2 szinten vizsgálunk Feltételezések Az xijkl megfigyelés additív összetevői: Pl. k=3 esetén: xijkl=Nagyátlag+Ai+Bj+Ci+(AxB)ij+(AxC)ik+(BxC)jk+(AxBxC)ijk+ijkl (ahol AxB stb. a faktorok interakciója) Feltételek: A megfigyelések egymástól függetlenek, a mérések populációi normális eloszlásúak stb. Hipotézisek A nullhipotézisek: a vizsgált faktor szintjeinek hatásában nincs különbség, illetve a vizsgált kölcsönhatás nem lép fel (Ai=0 stb.) Az alternativ hipotézis ezek tagadásai („van (kölcsön)hatás”). Megjegyzések Sok mérés kell hozzá. Minél több a faktor, annál nehezebb az egyöntetûség biztosítása. Többszintû interakciók vannak a kísérleti elrendezésben, ezek néha nehezen értelmezhetők. Most általánosíthatunk a kettőnél több szempont esetére.

Háromszempontos ANOVA tábla Az ANOVA tábla összesíti, áttekinthetővé teszi a részleteket. Zárójelben meghagytam az angol rövidítéseket. Az ANOVA táblák kimentek a divatból, most kezdenek visszatérni, a supplement fájlok korszakában, amikor be kell mutatni az eredeti adatokat és a statisztikai elemzést is, minden közlemény mellett/mögött.

Randomizált blokk ANOVA elrendezés Valamilyen ismert tényező szerint homogén blokkokat képezünk, a blokkokon belül a kezeléseket (mindegyikből azonos számút) randomizáltan osztjuk el. Példa: 4 kezelés (A1,..,A4) elrendezése 3 blokkban (B1, B2, B3), ahol minden blokkon belül több megfigyelést végzünk. A példa lehet egyszempontú, de lehetne két szempontú (2x2-es) ANOVA is. Most következnek azok a finomítások, amelyeknek célja a kutatás hatásfokának növelése, a szóródás zavaró hatásának csökkentése. A blokkokban csoportosítás minden kutatási tervben mérlegelhető, természetesen figyelembe kell venni elemzésnél

Szövettenyésztő tálca

Egy szempontos ANOVA randomizált blokkban Értelmezés, az interakció kezelése Két kezelés esetében az egymintás t próbával equivalens. Az analízis célja az A kezelés vizsgálata, azon belül, szignifikáns F érték esetében a többszörös összehasonlítás. Az esetleges interakció problémás, mert akkor jó az ilyen elrendezés, ha a blokkokban csoportosított tulajdonság nincs interakcióban a kezelésekkel. Interakció észlelésekor annak okát fel kell deríteni, és az adatokat a teljesen randomizált, nem blokk elrendezés szerint értékelni. Ha az interakció nem szignifikáns, akkor annak szabadságfokát, és négyzetes összegét a véletlennek tulajdonítható particióba vonhatjuk be ( angolul pool, pooling), javitva a véletlen ingadozás becslését. Jó módszer A STATISTICA program poolingra ad lehetőséget.

Randomizált blokk elrendezés Jelölés: Blokk=B, véletlen változó, ami szóródást okoz Az xij megfigyelés additív összetevői: Xij=Nagyátlag+Ai+Blokkj+(AxBlokk)ij+ij (ahol AxBlokk az Ai és Bj interakciója) Feltételezések A mérések populációi normális eloszlásúak a mérések populációinak eloszlásai homogének 3. A megfigyelések egymástól függetlenek. A null hipotézis Ai=Bj=(AiBj)=0, (ij) =0, minden i-re és j-re Az alternativ hipotézis Ai, Bj, (AiBj) <>0, (ij) =0, legalább egy i-re vagy j-re A korábbiak mintájára. A blokk hatás akkor érdekes, ha szignifikáns és nincs interakcióban.

Egy szempontos, randomizált blokk ANOVA: "Rejtett" két szempontú ANOVA

"Repeated measures" ANOVA Az önkontrollos kisérletezésnek esete is ide tartozik, egyszerű példa a párosított minták t próbája. Amikor minden egyes kisérleti alanyon több mérést végeznek, és a kisérleti kezelések (szempontok) egy része az egyes alanyokon végzett több mérésre vonatkozik. A randomizált blokk elrendezés is egy ide tartozó sajátos eset: a megfeleltetés a blokkon belüli, a blokkok véletlentől függenek Keveredhet az alanyok közötti és az alanyokon/blokkon belüli kezelés Fontos, hogy az ebbe a csoportba tartozó elrendezések nem kezelhetők úgy, mintha az egyes mért változók egymással nem lennének kapcsolatban. Nem függetlenek az időben ismételt megfigyelések. A mért változók közötti összefüggések lehetősége miatt külön eljáráscsoport alkalmazandó, vagy olyan általános ANOVA modell, amely a repeated measures szempontokat tartalmazó feladatokat a ANOVA/MANOVA (multivariate analysis of variance) eljárással oldja meg. Ez a legbonyolultabb a kérdések közül. Példákkal - a következő óra anyaga lesz A szoftverhasználat buktatókat is rejtegethet.

A randomizált block és a repeated measures összehasonlítása Mind a kettő a véletlen szóródást csökkenti A randomizált blokk a blokk random változó a blokk egy szempont A blokk nem szerepel a kutatási hipotézisben A repeated measures ANOVA a repeated változó fix faktor több repeated változó lehet A repeated változó(k) része(i) a kutatási hipotézisnek