Varianciaanalízis 12. gyakorlat.

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Hipotézisvizsgálat az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi az adatok ismeretében megfogalmazódnak bizonyos hipotézisek erre.
Gyakorlati probléma 20 különböző gyógyszert próbálunk ki, t-próbával összehasonlítva a kezelt és a kontrol csoportot A nullhipotézis elfogadásáról vagy.
Egy faktor szerinti ANOVA
Összetett kísérleti tervek és kiértékelésük
Összetett kísérleti tervek és kiértékelésük: Háromszempontos variancia analízis modellek.
Rangszám statisztikák
Non-profit szervezetek bevételi szerkezetének elemzése.
Feladat Egy új kísérleti készítmény hatását szeretnék vizsgálni egereken. 5 féle dózist adnak be 5 vizsgált egérnek, de nem sikerült mindegyik egérnek.
Csoportosítás megadása: Δx – csoport szélesség
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Általános lineáris modellek
Általános lineáris modellek
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Kísérlettervezés DR. HUZSVAI LÁSZLÓ SELYE
Eltérés négyzetösszeg meghatározása
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Statisztika II. V. Dr. Szalka Éva, Ph.D..
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Az élővilág kutatásának matematikai, statisztikai eszköztára
Regresszióanalízis 10. gyakorlat.
SPSS többváltozós (lineáris) regresszió (4. fejezet)
SPSS többváltozós regresszió
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Nem-paraméteres eljárások, több csoport összehasonlítása
Kovarianciaanalízis Tételezzük fel, hogy a kvalitatív tényező(k) hatásának azonosítása után megmaradó szóródás egy részének eredete ismert, és nem lehet,
Kvantitatív módszerek
Adatmodellek A modellezés statisztikai alapjai. Statisztikai modell??? cél: feltárni, hogy bizonyos jelenségek között létezik-e az általunk feltételezett.
Nemparaméteres próbák Statisztika II., 5. alkalom.
Nemparaméteres próbák
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Egytényezős variancia-analízis
Az F-próba szignifikáns
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Többváltozós adatelemzés
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Lineáris regresszió.
Többtényezős ANOVA.
t A kétoldalú statisztikai próba alapfogalmai
Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek.
Paleobiológiai módszerek és modellek 4. hét
Többszempontos ANOVA (I
Petrovics Petra Doktorandusz
A szóráselemzés gondolatmenete
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
A számítógépes elemzés alapjai
Kapcsolat vizsgálat II: kontingencia táblák jelentősége és használata az epidemiológiában, diagnosztikában: RR, OR. Dr. Prohászka Zoltán Az MTA doktora.
Összetett kísérleti tervek és kiértékelésük Többszempontos varianciaanalízis-modellek (keresztosztályozások, blokkelrendezések)
A számítógépes elemzés alapjai
Paraméteres próbák- gyakorlat
Hipotézisvizsgálatok Paraméteres próbák
Lineáris regressziós modellek
Részekre bontott sokaság vizsgálata, gyakorló feladatok
Gazdaságstatisztika konzultáció
Kvantitatív módszerek
Szabályozott és képes termékek/szolgáltatások, folyamatok, rendszerek
Statisztika segédlet a Statistica programhoz Új verzióknál érdemes a View menüsor alatt a Classic menu-s verziót választani – ehhez készült a segédlet.
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Dr. Varga Beatrix egyetemi docens
3. Varianciaanalízis (ANOVA)
Előadás másolata:

Varianciaanalízis 12. gyakorlat

ANOVA: ANalysis Of VAriance Neve félrevezető: nem varianciák, hanem átlagok összevetésére dolgozták ki Lényegében a kétmintás t-próba kiterjesztése kettőnél több alapsokaság ismeretlen várható értékének az összehasonlítására.

Mit vizsgálunk az ANOVA-val: egy folytonos változónak vajon eltérőek-e a várható értékei egy nominális változó különböző kategóriáiban, avagy több nominális változó kategóriáiból képezhető kategória-kombinációkban. Folytonos változó: függő változó Nominális változó(k): magyarázó változók B faktor   B csop 1 B csop 2 B csop 3 A faktor A csop 1 A1B1 A1B2 A1B3 A csop 2 A2B1 A2B2 A2B3 Faktor (tényező), a kategóriák csoportok.

A faktorok számától függően beszélhetünk egyfaktoros (egytényezős, egy szempontos, egy utas, one-way ANOVA) többfaktoros (többtényezős, több szempontos, több utas, multi-way ANOVA) varianciaelemzésről. A csoportokban levő mintavételi objektumok száma ha azonos minden csoportban → kiegyensúlyozott (balanced) elrendezésű ANOVA eltérő a csoportokban → kiegyensúlyozatlan (unbalanced) elrendezésű ANOVA

A varianciaanalízis munkamenete: megvizsgáljuk, hogy van-e hatása a faktoroknak (F-próba) ellenőrizzük, hogy az adatainkra illesztett ANOVA modell teljesíti-e az alkalmazhatósági feltételeket ha a modellünk megfelel a feltételeknek, akkor ún. post-hoc teszteket alkalmazva megvizsgáljuk azt, hogy mely csoportok átlagai különböznek egymástól.

Egyfaktoros ANOVA kiegyensúlyozott elrendezéssel A módszer alapgondolata: A függő változó teljes varianciája additív módon felbontható két részre: csoportok közötti varianciára (between group variance) - a csoportátlagoknak az összevont Y adatok átlaga (ún. főátlag) körüli variációja; a magyarázó változó hatását foglalja magába csoporton belüli varianciára (within group variance) - az egyedi yi megfigyeléseknek az adott csoportjuk átlaga körüli ingadozásából eredő variáció; a véletlen eseti hibát foglalja magába. A véletlen eseti hibát és minden más nem mért, ismeretlen tényező hatását

yCl

Ha a faktornak van hatása Y-ra: a csoportok közötti variancia rész nagyobb, mint a csoporton belüli variancia. Ha nincs hatása Y-ra: a csoportok közötti variancia megegyezik a csoporton belüli varianciával ez azt jelenti, hogy Y értékét nem befolyásolja az, hogy egy megfigyelés a faktor melyik csoportjába tartozik, az Y értékei között tapasztalt különbségek a véletlen ingadozásnak tudhatók be.

Az egyes varianciafrakciók számszerűsítése eltérés-négyzetösszegekkel történik A teljes eltérés-négyzetösszeg (SStotal) a csoportok közötti (SSbetween) és csoporton belüli (SSwithin) eltérés-négyzetöszeg összege: A lineáris regressszóhoz hasonlítva: a csoportok közötti eltérés-négyzetösszeg a regressziós, míg a csoporton belüli pedig a hiba eltérés-négyzetösszegnek felel meg.

A függő változó teljes varianciája: A csoportok közötti variancia: A csoporton belüli variancia: melyben n a mintavételi objektumok száma; yi a függő változó értéke az i-dik mintavételi objektumra; Y.átl az összevont adatok átlaga, a főátlag. , ahol k a faktor csoportjainak száma; yj.átl a faktor j-dik csoportjában Y átlaga; Y.átl a főátlag. melyben k a faktor csoportjainak száma; m a k-dik csoportban a a mintavételi objektumok száma; y.jl a függő változó értéke a j-dik csoport l-dik mintavételi objektumán; yj.átl az j-dik csoportban a függő változó átlaga. Megjegyzendő, hogy kiegyensúlyozott elrendezésnél a mintában levő összes mintavételi objektum száma a csoportok számának és a mintavételi objektumok csoportonként számának (ez minden csoportra azonos) szorzata: n = k × m.

A faktor hatásának szignifikanciatesztje Próbastatisztika: A csoportok közötti és a csoporton belüli eltérés-négyzetösszeget osztva a szabadsági fokaikkal: közepes eltérés-négyzetösszegeket (Mean of Sum of squares). A csoportok közötti és a csoporton belüli közepes eltérés-négyzetösszeg hányadosa az F próbastatisztika (ld. a köv. dián!) H0: a csoportok alapsokaságbeli átlagai azonosak: µ1 = µ2 = … = µk H1: van legalább két olyan csoport, melyeknek különbözik az alapsokaságbeli átlaga. (egyoldali hipotézis!)

A variancia-felbontás és az F-próba eredménye - ANOVA-táblázat Variancia forrása Szabad- sági fok (df) Eltérés- négyzeösszeg SS (Sum of Squares) közepes eltérés- négyzetösszeg MS (Mean Sum of Squares) Próbastatisztika (F-value) p-érték Csoportok közötti (between groups) k-1 SSbetween MSbetween= SSbetween/k-1 F= MSbetwen/MSwithin p Csoporton belüli (within groups) k(m-1) SSwithin MSwithin= SSwithin/k(m-1) Teljes (total) k×m-1 SStotal MStotal=SStotal/k×m-1

Alkalmazhatósági feltételek: függetlenség: a mintavételi objektumok függetlenek egymástól normalitás: a csoportokon belül a függő változó normál eloszlású homogenitás: a csoportokban a függő változó szórása azonos, vagyis nincs összefüggés Y csoportbeli szórása és a csoport várható értéke között Az alkalmazhatósági feltételek ellenőrzése Az ANOVA modell feltételeinek ellenőrzése a regresszióelemzéshez hasonlóan a reziduálisok vizsgálatával történik