Hipotézisvizsgálat (1. rész) Kontingencia táblák

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Hipotézis-ellenőrzés (Statisztikai próbák)
I. előadás.
Statisztika II. I. Dr. Szalka Éva, Ph.D..
Összetett kísérleti tervek és kiértékelésük
Rangszám statisztikák
A többszörös összehasonlítás gondolatmenete. Több mint két statisztikai döntés egy vizsgálatban? Mi történik az elsõ fajú hibával, ha két teljesen független.
Két változó közötti összefüggés
Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Gazdaságelemzési és Statisztikai Tanszék
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Az élővilág kutatásának matematikai, statisztikai eszköztára
Regresszióanalízis 10. gyakorlat.
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
III. Sz. Belgyógyászati Klinika
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Nem-paraméteres eljárások, több csoport összehasonlítása
ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. III. Dr. Szalka Éva, Ph.D..
Kvantitatív módszerek
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Az F-próba szignifikáns
Kvantitatív Módszerek
Valószínűségszámítás
Gazdaságstatisztika 14. előadás.
Hipotézis vizsgálat (2)
Statisztikai módszerek áttekintése módszerválasztási tanácsok Makara Gábor.
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Hipotézis vizsgálat.
Alapfogalmak.
Lineáris regresszió.
Többtényezős ANOVA.
Adatleírás.
t A kétoldalú statisztikai próba alapfogalmai

Diszkrét változók vizsgálata
Paleobiológiai módszerek és modellek 4. hét
I. előadás.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Vargha András KRE és ELTE, Pszichológiai Intézet
Bevezetés a méréskiértékelésbe (BMETE80ME19)
A számítógépes elemzés alapjai
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Kapcsolat vizsgálat II: kontingencia táblák jelentősége és használata az epidemiológiában, diagnosztikában: RR, OR. Dr. Prohászka Zoltán Az MTA doktora.
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
A számítógépes elemzés alapjai
Kiváltott agyi jelek informatikai feldolgozása 2016
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
Kvantitatív módszerek MBA és Számvitel mesterszak
Becsléselmélet - Konzultáció
I. Előadás bgk. uni-obuda
Kockázat és megbízhatóság
Gazdaságinformatikus MSc
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Mérési skálák, adatsorok típusai
Előadás másolata:

Hipotézisvizsgálat (1. rész) Kontingencia táblák Honlap: hhtp://xenia.sote.hu/hu/biometr/

Kérdések A tüdőrákos betegek hány százaléka dohányos? Mennyivel hatásosabb A gyógyszer, mint B gyógyszer? Mennyi a vérplazma T3 szint referencia értéke Budapesten? Azonos-e fiuk és lányok matematikai teljesítménye? Kevesebb-e a mellékhatása a „coxib” tipusú gyógyszereknek, mint a klasszikus NSAID vegyületeknek, krónikus izületi betegségekben? Hatásos-e az influenza elleni védőoltás?

A biometriai kérdések két nagy csoportja: Becslések A populáció (sokaság) tulajdonságai iránt érdeklődünk Mintavétel után a mintából megbecsüljük a populáció tulajdonságait (eloszlás, elhelyezkedés, szórás) Meghatározzuk becslésünk megbízhatóságát. Hipotézis vizsgálatok Mintát hasonlítunk egy elméleti értékhez Mintákat hasonlítunk egymáshoz Hipotéziseket állítunk fel (H0, H1, azaz 2 vagy több hipotézis) Meghatározzuk, mekkora kockázattal vállalunk hibás döntést Döntünk, hogy melyik hipotézist támasztják alá az adatok.

Becslések Átlag, medián, etc (elhelyezkedés, ) Szórás, átlag hibája, terjedelem, etc (szóródás, ) Konfidencia intervallum Példa: az átlag és annak 95% konfidencia intervalluma a. eset: ha ismert a populáció szórása () b. eset: a szórást is becsüljük

Az összehasonlítás tipusai Kontroll (placebo) és kezelés “Konvencionális” és új kezelés Ekvivalencia (x anyag - y anyag összehasonlítása) Dózis-hatás összefüggés Receptor kötés (kötési paraméterek) enzimaktivitás (enzim paraméterek) Kölcsönhatások vizsgálata

Hipotézis vizsgálat (statisztikai) Módszer arra, hogy meghatározzuk, hogy adatok mennyiben konzisztensek egy adott, vizsgált statisztikai hipotézissel Szakmai vita tárgya a statisztikát kutatók körében, hogyan érdemes vizsgálni a véletlen szerepét, hatását Több iskola van: klasszikus hipotézis vizsgálatok Bayesianus vizsgálatok, feltételes valószínűségeken alapulnak. Hasonló az egyszerű orvosi diagnózis felállításához Beteg Előzetes adatok (anamnézis, stb) néhány lehetséges betegség Vizsgálatok Diagnózis (legtöbbször: egy valószínű betegség) Kezelés

A módszer választáshoz útmutatás Függ: A kutatási kérdéstől Kísérleti elrendezéstől A mérés skálájától (nominális, rang, intervallum) Az elemszámtól Van-e különbség? 1 csoport 2 csoport 3, vagy több csoport Van-e összefüggés? Hány független változó van?

Kiinduló feltételezések A változó mérhető nominális skálán ordinális skálán numerikus skálákon A null hipotézis vonatkozhat az eloszlások azonosságára a mediánok azonosságára a szóródás azonosságára A minták száma Lehet 1, 2, >2

Egy klinikai példa D. E. Matthews and V Egy klinikai példa D.E. Matthews and V.T: Farewell: Using and understanding medical statistics. Karger 1996 Relapszus ráta: 4/259=0,015 1,5% de a jól sugarazottakban: 2/236=0,009 0,9% nem jól sugarazottakban: 2/23 =0,087 8,7%

A lehetséges táblák, ha a pirossal irott széli összegek rögzítettek 0. tábla 1. tábla 3. tábla 2. tábla 4. tábla

Az egyes táblák előfordulásának valószínűsége, ha a relapszusokra igaz, hogy r1=r2=rp H0: r1 = r2 , elfogadjuk, ha a megfigyelt különbségek csak a véletlennek tulajdoníthatók H1: r1<>r2 , elfogadjuk, ha a megfigyelt különbségek nagy valószínűséggel a valós populációs relapszus arányokat mutatják A 2. számú tábla a megfigyelt adatok táblája: Mi annak a valószínűsége, hogy 2, 3, vagy 4 relapszus forduljon elő a túl kicsi területen besugárzott 23 beteg között? Összeadjuk a 2, 3, és 4. Táblák valószínűségét: 0,0386+0,0023+0,0001 0,04

Fisher tesztben az egyes táblák valószínűsége, ha a feltételek teljesülnek és a jelölések a standard kontingencia táblának megfelelnek Feltételek: A null hipotézis teljesül bármelyik kimenetel egyformán valószínű Számitás a binomiális együttható (koefficiens) felhasználásával levezetés nélkül, ahol R1, C1, t, N a tábla adatai az 1. sor (row, R1) és az 1. cella (C1) jelöléssel, t a cellába éppen belekerült szám, N az összes adat. pt valószínűség, hogy az első cellába éppen t kerül.

A hipotézis vizsgálat kimenetele

A döntési küszöbök értékei Elsőfajú hiba (, alfa), második fajú hiba (, béta) A  meghatározása nehezebb oka, hogy sok (esetleg végtelen sok) alternatív hipotézis létezhet Ha az alternatív hipotézis igaz, akkor annak a null hipotézistől való “távolságától” függ a teszt ereje, és a  a módszer ereje (“power”) gyakran ismeretlen, illetve meghatározásához viszonylag sok ismeretre van szükségünk

Kontingencia táblák Fisher tesztje a 2x2-es táblára (pontos) Közelítő teszt (Khi négyzet, 2 teszt)

Khi négyzet próba kontingencia táblák vizsgálatára Feltételezések: a siker valószínűsége nem változik egyénenként a megfigyelések az egész populációra nézve függetlenek, azaz ha egy esemény bekövetkezik, az nem befolyásolja a következő eseményeket Célja: megállapítani, hogy a megfigyelt adatok mennyire konzisztensek a H0 hipotézissel, hogy H0: p1=p2, azaz a „siker” valószínűsége azonos a két csoportban Módszere: kiszámítjuk a várt (expected) tábla értékeit, és összehasonlítjuk a megfigyelt tábla értékeivel.

Standard kontingencia tábla Ahol R1>=R2 és C1 <= C2

Standard kontingencia tábla, a null hipotézis esetén várható értékek Ahol R1>=R2 és C1 <= C2

A T statisztika eloszlása megközelítőleg 2

Hipotézis vizsgálatra szolgáló módszerek választása (nem paraméteres eset, bevezető kurzus)