Hipotézisvizsgálat (1. rész) Kontingencia táblák Honlap: hhtp://xenia.sote.hu/hu/biometr/
Kérdések A tüdőrákos betegek hány százaléka dohányos? Mennyivel hatásosabb A gyógyszer, mint B gyógyszer? Mennyi a vérplazma T3 szint referencia értéke Budapesten? Azonos-e fiuk és lányok matematikai teljesítménye? Kevesebb-e a mellékhatása a „coxib” tipusú gyógyszereknek, mint a klasszikus NSAID vegyületeknek, krónikus izületi betegségekben? Hatásos-e az influenza elleni védőoltás?
A biometriai kérdések két nagy csoportja: Becslések A populáció (sokaság) tulajdonságai iránt érdeklődünk Mintavétel után a mintából megbecsüljük a populáció tulajdonságait (eloszlás, elhelyezkedés, szórás) Meghatározzuk becslésünk megbízhatóságát. Hipotézis vizsgálatok Mintát hasonlítunk egy elméleti értékhez Mintákat hasonlítunk egymáshoz Hipotéziseket állítunk fel (H0, H1, azaz 2 vagy több hipotézis) Meghatározzuk, mekkora kockázattal vállalunk hibás döntést Döntünk, hogy melyik hipotézist támasztják alá az adatok.
Becslések Átlag, medián, etc (elhelyezkedés, ) Szórás, átlag hibája, terjedelem, etc (szóródás, ) Konfidencia intervallum Példa: az átlag és annak 95% konfidencia intervalluma a. eset: ha ismert a populáció szórása () b. eset: a szórást is becsüljük
Az összehasonlítás tipusai Kontroll (placebo) és kezelés “Konvencionális” és új kezelés Ekvivalencia (x anyag - y anyag összehasonlítása) Dózis-hatás összefüggés Receptor kötés (kötési paraméterek) enzimaktivitás (enzim paraméterek) Kölcsönhatások vizsgálata
Hipotézis vizsgálat (statisztikai) Módszer arra, hogy meghatározzuk, hogy adatok mennyiben konzisztensek egy adott, vizsgált statisztikai hipotézissel Szakmai vita tárgya a statisztikát kutatók körében, hogyan érdemes vizsgálni a véletlen szerepét, hatását Több iskola van: klasszikus hipotézis vizsgálatok Bayesianus vizsgálatok, feltételes valószínűségeken alapulnak. Hasonló az egyszerű orvosi diagnózis felállításához Beteg Előzetes adatok (anamnézis, stb) néhány lehetséges betegség Vizsgálatok Diagnózis (legtöbbször: egy valószínű betegség) Kezelés
A módszer választáshoz útmutatás Függ: A kutatási kérdéstől Kísérleti elrendezéstől A mérés skálájától (nominális, rang, intervallum) Az elemszámtól Van-e különbség? 1 csoport 2 csoport 3, vagy több csoport Van-e összefüggés? Hány független változó van?
Kiinduló feltételezések A változó mérhető nominális skálán ordinális skálán numerikus skálákon A null hipotézis vonatkozhat az eloszlások azonosságára a mediánok azonosságára a szóródás azonosságára A minták száma Lehet 1, 2, >2
Egy klinikai példa D. E. Matthews and V Egy klinikai példa D.E. Matthews and V.T: Farewell: Using and understanding medical statistics. Karger 1996 Relapszus ráta: 4/259=0,015 1,5% de a jól sugarazottakban: 2/236=0,009 0,9% nem jól sugarazottakban: 2/23 =0,087 8,7%
A lehetséges táblák, ha a pirossal irott széli összegek rögzítettek 0. tábla 1. tábla 3. tábla 2. tábla 4. tábla
Az egyes táblák előfordulásának valószínűsége, ha a relapszusokra igaz, hogy r1=r2=rp H0: r1 = r2 , elfogadjuk, ha a megfigyelt különbségek csak a véletlennek tulajdoníthatók H1: r1<>r2 , elfogadjuk, ha a megfigyelt különbségek nagy valószínűséggel a valós populációs relapszus arányokat mutatják A 2. számú tábla a megfigyelt adatok táblája: Mi annak a valószínűsége, hogy 2, 3, vagy 4 relapszus forduljon elő a túl kicsi területen besugárzott 23 beteg között? Összeadjuk a 2, 3, és 4. Táblák valószínűségét: 0,0386+0,0023+0,0001 0,04
Fisher tesztben az egyes táblák valószínűsége, ha a feltételek teljesülnek és a jelölések a standard kontingencia táblának megfelelnek Feltételek: A null hipotézis teljesül bármelyik kimenetel egyformán valószínű Számitás a binomiális együttható (koefficiens) felhasználásával levezetés nélkül, ahol R1, C1, t, N a tábla adatai az 1. sor (row, R1) és az 1. cella (C1) jelöléssel, t a cellába éppen belekerült szám, N az összes adat. pt valószínűség, hogy az első cellába éppen t kerül.
A hipotézis vizsgálat kimenetele
A döntési küszöbök értékei Elsőfajú hiba (, alfa), második fajú hiba (, béta) A meghatározása nehezebb oka, hogy sok (esetleg végtelen sok) alternatív hipotézis létezhet Ha az alternatív hipotézis igaz, akkor annak a null hipotézistől való “távolságától” függ a teszt ereje, és a a módszer ereje (“power”) gyakran ismeretlen, illetve meghatározásához viszonylag sok ismeretre van szükségünk
Kontingencia táblák Fisher tesztje a 2x2-es táblára (pontos) Közelítő teszt (Khi négyzet, 2 teszt)
Khi négyzet próba kontingencia táblák vizsgálatára Feltételezések: a siker valószínűsége nem változik egyénenként a megfigyelések az egész populációra nézve függetlenek, azaz ha egy esemény bekövetkezik, az nem befolyásolja a következő eseményeket Célja: megállapítani, hogy a megfigyelt adatok mennyire konzisztensek a H0 hipotézissel, hogy H0: p1=p2, azaz a „siker” valószínűsége azonos a két csoportban Módszere: kiszámítjuk a várt (expected) tábla értékeit, és összehasonlítjuk a megfigyelt tábla értékeivel.
Standard kontingencia tábla Ahol R1>=R2 és C1 <= C2
Standard kontingencia tábla, a null hipotézis esetén várható értékek Ahol R1>=R2 és C1 <= C2
A T statisztika eloszlása megközelítőleg 2
Hipotézis vizsgálatra szolgáló módszerek választása (nem paraméteres eset, bevezető kurzus)