ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.

Slides:



Advertisements
Hasonló előadás
Események formális leírása, műveletek
Advertisements

Hipotézis-ellenőrzés (Statisztikai próbák)
A pedagógiai kutatás módszertana
I. előadás.
II. előadás.
2006. február 17. Valószínűségszámítás és statisztika II. Telefonos feladat Egy kalapban van két korong, az egyiknek mindkét oldala piros, a másiknak.
Egy faktor szerinti ANOVA
A ÉVI ORSZÁGOS KOMPETENCIAMÉRÉS ISKOLAI EREDMÉNYEI.
Két változó közötti összefüggés
1. A mérési adatok kezelése
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Microsoft Excel 2010 Gyakoriság.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
A középérték mérőszámai
Az élővilág kutatásának matematikai, statisztikai eszköztára
PTE PMMK Matematika Tanszék dr. Klincsik Mihály Valószínűségszámítás és statisztika előadások Gépész-Villamosmérnök szak BSc MANB030, MALB030 Bevezető.
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
Diagnosztikai tesztek szenzitivitása és specificitása, pozitív és negatív prediktív értéke, ROC analízis, a klinikai döntéshozatal folyamata.
III. Sz. Belgyógyászati Klinika
Diagnosztikai tesztek szenzitivitása és specificitása, pozitív és negatív prediktív értéke, ROC analízis, a klinikai döntéshozatal folyamata.
A klinikai epidemiológia statisztikai módszerei, minta és populáció, konfidencia intervallumok Dr Füst György.
HOGYAN OLVASSUNK KRITIKUSAN ORVOSI FOLYÓIRATOKBAN MEGJELENT CIKKEKET?
Hipotézisvizsgálat (1. rész) Kontingencia táblák
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Statisztika II. III. Dr. Szalka Éva, Ph.D..
Matematikai alapok és valószínűségszámítás
Matematikai alapok és valószínűségszámítás
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Az F-próba szignifikáns
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Statisztika.
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Valószínűségszámítás
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Statisztikai módszerek áttekintése módszerválasztási tanácsok Makara Gábor.
Következtető statisztika 9.
Alapsokaság (populáció)
Hipotézis vizsgálat.
Alapfogalmak.
Adatleírás.
t A kétoldalú statisztikai próba alapfogalmai

Diszkrét változók vizsgálata
© Farkas György : Méréstechnika
Költség-minimalizálás az ellenőrző kártyák alkalmazásánál Feladatmegoldás, kiegészítés.
I. előadás.
Statisztikai alapfogalmak
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Bevezetés a méréskiértékelésbe (BMETE80ME19) Intervallumbecslések 2014/
Mérési szótár, illetve útmutató
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Korreláció-számítás.

Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Kapcsolat vizsgálat II: kontingencia táblák jelentősége és használata az epidemiológiában, diagnosztikában: RR, OR. Dr. Prohászka Zoltán Az MTA doktora.
II. előadás.
Becsléselmélet - Konzultáció
I. Előadás bgk. uni-obuda
Gazdaságinformatikus MSc
Előadás másolata:

ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György

I. RÉSZ. A minta és a populáció viszonya

Az arány konfidencia intervalluma Az 1999. júliusi egyik közvélemény kutatás szerint 2002-ben Bergengóciában a választók 33%-a szavaz majd a Nemzeti Bergengóc Pártra (NBP)-re. 100 %-os biztonsággal akarjuk tudni előre az eredményt. Ez lehetetlen, hiszen csak az 100%-osan biztos, hogy a választók 0-100%-a szavaz majd az MBP-re. Könnyen belátható, hogy ennek nincs értelme, a szélsőértékek valószínűsége extrém módon alacsony. Ezért szűkíteni kell az interavallumot, racionális valószínűségi értékekkel kell dolgozni, ilyen pl. a 95%-os vagy 99%-os valószínűség.

Az arány konfidencia intervalluma (folyt.) 95%-os konfidencia intervallum: 95% annak a valószínûsége, hogy a szavazók majdani aránya a jelenlegi minta (33%) konfidencia intervallumába esik, tehát 5% annak a valószínûsége, hogy nem esik ebbe a tartományba. 99%-os konfidencia intervallum: 95% annak a valószínûsége, hogy a szavazók majdani aránya a jelenlegi minta (33%) konfidencia intervallumába esik, tehát 1% annak a valószínûsége, hogy nem esik ebbe a tartományba.

Az előfordulási gyakoriság konfidencia intervalluma Az 1999. júliusi egyik közvélemény kutatás szerint 2002-ben Bergengóciában a választók 33%-a szavaz majd a Bergeni Bergengóc Pártra (BBP)-re. 100 %-os biztonsággal akarjuk tudni előre az eredményt. Ez lehetetlen, hiszen csak az 100%-osan biztos, hogy a választók 0-100%-a szavaz majd az BBP-re. Könnyen belátható, hogy ennek nincs értelme, a szélsőértékek valószínűsége extrém módon alacsony. Ezért szűkíteni kell az interavallumot, racionális valószínűségi értékekkel kell dolgozni, ilyen pl. a 95%-os vagy 99%-os valószínűség.

Az előfordulási gyakoriság konfidencia intervalluma (folyt.) 95%-os konfidencia intervallum: 95% annak a valószínûsége, hogy a szavazók majdani aránya a jelenlegi minta (33%) konfidencia intervallumába esik, tehát 5% annak a valószínűsége, hogy nem esik ebbe a tartományba. 99%-os konfidencia intervallum: 95% annak a valószínűsége, hogy a szavazók majdani aránya a jelenlegi minta (33%) konfidencia intervallumába esik, tehát 1% annak a valószínûsége, hogy nem esik ebbe a tartományba.

A KONFIDENCIA INTERVALLUM ((megbízhatósági tartomány) Mérni csak a mintát tudjuk, de az egész mérésnek csak akkor van értelme, ha a mintából a populációra tudunk következtetni.!!! A teljes populációt vagy soha sem fogjuk megismerni (pl. minta = a Kútvölgyi Kórházban eradikált H. pylori infekciók, populáció = az összes magyar (európai, fejlett országokban lévő, valamennyi) kórházában eradikált H. pylori infekciók) vagy a mintavétel időpontjában még nem ismerhetjük, de később ismeretessé válik (minta = exit poll, populáció = valamennyi szavazni elment választó). Az orvostudományban csak az első eset lehetséges. Konfidencia intervallum: a mintában végzett mérés alapján a teljes populációra vonatkozó becslés pontossága

Az arány, átlag vagy bármely más statisztikai paraméter konfidencia intervalluma = annak a valószínűsége, hogy a mért paraméter százalékos előfordulása, átlaga, stb. a populáción belül egy adott, a mintában mért százalékos előfordulást, átlagot, stb. körülvevő tartományba esik. 95%-os konfidencia intervallum: 95% annak a valószínűsége, hogy a mért paraméter valódi előfordulási gyakorisága (átlaga, stb.) a populáción belül a mintában mért előfordulási gyakoriság (átlag) konfidencia intervallumába esik, tehát 5% annak a valószínűsége, hogy nem esik ebbe a tartományba.

Milyen határok között változik ez a konfidencia intervallum (CI)? A mintában mért arány (p): 0.33, tételezzük fel, hogy 1000 embert kérdeztek meg, ennyi a minta elemszáma (N). A binomiális eloszláson alapuló képlet szerint: A CI alsó és felső határa tehát: 0.33-0.029=0.301, ull. 0.33+0.029=0.359, tehát 30 és 36% között van annak a CI-a, hogy a szavazók a BBP-ot válasszák

Arányok arányának a CI-a, a CI és a szignifikancia viszonya Ha két arány arányát számítjuk ki, akkor az érték nemcsak 0.00 és 1.00 között változhat. Pl. a Konzervatív Bergengóc Fórumra (KBF) a közvélemény kutatás szerint 17% fog szavazni, a BBP és a KBF szavazóinak aránya a mintában tehát 0.33/0.17=1.94. Az arányok arányának (nevezzük esély hányadosnak, odds rationak) a 95% CI-a 1.092 és 3.567 között változik, tehát lehet, hogy majdnem ugyanennyien szavaznak majd a két pártra, de az is lehet, hogy a BBP-ra csaknem négyszer többen, mint a KBF-ra.

Az arányok arány (odds ratio) az orvos gyakorlatban Ugyanez a helyzet a betegségek esetében is. Pl. bizonyos genetikai markereket hordozó és nem hordozó egyének esélye arra, hogy egyes betegségeket, pl. coronaria betegséget vagy stroke-ot kapjanak igen tág határok között változhat, és különböző mintavételek is sokszor eltérő eredményeket mutatnak. Ezt a metaanalízis cikkekből könnyen, ránézésre meg lehet állapítani, HA TUDJUK A KÖVETKEZŐKET. Ha a CI alsó és felső határa is 1 alatt vagy 1 felett van, akkor a hordozók és nem-hordozók esélye arra, hogy megbetegedjenek szignifikánsan különbözik, ha viszont nem akkor nem lehetünk biztosak abban, hogy a különbség valóban fennáll-e. Wu et al., Am. J Cardiol. 87, 1361, 2001.

Miért nem lehet az 1 érték szignifikáns különbség esetén a CI-on belül? Ha az esélyhányados 95%-os CI-a magában foglalja az 1-et (nincs különbség) , ez azt jelenti, hogy kevesebb, mint 95% annak a valószínűsége, hogy az adott génpolimorfizmus hordozóinak és nem-hordozóinak az esélye pl. a stroke-ra nem azonos. Ha viszont ez a helyzet, akkor az esélyhányados nem lehet szignifikáns, A null-hipotézist nem vethetjük el, tehát a p>0.05.

Az OR CI-jának és a szignifikanciájának a viszonya Ha a 95%-os CI alsó vagy felső határa=1, akkor a p0.05 vagy ennek a közelében van. Ha a CI felső határa is <1, akkor annál szignifikánsabb az odds ratio (a hordozók esélye a nem hordozókhoz hasonlítva az adott betegségre) minél távolabb van ez az 1-től, és ua. a helyzet akkor is, ha a CI alsó határa is >1

A GÉNHIBA RITKÁBB A BETEGEKNÉL, P<0.05 CI felső 0,25 CI alsó 0,5 1 Génhiba gyakoriság aránya a betegek és a kontrollok között

Génhiba gyakoriság aránya a betegek és a kontrollok között A GÉNHIBA RITKÁBB A BETEGEKNÉL, DE A KÜLÖNBSÉG A SZIGNIFIKANCIA HATÁRÁN VAN P=0.05 CI alsó CI felső 0,25 1 0,5 Génhiba gyakoriság aránya a betegek és a kontrollok között

Génhiba gyakoriság aránya a betegek és a kontrollok között A GÉNHIBA NEM RITKÁBB, DE NEM IS GYAKORIBB A BETEGEKNÉL, A KÜLÖNBSÉG NEM SZIGNIFIKÁNS P>0.05 CI alsó CI felső 0,5 2 1 Génhiba gyakoriság aránya a betegek és a kontrollok között

Az átlag különbségek CI-ának kiszámítása A CI alsó határa A CI felső határa MIÉRT NEM ESHET A NULLA A CI ALSÓ ÉS FELSŐ HATÁRA KÖZÉ, HA AZ ÁTLAGOK KÜLÖNBSÉGE SZIGNIFIKÁNSAN KÜLÖNBÖZIK A KONTROLLBAN KAPOTTÓL?

Két csoport átlagai különbségének CI-a A null hipotézis szerint a két csoport vizsgált változójának (egy adott laboratóriumi érték, pl. vvs-süllyedés) átlagai között nincs különbség. Tehát, ha a 95%-os CI-a a 0-t magában foglalja, akkor 95%-os vagy ennél nagyobb a valószínűsége annak, hogy ez a feltétel valóban teljesül, a null hipotézist nem vethetjük el, a két csoport között nincs szignifikáns különbség, p>0.05. Ha viszont nem foglalja magában, akkor valószínűleg p<0.05

A HSP60 ANTITEST SZINT MAGASABB A BETEGEKNÉL, P<0.05 CI felső CI alsó 500 1000 Hsp60 antitest szint különbség átlaga a betegek és a kontrollok között, AU/ml

A HSP60 ANTITEST SZINT ÁTLAGA MAGASABB A BETEGEKNÉL, DE A KÜLÖNBSÉG A SZIGNIFIKANCIA HATÁRÁN VAN P=0.05 CI alsó CI felső 400 200 Hsp60 antitest szint különbség átlaga a betegek és a kontrollok között, U/ml

A HSP60 ANTITEST SZINTJE NEM MAGASABB, DE NEM IS ALACSONYABB A BETEGEKNÉL, A KÜLÖNBSÉG NEM SZIGNIFIKÁNS P>0.05 CI alsó CI felső -100 200 Hsp60 antitest szint különbség átlaga a betegek és a kontrollok között, AU/ml

II. RÉSZ A statisztikai tesztek kiválasztása során adódó legfontosabb problémák   Normál (gaussi) eloszlású-e a populáció? Paraméteres vagy nem paraméteres tesztet válasszunk? Egyoldalú vagy kétoldalú próbához tartozó p értéket válasszunk? Párosított (ismételt méréshez tartozó) tesztek (egymintás t, repeated measures ANOVA) alkalmazása Fisher exact teszt vagy 2 próba

Normál (gaussi) eloszlású-e a populáció? Hogyan lehet ezt megállapítani? 1. Ránézésre (gyakorisági diagram) 2. Számítással (Kolmogorov-Smirnov teszt). Ez a teszt azt számítja ki, hogy az adott minta eloszlása szignifikánsan különbözik-e a normál eloszlástól. Az eredményt KS (Kolmogorov-Smirnov) távolság formájában fejezi ki. Null-hipotézis: a minta valóban normál eloszlású populációból származik, a p érték annak a valószínűségét fejezi ki, hogy ebben az esetben egy újabb mintában a véletlen az észleltnek megfelelő vagy ennél nagyobb KS távolságot eredményezzen. Ha a KS távolság: 0, akkor a minta biztosan normál eloszlású populációból származik.

Normál (gaussi) eloszlású-e a populáció? (folyt) Az értelmezés három lehetősége: a p érték kevesebb, mint 0,05, ekkor függetlenül a minta nagyságától kimondható, hogy a minta nem normál eloszlású populációból származik a p érték több, mint 0,05 vagy 0,10 (tovább a teszt nem számol) és a minta nagy (N  100): valószínű, hogy a minta normál eloszlású populációból származik. ITT AZONBAN BELÉP A STATISZTIKA EGYIK NAGY PARADOXONA: ILYEN NAGY ELEMSZÁMNÁL MÁR MINDEGY, HOGY NORMÁL ELOSZLÁSÚ-E A POPULÁCIÓ, A PARAMÉTERES PRÓBÁK AKKOR IS ALKALMAZHATÓK, HA NEM ISMERJÜK A POPULÁCIÓ ELOSZLÁSÁT ·      ha a p érték több, mint 0,05 vagy 0,10, de a minta kicsi. Ekkor nem lehetünk biztosak abban, hogy a minta valóban normál eloszlású populációból származik-e, noha éppen ebben az esetben lenne ez a legfontosabb a teszt-választásnál. (l. később). 12-nél kisebb N érték esetén a KS teszt teljesen megbízhatatlan, 4-nél kisebb elemszám esetén pedig már nem is számolható.

Paraméteres vagy nem paraméteres tesztet válasszunk? Biztosan nem-paraméteres próbát alkalmazunk, ha ·      a minta nem származhat normál eloszlású populációból (rangszám, score), mert csak meghatározott értékeket vehet fel. ·      Egyes adatok meghaladják a mérési tartomány felső határát, vagy nem érik el ennek alsó határát. Ekkor nem ismerjük a pontos értéket, így nem számíthatók ki a paraméterek. Nem paraméteres teszt esetében ez nem jelent nehézséget. ·      Elvégeztük a KS tesztet vagy megtekintettük a mérési adatokat és ezekről kiderült, hogy nem normál eloszlású populációból származnak és az is, hogy transzformálás után sem lesznek normál eloszlásúak.

Paraméteres vagy nem paraméteres tesztet válasszunk? (folyt.) A paraméteres és a nem-paraméteres próba közötti választás nem egyszerű, ha az elemszám kicsi és sem megtekintéssel, sem KS teszttel nem dönthető el, hogy ez normál eloszlású populációból származik-e vagy sem. Ilyenkor segíthet, ha figyelembe vesszük a mások vagy akár saját magunk által korábban elvégzett hasonló vizsgálatok eredményeit. Ha a szórás több tényező hatásának tulajdonítható, akkor valószínűbbnek tekinthető a normál eloszlás. Azonban még ekkor is fennmaradhat a kétség és nem egységes az álláspont. A kétes esetekben egyes szerzők a paraméteres, mások a nem paraméteres próbákat ajánlják. DE EGYÁLTALÁN, SZÁMÍT-E EZ?

Paraméteres vagy nem paraméteres tesztet válasszunk? (folyt.) Nagy minta Paraméteres A tesztek robosztusak (hatásokra nem érzékenyek): a p érték még akkor is kb. korrekt, ha a minta nem normál eloszlású populációból származik A tesztek nem robosztusak, tehát érzékenyek a hatá-sokra. Ha a minta nem normál eloszlású populációból származik, akkor a p értékek pontatlanok lehetnek Nem paraméteres Erősek, érzékenyek csaknem olyan erősek (a p érték csak kissé magasabb) , és megbízhatóak, mint a normál eloszlású populációból származó mintán végzett paraméteres tesztek Nem elég erősek, érzékenyek, tehát a p értékek túlzottan magasak lesznek, a meglévő különbséget sem tudják kimutatni

Paraméteres vagy nem paraméteres tesztet válasszunk? (folyt.) A fő kérdés tehát: mi a kis minta és mi a nagy minta? Motulsky (Intuitive Biostatistics):ha minden csoportban legalább két tucat minta van, akkor valószínűleg használhatjuk a paraméteres tesztet), Dawson-Saunders, Trapp: Basic and Clinical Biostatistics, Appleton and Lange, Norwalk, CT, 1998: ha 30-nál több az N akkor nem kell törődnünk azzal, hogy a minta normál eloszlású populációból származik, és használhatjuk a paraméteres tesztet. Saját (konzervatív? gyáva?) gyakorlat: ha csak nem vagyunk egészen biztosak abban, hogy mintáink normál eloszlású populációból származnak, akkor mindig a nem-paraméteres tesztet használjuk. Így “magunk ellen dolgozunk” ugyan, mert esetleg meglévő különbségeket nem tudunk kimutatni, de elkerüljük azt, hogy olyan eredményeket közöljünk, amelyek nem igazak. Az ideális magoldás: ha egy mód van rá, tervezzünk olyan kísérleteket, amelyek elemszáma elég nagy ahhoz, hogy ne kelljen a paraméteres-nem paraméteres teszt problémájával törődnünk.

Egyoldalú vagy kétoldalú próbához tartozó p értéket válasszunk? Igen ritka kivétellel mindig a kétoldalú próbát alkalmazzuk, de akkor is ezt már a vizsgálat elvégzése előtt el kell határoznunk és meg is kell indokolnunk, hogy az általunk várt változás csak egyirányú lehet.

Párosított (ismételt méréshez tartozó) tesztek (egymintás t, repeated measures ANOVA) alkalmazása Akkor lehet ezeket használni és célszerű ezeket használni (mivel különben a p küszöbérték megnő) amikor egy egyénnél végzünk ismételt méréseket vagy két csoportot előzetesen párosítunk (matching), ill. egy laboratóriumi kísérletet azonos kontrollal megismétlünk. A PÁROSÍTÁST AZELŐTT KELL ELVÉGEZNI, MIELŐTT A VIZSGÁLAT MEGINDULNA. SOHASEM SZABAD AZ ADATOKAT UTÓLAG PÁROSÍTANI, EZ HAMISÍTÁS.

Fisher exact teszt vagy 2 próba? Ha 2x2-es kontingencia táblázatot értékelünk, akkor mindenképpen célszerűbb a Fisher tesztet használni, mindenképpen ezt kell használni, ha egy cellában is a várható érték 6-nál kevesebb. Ha a kontingencia táblázat nagyobb, akkor csak a 2 próba használható.

A STATISZTIKAI SZÁMÍTÁ-SOK LEGFONTOSABB 12 SZABÁLYA 1. Először mindig rajzold (rajzoltasd meg a programmal) az adatokat (scatter diagram vagy frekvencia eloszlás) és csak azután számolj! 2. Ha igen nagy elemszámú a minta, akkor még igen kis különbségek is statisztikailag szignifikánsnak bizonyulhatnak. Ilyenkor feltétlenül meg kell vizsgálni, hogy ez a különbség orvosilag is jelentős-e. 3. Ha kis elemszámú a minta, akkor sokszor nem kapunk szignifikáns különbséget a minták között (pl. kezelt és kontroll betegek) akkor sem, ha valójában van különbség. Ilyenkor (ha erre mód van) ki kell számítani, hogy az általunk orvosilag jelentősnek ítélt különbség kimutatásához hány kontroll és kezelt beteg szükséges és ilyen elemszámmal meg kell ismételni a vizsgálatot. 4. Ha az adatokat több csoportra osztjuk és ezután ezeket párosan összehasonlítjuk, tudatában kell lennünk annak, hogy minden húszadik esetben 5%-os szinten a véletlen is szignifikánsnak látszó különbséget hozhat létre. Erre való a variancia analízis és azt ezt követő utótesztek elvégzése

A STATISZTIKAI SZÁMÍTÁ-SOK LEGFONTOSABB 12 SZABÁLYA (folyt.) 5. Ne csak az átlaggal törődjünk, figyeljünk a kilógó értékekre is. Ha kizárható, hogy ezek mérési hibából erednek, meg kell vizsgálni, hogy ezek mögött nem áll-e létező biológiai diverzitás (pl. ritka genetikai polimorfizmus) 6. Ha a mérések nem megfelelő módszerrel történtek, ill. a minták kiválasztását nem megfelelő módon, pl. nem véletlenszerűen végezték, akkor a legtökéletesebb statisztikai próba sem tud segíteni a vizsgálaton, továbbra is rossz marad. Igen fontos a kísérletek tervezése! 7. Mindig számítsuk ki a konfidencia intervallumokat minden statisztikai vizsgálat esetében. A CI és a p érték kiszámítása egymást csak részben helyettesítheti, de más a jelentésük. A p érték azt fejezi ki, hogy mennyi annak a valószínűsége, hogy (ha a null-hipotézis igaz) akkor a véletlen az észlelttel azonos mértékű vagy ennél nagyobb eltérést hozzon létre. A CI viszont azt mutatja meg, hogy egy adott (általában 95%-os) valószínűséggel az eltérés milyen határok közé esik. Számítsuk ki mind a kettőt.

A STATISZTIKAI SZÁMÍTÁ-SOK LEGFONTOSABB 12 SZABÁLYA (folyt.) 8. Ne tekintsük a p  0,05-öt vízválasztónak! A p=0,049 és a p=0,051 nem különbözik nagyon egymástól! Sohasem elég az önkényes valószínűségi érték megadása. Keressük a különbség mértékét és ennek CI-át és a nem szignifikáns különbség pontos p értékét is. A szignifikancia határán lévő 0,05  p  0,10 szintű különbséget adó vizsgálatot érdemes megismételni, előre kiszámítva, ha a keresett különbség valóban fennáll, akkor milyen elemszámú minta esetén csökken a p érték 0,05 alá. 9. A párosított értékeket mindig az ezeknek megfelelő tesztekkel értékeljük! 10. A korreláció nem jelent ok-okozati kapcsolatot. Mindig tudatában kell lennünk annak, hogy két faktor közötti korreláció mögött egy harmadik is állhat, amely mindkettőt egyenlő mértékben befolyásolja. 11. Lehetséges egy vizsgálatot úgy elkezdeni, hogy nem tudjuk pontosan előre, hogy mit fogunk találni. Ebben az esetben a kapott adatokból új hipotézis születhet. EZEKET AZONBAN MINDIG ÚJ VIZSGÁLATOKKAL KELL ELLENŐRIZNI 12. A közölt szignifikáns különbségek egy előzetes szelekciót is magukban foglalnak, mivel a nem szignifikáns eredményeket gyakrabban nem közlik. Ezért igen fontosak az úttörő, új hipotézist szülő vizsgálatot követő második-harmadik vizsgálatok (reprodukálhatók-e az eredmények?)

III. RÉSZ. HOGYAN OLVASSUNK ÉS ÍRJUNK ORVOSI CIKKEKET? Az olvasás egyik célja egy adott témáról való általános tájékozódás. Erre a legcélszerűbb az összefoglaló tanulmányokat elolvasni, mert az élet rövid és mert, ezeket a tanulmányokat olyanok írják akik nagyon értenek a témához és ezért már az összefoglalt dolgozatokat is kritikusan olvassák. Azoknak a témák esetében, amely az olvasót közelebbről érintik (egy az orvos által elôször diagnosztizált betegség, új gyógyszer, szűkebb kutatási téma) az olvasó feladata a cikkek kritikai értékelése (ennek hiszek, ennek nem). Ilyenkor arra is törekszünk, hogy a legújabb cikkeket is megismerjük.

A kritikai szemlélet a cikk minden részére ki kell terjedjen A kritikai szemlélet a cikk minden részére ki kell terjedjen. A cikkírásnál elkövetett leggyakoribb hibák a következők (minél rangosabb egy folyóirat, annál ritkábbak benne a hibák, de azért benne maradhatnak (pl. egy 9-es impakt faktorú folyóiratban azt közölték, hogy egy bizonyos immunológiai marker magas értékei esetében a halálozás valószínűsége nagyobb, mint az alacsony értékek esetében, csak azt “felejtették el” megírni, hogy a vizsgált egyének miben haltak meg)

A cikk fő részei: 1. Strukturált összefoglaló 2. Bevezetés 3.   Anyagok és módszerek (vizsgált egyének) 4.   Eredmények (alcímekkel!) 5.   Megbeszélés, célja? 6.   Köszönetnyilvánítás 7.   Irodalomjegyzék 8.   Táblázatok 9.   Ábramagyarázat 10. Ábrák HOGYAN KEZDJÜNK CIKKET ÍRNI???

A három legfontosabb kritikai kérdés: 1.   Jól volt-e a vizsgálat megtervezve, értékelve és végrehajtva? 2.   Ha igen, a kapott eredmények fontosak-e tudományos szempontból, adatak-e új információt 3.   Ha a különbségek statisztikailag szignifikánsak, szignifikánsak-e tudományos szempontból is. Ha nem, elég beteget (kontrollt) vontak-e be a vizsgálatba?

A típusú hiba A cikkben (általában a bevezetés utolsó mondatai tartalmazzák ezt) a szerzők nem írják meg, hogy miért végezték el a vizsgálatot. E mögött gyakran az áll, hogy a szerzők nem is tudták elôre, hogy miért hajtották ezt végre. A kiindulópont ekkor: végezzük el a vizsgálatot, gyűjtsünk minél több adatot (ha lehet olyat, amelyet mások még nem néztek) és nézzük meg, hogy van-e ezek között összefüggés. (HALÁSZ-KIRÁNDULÁS). Van, amikor utólag, a véletlenszerűen kapott adatok ismeretében utólag kreálnak célkitűzéseket a vizsgálatnak.

Megjegyzés Ha a halászkirándulás végén a halakat megfelelôen szortírozzák és becsületesen bevallják, hogy ilyen kirándulásra indultak, akkor az ilyen típusú vizsgálat is hozhat új eredményt, születhet belôle új hipotézis. A baj csak az, ha ezeket a véletlenszerűen kijött összefüggéseket sem a szerzôk, sem mások nem igyekeznek reprodukálni. Ha neves szerzôk közölnek ilyen eredményeket, akkor sokszor ellenôrzés nélkül ezek az eredmények még tankönyvi adatokká is válhatnak.

B típusú hiba: mintakiválasztás. Torzítások I Prevalencia vagy incidencia torzulás: egy adott faktor hatását vizsgálják egy betegségre, a hatást azonban nem a diagnózis felállítása után azonnal, hanem késôbb vizsgálják. Közben azonban a legsúlyosabb esetek meghaltak. Lehetséges, hogy a halálozásban éppen ez a faktor játszott szerepet. Nagy korai letalitású betegségek esetében néhány nap késés is számíthat.

10 évig tartó prospektív vizsgálat, 10 éves követés után értékelve Hypertónia a vizsgálat kezdetén Él, CVB Exit, stroke Él, nincs CVB-je igen 50 (5%) 250 (25%) 700 (70%) nem 80 (8%) 20 (2%) 900 (90%)

Ugyanaz a vizsgálat végén történő mintakiválasztásssal Betegcsoport A betegek száma a vizsgálat végén CVB igen CVB nem Hypertoniás 50 (6.7%) 700 Nem hypertoniás 80 (8.2%) 900

Torzítások II A kórházi felvételbôl adódó torzulás. Ha kórházban kezelt betegek esetében egy rizikófaktor hatását vizsgáljuk, de azokat a betegeket, akiknél a rizikófaktor fennáll, gyakrabban veszik fel kórházba, mint azokat, akiknél ez nem áll fenn.

Torzítások III A csoportba sorolásból adódó torzulás. Pl. paradox megfigyelés: a veszélyes munkahelyeken dolgozók egészségi állapota jobb, mint a veszélytelen munkahelyeken dolgozóké. Miért? Az veszélyes munkahelyre csak az egészséges embereket veszik fel, a többi esetében ezt nem veszik figyelembe

Torzítások IV Az eljárásra való kiválasztás torzulása. Ez akkor állhat fenn, ha az adott kezelésre a betegek egy csoportját (pl. súlyosabb betegeket) nagyobb gyakorisággal választják ki, mint a kontrollcsoportba. Ez elsôsorban akkor fordul elô, ha nem történik randomizálás

C típusú hiba. Hiba a vizsgálat elvégzésében I      A kezelt betegek több figyelmet kapnak, mint a kontrollok. Emiatt sokkal jobban betartják az orvosi előírásokat, mint a kontrollcsoport tagjai. HIV vakcináció és biztonságos szex.     

C típusú hiba. Hiba a vizsgálat elvégzésében II A betegeket arra kérik, hogy emlékezzen vissza egy bizonyos eseményre (pl. HIV pozitívoknál a fertôzôdés idejét jelzô akut HIV betegségre). Lehet, hogy egyes csoportok tagjai jobban képesek erre visszaemlékezni. Betegnapló.

C típusú hiba. Hiba a vizsgálat elvégzésében III A használt műszer csak a súlyosabb eltéréseket mutatja ki, a vizsgálat közben érzékenyebb műszerre váltottak és nem egyforma mértékben alkalmazták a két műszert az egyes csoportokban.     Osteoporosis Rtg densitometria

C típusú hiba. Hiba a vizsgálat elvégzésében IV A betegek compliance-különbségébôl jelentôs torzulás adódhat különbözô gyógyszerek összehasonlításából, akkor, ha az egyik gyógyszert mellékhatásai miatt a betegek nem veszik be. Megfigyelés alatt történő gyógyszerbeadás.

D típusú hiba az outcome meghatározásában A kezelés, beavatkozás eredményét mérô változót (outcome variable) nem határozták meg a szerzôk egyértelműen. Pl. a betegség-mentes periódus hosszát vizsgálták a szerzôk, de nem definiálták egyértelműen, hogy ez mit jelentett.

ELLENŐRZŐ KÉRDÉSEK (checklist) Strukturált összefoglaló ·     a vizsgálat célja fontos-e és érdemes-e tanulmányozni? ·     A vizsgálat célja különbség vagy összefüggés meghatározása-e, pontosan tudható-e ez a cikkből? ·     Mi a vizsgálat kimenetelének a fő mérési kritériuma (outcome)? Ez folyamatos vagy kategórikus változó-e? ·     A vizsgált betegek olyanok-e, akik az olvasó praxisában is előfordulnak? Ha a különbségek statisztikailag szignifikánsak, jelentősek-e klinikailag?

ELLENŐRZŐ KÉRDÉSEK (checklist) Bevezetés ·     Ha nincs strukturált összefoglaló, a fenti információk itt kell szerepeljenek + Eddig milyen vizsgálatok történtek a vizsgált témával kapcsolatban és ezeknek mi volt az eredménye? Várható-e, hogy a cikk új információkat ad-e?

ELLENŐRZŐ KÉRDÉSEK (checklist) Módszerek ·     A vizsgálat tervezése megfelel-e a célnak? ·     A vizsgálati periódus elég hosszú-e és nem túl hosszú-e? ·     Világosan le vannak-e írva a vizsgálatba beválogatás és a kizárás kritériumai? Ettől függ, hogy a konklúziók általánosíthatók-e ·     A mérési módszerek ismertek-e, megfelelő referenciák szerepelnek-e, ha új a módszer, jól, reprodukálhatóan van-e leírva? ·     A használt statisztikai módszerek le vannak-e írva és megfelelőek-e ·     Le van-e írva, hogy hány beteg volt szükséges a kívánt hatás-mérték (effect size) eléréséhez?

ELLENŐRZŐ KÉRDÉSEK (checklist) Eredmények I ·     A leírt megfigyelések a feltett kérdésekre adott válaszoknak tekinthetők-e? ·     Az eredmények prezentálása (átlag, S.D. S.E.M., medián, stb) fel van-e tüntetve és a táblázatból tudjuk-e hogy mi micsoda ·     Nincs-e túl sok p érték (minden 20. összehasonlításnál véletlenszerűen is p<0.05)     

ELLENŐRZŐ KÉRDÉSEK (checklist) Eredmények II Az összehasonlítandó csoportok alapértékei azonosak-e? Ha nem, akkor ezt a szerzők figyelembe vették-e (egyáltalán leírják-e?) és ha igen, hogyan tudták a confounding variables hatását kiküszöbölni? ·     Az ábrák és táblázatok egymagukban is érthetőek-e? Ha a cikk egy diagnosztikai eljárásról szól, akkor ennek specificitása és érzékenysége le van-e írva. Ha a szerzők megadják az eljárás prediktív értékét, beszámították-e ebbe a vizsgált betegség prevalenciáját?

ELLENŐRZŐ KÉRDÉSEK (checklist) 1 Megbeszélés ·     A feltett kérdések és leírt megfigyelések megfelelően diszkutálva vannak-e? ·     A levont következtetések a kapott eredményeken alapulnak-e? A következtetések nem túl általánosak-e? ·     A fontos idevonatkozó irodalom meg van-e említve és a saját eredményeit szerzők ezekkel összevetették-e? ·     A vizsgálat limitációit, esetleges hibáit, torzításait megtárgyalják-e a szerzők?