III. Sz. Belgyógyászati Klinika Paraméteres és nem paraméteres próbák alkalmazása több csoport összehasonlítására folytonos változók esetén Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem III. Sz. Belgyógyászati Klinika 2019-03-13 Prohaszka.zoltan@med.semmelweis-univ.hu
Megválaszolandó kérdések Különbözik-e egymástól a férfiak és a nők BMI-je? Változik-e a vércukor szint egy gyógyszeres kezelés hatására? Emelkedik-e a koleszterint szint a kor előrehaladtával? Más-e a vérnyomás a különböző stádiumú betegekben? ►Létezik-e (szignifikáns) különbség két vagy több betegcsoport átlaga között?
Egy nagyobb adatbázisban végtelen számú kérdés tehető fel…. Mindig tegyük fel a kutatási kérdést előre, és csak azt a kérdést teszteljük a dolgozatban, amire valóban kíváncsiak vagyunk Nem kötelező tesztet végezni ott, ahol nincs kérdés, csak adatot közlünk Előnye nincs, hátránya lehet Nézzünk két példát!
„It was aimed to explore the relation of work instability with fatigue, depression, and anxiety in working AS patients comparing with healthy controls.”
„In this study, we investigated whether smoking and HLA-DRB1 shared-epitope (SE) alleles interact differently in the development of the two major subgroups of rheumatoid arthritis (RA), anticitrullinated proteins antibody (ACPA)-positive and ACPA-negative disease, in a multiethnic population of Asian descent.”
Megfelelő statisztikai próba kiválasztása folytonos változók közötti különbségek vizsgálatára Hány csoportunk van? 2 3 vagy több Függetlenek a mintáink? független csoportok – nők vs. férfiak, súlyos vs. enyhébb betegek kapcsolt csoportok – ua. kezelés előtt vs. kezelés után, ua. 10 év múlva valamilyen kritérium alapján előre felállított párok Normál eloszlású a minta? normál eloszlás (az átlag és a szórás jól használható → paraméteres teszt nem normál eloszlás → transzformálás /nem paraméteres teszt
Paraméteres Nem paraméteres Nem normál (ferdült) eloszlás esetén Eloszlásfüggetlen (nem feltételfüggetlen!) Pl.: a próba sorrendbe állítja az összes értéket, a sorszámokkal (rangok) számol (rang-transzformáció) Az orvosi gyakorlatban gyakoribb Normál eloszlás (vagy egyéb bizonyos fajta) A próba a tényleges értékekkel számol Az orvosi gyakorlatban viszonylag ritka, de az adatok normál eloszlásúvá transzformálhatóak (pl. logaritmizálás)
Normál eloszlásból származik a mintám? A populáció eloszlása nem ismert, a mintát vizsgálom Hisztogram készítése, normál görbe ráfektetése, szemmel ellenőrzés – kis esetszám? Shapiro-Wilks teszt Ho – az eloszlás normál H1 – az eloszlás eltér a normálistól ► ha a próba szignifikáns, az eloszlás nem normál Bizonytalanság esetén? tekintsük úgy, mintha nem normál eloszlású lenne a mintánk, mert ha normál eloszlású adatokon nem parametrikus tesztet végzünk, gyakorlatilag a parametrikus teszttel azonos eredményt kapunk, míg fordított esetben ez nem áll fent! Hatékonyság vesztés!
Nem paraméteres próbák 2 minta 3 vagy több Mintaszám? Hány csoport? igen nem igen nem Független minták? Normál eloszlású a minta? igen nem igen nem igen nem igen nem 1 szempontos AVOVA Ismételt méréses ANOVA 2 mintás t-próba Páros t-próba Mann-Whitney t. Wilcoxon t. Kruskal-Wallis t. Friedman próba Paraméteres próbák Nem paraméteres próbák
Két mintás t-próba (unpaired T-test) Feltétele: ismeretlen, de feltételezhetően azonos szórások Két minta átlagát hasonlítja össze – ebből következtetünk a populáció átlagára H0 – a két mintavételi populáció azonos H1’ – az egyik mintavételi populáció nagyobb H1” – az két mintavételi populáció különböző (bármelyik lehet nagyobb) Képlettel számítjuk a t – értéket (minél nagyobb, annál nagyobb eltérésre utal) Táblázatból ismert, hogy adott szabadságfok mellett mekkora p (probability) érték tartozik hozzá Ha a p-érték kellően kicsi – elvetjük a nullhipotézist (H0-t) Mi a kellően kicsi? – előre meghatározott érték, a szignifikancia küszöb. Ált. 0,05, vagyis 5% (minden 20. döntésem lesz fals pozitív). Ha a p ennél kisebb, mondhatjuk, hogy a két populáció közötti különbség szignifikáns A p-érték annak a valószínűsége, hogy elsőfajú hibát követek el (hibásan utasítom el a H0-t) ► p-érték annak a valószínűsége, hogy mégis igaz a H0
Egyoldali vagy két oldali próba (one-tailed, two-tailed) A kérdés (az alternatív hipotézis) határozza meg melyik szükséges Egyoldali próba – egyirányú eltérést vizsgálok (H1’) pl. az egyik pop. nagyobb Kétoldali próba – kétirányú eltérés (H1”) pl. a két pop. különbözik Melyik a „szigorúbb”? A kétoldali próba! (az ábrán a piros) A STATISTICA eleve kétoldali próbához tartozó p-értéket ad meg. Ha a kérdésfeltevésünk indokolja (lehetővé teszi) az egyoldali próbát, a kapott p-értéket osszuk el kettővel (az ábrán a kék intervallum)
A számított statiszika értéke Elérési útvonal STATISTICA-ban: Statistics // Basic statistics/Tables// t-test, independent, by groups A számított statiszika értéke Degree of freedom, szabadságfok. A két csoport esetszáma -2 A kétoldali próbához tartozó p-érték Megj.: A t-próba akkor végezhető, ha a két csoport varianciája megegyezik. Ha nem vagyunk biztosak a szórások egyenlőségében, akkor Welch próbát kell használni. (F próba ezt vizsgálja, de nem helyes ez alapján választani a próbát)
Mann-Whitney teszt Például? – férfiak vagy a nők BMI-je nagyobb? H0 – nincs különbség a két csoport között
Mann-Whitney teszt feltétele A két folytonos változó sűrűségfüggvénye azonos alakú (egymásba eltolással átvihetők) Tehát a szórások közel azonosak!
Elérési útvonal: Statistics (felső parancssor) // Nonparametrics //Compairing two independent samples (groups) A próba Ábra készítése
Csoporttól függetlenül adott rangszámok csoportösszege A rangszámösszegből számolt statisztika értéke és a hozzá tartozó p-érték esetszám Ha az egyik csoport minden egyes eleméhez hozzárendeljük a másik csoport minden egyes elemét, akkor a két csoport esetszámainak szorzatával egyenlő számú párt kapunk (144x50=7200db-t). Az U azt mutatja meg, hogy hány ilyen párban nagyobb az első érték, mint a második (+ az egyenlő párok számának a fele). Ha egyforma lenne a HGB a férfiak és a nők között, az U 7200/2=3600 lenne. Mivel az eredményekből (rangszámok összege) csak nehézkesen állapítható meg, hogy melyik csoportban vannak a nagyobb értékek, érdemes grafikusan ábrázolni.
Páros t-próba Például? H0 – a különbségek átlaga = 0 Változott-e egy év elteltével a betegek Na szintje (felt. norm. eloszlás) H0 – a különbségek átlaga = 0
Elérési útvonal STATISTICA-ban: Statistics // Basic statistics/Tables // t-test, dependent samples Itt is lehet ábrát kérni!
A mintapárok közötti különbségeken alapul a t-értéket meghatározó képlet, de szerepel benne a szórás (SD) is. Jelen esetben a p-érték nagyobb, mint a küszöb érték, a H0-t nem vetjük el, a csoportok között nincs különbség. (Megtévesztő lehet, de akár kis eltérés is lehet szignifikáns, ha az eltérések szórása kicsi. Könnyen belátható, hogy ha pl. 0,5 az átlagos eltérés, de az a 0,4-0,6 tartományba esik, az egy jelentős különbség. Míg abban az esetben, ha ugyancsak 0,5 az eltérések átlaga, de az értékek -1 és 2 között szórnak, akkor nincs tényleges különbség a két csoport között) Megj.: hamis eredményt kaphatunk, ha a két mérés nem azonos módszerrel történik, vagy pl. nem azonos a mértékegység!
Wilcoxon próba Például? H0 – a különbségek átlaga = 0 Változott-e egy év elteltével a betegek Na szintje ( nem norm. eloszlás) H0 – a különbségek átlaga = 0
Elérési útvonal STATISTICA-ban: Statistics // Nonparametrics // Comparing two dependent samples (variables) A próba előjeltől függetlenül rangsorolja a két minta közötti különbségeket, majd a negatív és a pozitív különbségekhez tartozó rangokkal számol.
Egyszempontos ANOVA Például? Különböznek-e egymástól a más-más NYHA stádiumban lévő szívelégtelen betegek kreatinin szintjei? (felt. norm eloszlást)
ANOVA ANOVA = Analysis of Variance Több csoport összehasonlításánál kézenfekvő, de nem helyes párokat alkotni és azokat t-teszttel összehasonlítani (a többszörös összehasonlításból eredő fals pozitív következtetések növekvő aránya miatt). Ha a csoportok egy szempont szerint különböznek (pl. betegség súlyossága)→ egyszempontos (one-way, egyutas ANOVA) Ha több (további) szempont szerint is vizsgáljuk (pl. betegség súlyossága és nem) → többszempontos ANOVA H0 – mindegyik minta ugyanolyan átlagú sokaságból származik. A csoportokon belüli és a csoportok közötti varianciát elemzi rm
Elérési útvonal STATISTICA-ban: Statistics // ANOVA // one-way ANOVA Osztályozó vagy független változó Függő változó – a mért vagy megfigyelt adatok
Ha a teszt szignifikáns eredményt ad, a csoportok közül legalább az egyik nem azonos populációból származik A kísérleti tervtől függően választott elemzéssel meghatározhatjuk, hogy melyik csoport különbözik
Kruskal-Wallis próba Például? Különböznek-e egymástól a más-más NYHA stádiumban lévő szívelégtelen betegek kreatinin szintje? (nem norm eloszlás)
Páronkénti össze-hasonlítások eredményei Median test – a K-W-t „egyszerűbb” változata. Ha sok kiugró érték van, megbízhatóbb Páronkénti össze-hasonlítások eredményei Elérési útvonal STATISTICA-ban: Statistics // Nonparametrics // Comparing multiple indep. samples
Friedman próba Például? Változik-e a koleszterint szint 5 évenként mérve?
Elérési útvonal STATISTICA-ban: Statistics // Nonparametrics // Comparing multiple dep. Samples (variables)
Általános vizsgálati szempontok Először fogalmazzuk meg a kérdést, ehhez keressük meg a megfelelő próbát Ne csak a p-értéket nézzük, próbáljunk utánagondolni az eredményeknek (pl. Mann-Whitney tesztnél U), különösen a párosított teszteknél (változás mértéke, iránya, stb.). Ábrázoljuk ellenőrzésképpen grafikusan is! Orvosi gyakorlatban leggyakrabban nem paraméteres teszteket használunk A programmal két csoportot könnyen több száz változó szerint is összehasonlíthatunk (szignifikancia vadászat). Ilyenkor ne felejtsük el lejjebb vinni a szignifikancia küszöböt (Bonferroni korrekció). Definícióból adódik, hogy 100 db 0,05 p-értékű tesztnél valószínűleg 5 szignifikáns eltérést mutat még akkor is, ha a két minta nem különbözik!
Összefoglalás folyamatos változók (pl. életkor, se Na) folyamatos változók (pl. életkor, se Na) normál eloszlású nem normál eloszlású 2 független csoport összehasonlítása két mintás t-próba Mann-Whitney teszt Basic stat./Tables//T test, independent, by groups Nonparametrics//Comparing two independent samples (groups) Szignifikánsan különbözik-e a súlyos és nem súlyos betegek vércukor értéke? 2 kapcsolt csoport összehasonlítása (pl. érték kezelés előtt és kezelés után) páros t próba Wilcoxon teszt Basic stat./Tables//T test dependent samples Nonparametrics//Comparing two dependent samples (variables) Megváltozik-e a betegek fehérvérsejt száma a kezelés hatására? Változik-e a betegek koleszterinszintje 10 év követés alatt? 3 vagy több független csoport összehasonlítása egy szempontos ANOVA Kruskal-Wallis teszt ANOVA//One-way ANOVA//All effects Nonparametrics//Compairing multiple independent samples (groups) Van-e különbség a különböző Dukes stadiumú betegek hemoglobin szintjében? 3 vagy több kapcsolt csoport összehasonlítása ismételt méréses ANOVA Friedman próba ANOVA//Repeated measures ANOVA Nonparametrics//Compairing multiple dependent samples (groups) Az ismételt mérések során változik-e a betegek BMI-je?
Köszönöm a figyelmet!