Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Igen-nem változás előrejelzése több változó hatásának együttes elemzése alapján A többszörös logisztikus regresszió Dr. Gombos Tímea SE, III.sz. Belgyógyászati.

Hasonló előadás


Az előadások a következő témára: "Igen-nem változás előrejelzése több változó hatásának együttes elemzése alapján A többszörös logisztikus regresszió Dr. Gombos Tímea SE, III.sz. Belgyógyászati."— Előadás másolata:

1 Igen-nem változás előrejelzése több változó hatásának együttes elemzése alapján A többszörös logisztikus regresszió Dr. Gombos Tímea SE, III.sz. Belgyógyászati Klinika

2 Ismétlés Egyváltozós modellekkel megválaszolható kérdések Egy megfigyelt különbség vagy arány a véletlen hatására alakult-e ki? Többváltozós modellekkel megválaszolható kérdések Az adott független változó(k) szignifikáns kapcsolatban vannak-e függő változóval? Mekkora a független változók egymáshoz képest mutatott relatív súlya a megfigyelt különbség (arány) kialakításában? Más szavakkal: segít súlyozni, megítélni, típusba sorolni a független változóinkat.

3 A független változó TípusaJellegzetességeiFelismerési lehetőségPélda Zavaró faktor (confounder) Kapcsolatban áll a rizikótényezővel és okozati összefüggésben a kimenetellel Rétegzett analízis Többváltozós analízis A statisztikai analízis azonban önmagában nem elegendő, hogy a kettő között különbséget lehessen tenni. Öngyújtó, dohányzás, tüdőrák Közbeeső változó (intervening variable) Kapcsolatban áll a rizikótényezővel és okozati összefüggésben a kimenetellel, a rizikótényező általa fejti ki hatását Doh, cotinine, toxikus metabolitok, tüdőrák Gátló faktor (supresser) Kapcsolatban áll a rizikótényezővel és a kimenetellel, a rizikófaktor hatását elfedi Rétegzett analízis a supresser változó szerint Többváltozós analízis, adjusztálás (illesztés) a supresser változóra Aspirin, MI, halálozás Orvosi hivatás, válás, öngyilkosság Hatásmódosító vagy interakciós változó (interaction variable) Hatásmódosítás. A rizikótényező hatása a kimenetelre egy harmadik változó értékétől függ. Rétegzett analízis az interakciós változó szerint. Többváltozós analízis „with interaction terms” Expozíció, inokuláció mértéke, betegség súlyossága

4 Függő változóPélda a kimenetelreA használandó többszörös analitikai módszer FolyamatosVérnyomás, testsúly, hőmérséklet Többszörös lineáris regresszió Dichotom (igen-nem) Halál, betegség kialakulása, felvétel osztályra Többszörös logisztikus regresszió Az eseményig eltelt idő Halálig, dg.-ig eltelt idő Cox regresszió (proportinal hazard analízis) Többváltozós analízisek

5 Logisztikus regresszió Számszerűen fejezi ki az összefüggést egy függő és több független változó között 2 fő funkció Predikció – egy modell és a független változók birtokában megmondható, milyen eséllyel kerül egy egyén az egyik vagy a mások csoportba Feltérképezés – a változók közötti kapcsolatok és azok erősségének megismerése A függő változó (kimeneti változó): dichotom – két lehetséges értéke van – pl.: túlélő/halott, beteg/egészséges stb.

6 A független (prediktor, magyarázó) változók A független változók lehetnek Kategorikusak Dichotomok – pl. átesett-e mandulaműtéten vagy sem? 0/1-nek kódoljuk – 0 - a referencia csoport, 1- a vizsgált csoport (Dummy változó) Ha k>2 db. kategória akár k-1 dummy változót is csinálhatunk: Folytonosak (vérnyomás, életkor) Egységnyi változáshoz tartozó esélyhányados növekedést adja meg Nehezen interpretálható → folyamatos változó kategorikussá alakítása (pl.: medián alatt/felet, melyik tercilisbe tartozik) Számuk korlátozott – ökölszabály: kb. 6-10x legyen több eset

7 Esély, odds Odd – dichotom változónál az egyik esemény valószínűsége osztva a másik esemény valószínűségével Pl.: p=0,8? vagy p=0,25? Odd=1? P=0,8 → Odd: 4 az 1-hez (0,8/0,2) P=0,25 → 0,33 (0,25/0,75) Odd =1 → p=0,5 (0,5/0,5) Tartománya: 0 – végtelen „mennyivel esélyesebb, hogy az adott egyén az eseményes csoportba kerül, mint a nem eseményesbe”

8 Esély arány, odds ratio (OR) OR – ezzel számszerűsíti a logisztikus regresszió a függő és független változó közötti összefüggést Megadja mennyivel változik az esélye annak, hogy az eseményes csoportba tartozik egy egyén, ha a független változó értéke egy egységnyivel nő e-t a függő változóhoz tartozó regressziós koefficiens (b) értékére emeljük (e b ) Pl.: a koefficiens (b) = 3 → OR=e 3 =2,72 3 =20,09 Ha a függő változó: él/halott, független: betegség súlyossági stádium → „kb. 20x nagyobb eséllyel hal meg az a beteg, akinek egy stádiummal súlyosabb a betegsége, mint akinek kevésbé súlyos.”

9 Mivel nem egy értéket szeretnénk becsülni, mint a lineáris regressziónál, hanem azt, hogy az egyik csoportba tartozik- e az egyén vagy sem (0 vs. 1), inkább valószínűségre vagyunk kíváncsiak A valószínűség értéke 0 és 1 között mozog – a predikció során azonban nagyobb értékek is kijöhetnek – transzformációra van szükség További érv: lineáris egyenes nem illeszthető a két kategória miatt → logaritmikus transzformáció Logisztikus regresszió egyenlete

10 p – a valószínűség, hogy az egyén valamelyik csoportba tartozik a – a konstans b – az adott prediktor regressziós koefficiense Ez az ln(OR)! Sok helyen béta (β) OR= e β – egymásból számíthatóak

11 A regressziós együtthatókból kiolvashatjuk… Béta (b): … hogy az adott változó hogyan befolyásolja az y (kimeneteli változó) bekövetkezésének esélyét: β>0 – növeli, β<0 – csökkenti, β=0 – nem befolyásolja OR: Folytonos magyarázó változóknál: … hogy egy egységnyi növekedés hányszorosára növeli a y bekövetkeztének esélyét (odd) ha az x magyarázó változó dichotom … hogy a vizsgált csoportban az y bekövetkezésének esélye (odd) hányszorosa a referenciacsoportbelinek ha a magyarázó változó több mint 2 kategóriás … hogy a szóban forgó csoportban az y bekövetkezésének esélye (odd) hányszorosa a referenciacsoportbelinek

12 Wald chi négyzet teszt A regressziós egyenletben az egyes prediktorok (x) hatásának szignifikanciáját teszteli H 0 – a változónak nincs szerepe a függő változó kimenetében Ha a OR 95%-os konfidencia intervalluma tartalmazza az 1-es érétket, akkor az adott prediktor nem szignifikáns

13 OR a referencia csoportban mindig 1 Ha a OR CI-je nem tartalmazza az 1-et (50-50%), akkor szignifikáns. Ha OR<1, akkor az eseményre a referencia csoportnak van nagyobb esélye Wald Chi négyzet

14 Referencia csoport Vizsgálati csoport A nemre és korra illesztés nem befolyásolja az OR-t Ez és az előző analízis között különbség, hogy az előzőnél az összes felsorolt változó független változó egy közös modellben, míg ennél 3 soronként szerepel egy modell. Az első oszlopban egyváltozós, a metiláltság szerepel, a második oszlopban pedig illesztve van a korra és a nemre.

15 Modellépítés - Milyen független változók legyenek? A kérdésfeltevés, függő változó lényeges szempont Ha a betegség kimenetelével kapcsolatos: Alap adatok – nem, életkor Betegség súlyosságát jelző mutató Az általunk tesztelni kívánt változó Irodalmi adatokból ismert prediktorok Lehetséges irányvonal: egyváltozós modellben szoros összefüggést mutat

16 Multikollinearitás Ha független változók között szoros korreláció áll fent Akkor a legrobosztusabb a modell, ha a független változók a függő változóval és nem egymással korrelálnak Az eredményt nem módosítja drasztikusan, de a standard error nagy lesz az érintett változókban Pl.: „Dummy variable trap” – kettőnél több kategóriát (k>2) tartalmazó változót dummy változóvá teszünk és az összes (k-1) új változót beépítjük a modellbe Kerülendő

17 „Automatikus” modellépítés „Stepwise regression” Forward selection Backward elimination A nem szignifikáns változókat kiválogatva megkeresi a legjobban illeszkedő modelleket Biológiailag releváns?

18 Modell illeszkedés Maximum likelihood módszerével vizsgálja Meghatározza, hogy az x-ek (prediktorok) segítségével mennyire pontosan határozható meg az y (függő változó). Chi négyzet eloszlást mutat Minél nagyobb a statisztika értéke, annál jobb az illeszkedés H 0 – a modell illeszkedése olyan mint a null modellnek ►Ha szignifikáns – arra utal kevés a nem megmagyarázott variabilitás – jó a modell Ha nem szignifikáns – a modell nem illeszkedik jól, fel nem tárt magyarázó tényezők is vannak

19 Statistics//Advanced Linear/Nonlinear Models//Nonlinear Estimation//Quick logit regression

20 Ha itt megcserélem a kódokat az OR reciproka lesz (interpretációtól függ mi a jobb) Wald- chi négyzet értékek és a konfidencia intervallum értéket csak akkor kapunk, ha ezt bejelöljük!!!

21 BétaModell illeszkedés Kategorikussá alakított folytonos változó (high vs. low) – medián értéknél a vágópont. Kategorikussá alakított folytonos változó – 20 évenkénti katergóriák

22 +NYHA+NYHA Ez alapján a BNP hilo tényleges prediktor, míg a diasztolés vérnyomás csak confounder vagy közbeeső változó a NYHA súlyossági stádiumok mellet

23 Köszönöm a figyelmet!


Letölteni ppt "Igen-nem változás előrejelzése több változó hatásának együttes elemzése alapján A többszörös logisztikus regresszió Dr. Gombos Tímea SE, III.sz. Belgyógyászati."

Hasonló előadás


Google Hirdetések