Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ.

Hasonló előadás


Az előadások a következő témára: "TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ."— Előadás másolata:

1 TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ

2 A többszörös modellek feltételezései (assumptions) TÖBBSZÖRÖS LINEÁRIS TÖBBSZÖRÖS LOGISZTIKUS PROPRCIONÁLIS HAZARD ANALÍZIS MIT MODELLEZÜNK?A függő változó átlagaA függő változó egyik értéke bekövetkezése esélyének (odds) temészetes logaritmusa (logit) A relativ kockázat (hazard) logaritmusa A FOLYAMATOS FÜGGETLEN VÁLTOZÓK VISZONYA A FÜGGŐHÖZ (KIMENETELHEZ) A függő változó átlaga lineárisan változhat több független változóval is A függő változó logitja lineárisan változhat több független változóval is A relatív hazard logaritmusa lineárisan változhat több független változóval is A SKALARIS FÜGGETLEN VÁLTOZÓK VISZONYA A FÜGGŐHÖZ (KIMENETELHEZ) A függő változó átlaga lineárisan változhat több független változó egységnyi változásával is A függő változó logitja lineárisan változhat több független változó egységnyi változásával is A relatív hazard logaritmusa lineárisan változhat több független változó egységnyi változásával is A FÜGGŐ VÁLTOZÓ ELOSZLÁSA NormálisBinomiálisNincs meghatározva

3 Többszörös logisztikus regresszió Számszerűen (odds ratio formájában) fejezi ki az összefüggést egy független változó és egy dichotóm (beteg/nem beteg, férfi/nő, magas/nem magas, stb) függő változó között úgy, hogy ezt az összefüggést a többi független változóhoz illeszti (adjusted) tehát matamatikai módszerekkel a többi független változó hatását kiküszöböli. A cél általában a predikció.

4 Relatív rizikó (relative risk), esély-arány (odds ratio) Példa: Az AIDS definiciójának megfelelő opportunista infekciók vagy tumorok előfordulása (továbbiakban röviden és helytelenül AIDS) előrehaladott HIV betegségben szenvedő betegekben. A betegeket folyamatosan két reverz transzkriptáz gátló szerrel kezelték, és két csoportra randomizálták. Az egyik csoport egy proteáz inhibitort (Ritonavir) is kapott, a másik csak placebot az alapkezelés mellett. 16 hétig regisztrálták az AIDS definiciójának megfelelő opportunista infekciók vagy tumorok előfordulását. (Cameron et al. Lancet 351, 543, 1998)

5

6 Relatív rizikó Relatív rizikó: A/A+B osztva C/C+D- vel: a példában 119/543 osztva 205/547-el: 0.22/0.37=0.59 (95% CI: 0, ), tehát az AIDS kiejlõdésének a relatív kockázata a Ritonavírral kezelt csoportban csaknem a fele a szokásos kezelést kapott betegek kockázatának

7 Esély-arány (OR) Először mindkét csoportban kiszámítjuk az esélyét annak, hogy egy esemény, példánkban az AIDS kifejlődése, bekövetkezzen. Ez A/B, ill C/D, tehát példánkban 119/424=0.28, ill. 205/342=0.60. A két esély arány tehát A/B osztva C/D-vel, 0.28/0.60=0.47 (95% CI ). Tehát a ritonavírrel is kezelt betegeknek az esélye arra, hogy bennük AIDS fejlõdjön ki. kevesebb, mint fele annak, amely a ritonavirrel nem kezelt betegek esetében áll fenn. EZ AZ ÖSSZEFÜGGÉS AZONBAN CSAK AKKOR IGAZ, HA A KÉT CSOPORT MÁS SZEMPONTBÓL NEM KÜLÖNBÖZIK EGYMÁSTÓL. HA IGEN: TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ VAGY MÁS HASONLÓ ELJÁRÁS ELVÉGZÉSE SZÜKSÉGES

8 ADATBÁZIS: SZÍVELÉGTELENSÉG: 195 beteg 2 évig majd tovább követve

9 25th percentilis Medián75th percentilis age59, , ,33425 Bal_kamrai_EF Heart_rate syst_bp diast_bp7080 glucose5,015,647,29 na karb6,38,612,3 kreat hugysav Total_cholesterol3,464,124,96 triglycerid0,931,191,68 hdl0,951,161,39 apoa11,141,311,49 osszfeherje albumin crp2,986,3513,71 hgb

10 Milyen tényezők határozzák meg azt, hogy a szívelégtelenségben szenvedő betegek meghalnak-e a vizsgálati periódus folyamán?

11 VáltozóP érték NYHA 0/1 (enyhe/súlyos)<0,001 Pulmonalis congestio nem/igen<0,001 Bal kamrai ejekciós frakció0,006 Szisztolés vérnyomás0,011 Diasztolés vérnyomás0,009 BMI0,018 Vércukor0,010 Nátrium0.003 Karbamid<0,001 Kreatinin0,002 GFR0,003 Össz-koleszterin0,012 Triglicerid0,033 ApoA1<0,001 Albumin<0,001 CRP0,032 Hemoglobin0,035 BNP<0,001 TNFalpha0,031 Anamnézisben DM0,083 Jelenleg dohányzik igen/nem0,208 Életkor0,220 Húgysav0,068 Össz-fehérje0,159

12

13 Milyen tényezők határozzák meg, hogy a szívelégtelenségben szenvedő betegek balkamrai ejekciós frakciója alacsony vagy magas?

14 VáltozóP érték Diszkrét változók NYHA 0/1 (enyhe/súlyos)0,001 Pulmonalis congestio nem/igen0,004 Folyamatos változók Szisztolés vérnyomás<0,001 Diasztolés vérnyomás0,014 Karbamid0,049 Össz-koleszterin0,016 HDL-koleszterin0,005 ApoA10,004 Össz-fehérje0,001 BNP0,001 életkor0.195 BMI0.144 Na0,057 trigicerid0.163 hemoglobin0.145 TNFalpha0,121

15 A TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ Matematikai-statisztikai eljárás, amelyet akkor alkalmazunk, ha egy dichotóm változó bekövetkezésének valószínűsége és az egyes független változók közötti kapcsolatot szeretnénk kiszámítani. Ha a független változó nominális, akkor ezt 0- val, ill 1-el jelőljük, ha folyamatos, akkor egy egységnyi növekedésre vonatkozik a kapcsolat, az OR.

16 A logisztikus regresszió során alkalmazott számítási mód A lineáris regresszióval ellentétben, amelynél a számítás az ún. legkisebb négyzetek módszerén alapszik, a logisztikus regresszió számítási módja az un. iterative maximum likelihood ratio kiszámítása. Ez, mint minden valószínűség-arány számítás, exponenciális, tehát a természetes logaritmus alapra vonatkozik. Ezt átalakítjuk úgy, hogy az egyenlet mindkét oldalán ln-t számítunk.

17 A logisztikus regresszió egyenlete odds (bekövetkezik/nem következik be, A/B= P/1-P. Ha a ln-át vesszük, ln (odds) = ln (P/1-P) = ß o + ß I I Ha ezt az egyes független változók szerint részeire bontjuk, akkor ln (odds) = ß o + X 1 ß 1 + X 2 ß A ß o azt jelenti, hogy a ln(odds) mennyivel egyenlő, ha minden független változó = 0. A ß 1 érték egyenlő az X változóra vonatkozó OR ln-ával, stb.

18 A logisztikus regresszió egyenlete (folyt.) A 0 hipotézisünk az, hogy a vizsgált változók által meghatározott esély-arány (OR) nem különbözik 1-től, tehát ezek a változók nem növelik az adott esemény bekövetkeztének valószínűségét. Ennek az OR-nek vesszük a ln- át, majd az egyenletet úgy alakítjuk át, hogy ezt az OR-t felbontjuk az egyes változók által meg- határozott OR-ekre, pontosabban ezek ln-ára ln (OR) = X 1 (lnOR 1 ) + X 2 (lnOR 2 ).... Az egyes komputer programok vagy a ß vagy az OR értékeket adják meg, átszámíthatók: ß = ln(OR)

19 Variables in the Equation BS.E.WalddfSig. Exp(B ) 95,0% C.I.for EXP(B) LowerUpper Step 1(a) mutka1vs tobbi 1, , , , , , , danyn4 0, , , , , , , age - 0, , , , , , , nem 1, , , , , , , Constant - 5, , , , , a.

20 Modell felépítés a logisztikus regresszióban Hasonló a lineáris regresszióhoz manuális automatikus: forward selection backward elimination stepwise selection A számítógépes programok mérőszámot adnak (vö R 2 a lineáris regressziónál), amely az egyes modellek „jóságát” (goodness of fit) fejezik ki.

21 FIKTÍV PÉLDA 50 M (morbus) betegségben szenvedő beteget követtek nyomon 3 éven keresztül, közülük 20 halt meg (1), 30 életben maradt.(0) Sokfajta adatot és vizsgálati eredményt rögzítettek a betegeknél, de végül a válogatás eredményeképpen csak 3 változó mutatott szignifikáns összefüggést a halálozással: dohányzás (D) (a beteg valaha is dohányzott: 1, sohase dohányzott: 0), életkor (K) a vizsgálat kezdetekor (év) és a C reaktív protein (CRP) koncentráció: alacsony ( 5 mg/l). A számítógépes program a következő esélyarányokat mutatta (mindhárom esetében p<0,01 szignifikanciával, az állandó érték Halálozás (H), = 0,50 + 0,05D + 0,001K + 0,06CRP

22 Néhány változat 50 éves nem dohányzó, alacsony CRP szintű beteg H esély=0,50 + 0x0,05 + 0,001x50 + 0x0,06 = 0,55 50 éves beteg, dohányos, CRP szintje alacsony H,esély =0,50 + 1x0,05 + 0,001x50 + 0x0,06 = 0,60 50 éves dohányzó és magas CRP szintű beteg H,esély=0,50 + 1x0,05 + 0,001x50 + 1x0,06 = 0,66

23 Milyen tényezők határozzák meg azt, hogy a szívelégtelenségben szenvedő betegek meghalnak-e a vizsgálati periódus folyamán? VáltozóBA B S.E.M- je Wald statiszti ka P értékExp(B) (odds ratio) (OR) Az OR 95%-os CI-a NYHA 3-4/1-2,370,471,617,4321,447,575-3,641 Pulm cong Igen/nem,822,4403,485,0622,276,960-5,396 Diastolés vérnyo más -,014,019,566,452,986,949-1,024 Szérum Na -,031,050,394,530,969,879-1,069 Carbamid N,076,0287,261,0071,0791, ApoA1 -,350,818,183,669,704,142-3,503 Albumin -,083,0532,425,119,920,829-0,022 BNP,000 5,414,0201,0001,001 Konstans 5,9597,271,672,412387,052

24 A balkamrai ejekciós frakció nagyságával ((magas (>34), vs alacsony (34)) összefüggő független változók a frakcióval az egyváltozós analízis során szignifikáns (p.<0.05) különbséget mutató változók a modellbe válogatása után. Számítás a forward selection módszerével VáltozóBA B S.E. M-je Wald statis ztika P értékExp(B) (odds ratio) (OR) Az OR 95%- os CI-a NYHA 3- 4 vs 1-2 -,834,3107,263,007,434,237- 0,797 Sziszt vérny omás,021,0087,558,0061,021 1,006- 1,037 Össz- koles zterin,229,1213,568,0591,257,991- 1,593 Konstans -3,0801,0947,928,005,046

25 A balkamrai ejekciós frakció nagyságával ((magas (>34), vs alacsony (34)) összefüggő független változók a frakcióval az egyváltozós analízis során különbséget (p<0.25) mutató változók a modellbe válogatása után. Számítás a forward selection módszerével VáltozóBA B S.E.M -je Wald statisz tika P értékExp(B) (odds ratio) (OR) Az OR 95%- os CI- a NYHA 3-4 vs ,090,33410,627,001,336, Sziszt vérnyo más,024,0089,057,0031,025 1,009- 1,041 Össz- koleszt erin,271,1244,758,0291,311 1,028- 1,672 Hemoglobi n -,030,0108,988,003,971,952-0,990 Konstans,5791,624,127,7211,785

26

27 Mennyi az esélye arra, hogy magas legyen a véralkoholszintje egy 27 éves kaukázusi férfinek, aki csütörtökön du. 2- kor kerül az osztályra?

28 A többszörös logisztikus regresszióval kapcsolatos legfontosabb kérdések Elegendő a megfigyelések száma? (5-10-szer több eset, mint változó) A modell megfelelő-e? Ha van interakció az egyes változók között, ezt a modell felépítésnél figyelembe kell és lehet is venni. Van-e az eredményeknek biológiai értelme? (automatikus modellfelépítés!) Ha váratlan összefüggés jön ki, lehet véletlen, de lehet értelme is: hipotézis felállítás, de ellenőrzés új vizsgálatban!!!

29 Milyen jó a modell? (Goodness of fit) SPSS A measure of how well the model fits the data. It is based on the squared differences between the observed and predicted probabilities. A small observed significance level for the goodness-of-fit statistic indicates that the model does not fit well.

30 MIHEZ SZÁMÍTSUK AZ ODDS RATIOT? Ha a független változó kategorikus, főleg, ha bináris, akkor OK (beteg/nem beteg, dohányzik/nem dohányzik, férfi/nő, stb.). Ha viszont a független változó folyamatos, akkor koncepcionálisan nehéz felfogni, hogy egy egység változás mit jelent. Megoldások: értelmes kategóriákat állítok fel: pl. életkorban 10 év, binárissá teszem a független változót ( alacsony/nem alacsony, magas/nem magas labor. lelet, IQ, stb.)

31 HOL HÚZZUK MEG A HATÁRT? A binárissá átalakítandó független változó minden adatát (a függő változó eredményétől függetlenül!!!) sorba rendezzük és megállapítjuk, hol van a 90. percentilis, a legfelsőbb (legalsóbb) kvartilis, tercilis, esetleg a medián határa. (legtöbb program megcsinálja) Ezután megvizsgáljuk, hogy a függő változóhoz tartozó két csoportban a magas/nem magas stb. kategóriába tartozó független változó hány esetben fordul elő Végül a logisztikus regressziós egyenletbe bevisszük mint bináris változót (nem magas: 0, magas: 1) ezt a független változót, és kiszámítatjuk az OR-t

32 A logisztikus regressziós számítással megoldható problémák Az egyes vizsgált változók hatásának számszerűsítése esély-arány (95% CI) formájában Ha két változó egymástól független és nem befolyásolják egymás hatását, akkor vizsgálni lehet, hogy van-e együttes hatásuk (joint effect) A két független változó egymástól független, de befolyásolják egymás hatását a függő változóra, számszerűsíteni lehet ezt a kölcsönhatást (interakciót) is

33

34 Független egymást nem befolyásoló változók Mind a magas anti-hsp60 szint, mind a Chl. pneum. fertőzöttség összefüggésben van az ISZB-vel (OR: 7.47 ( ), ill ( ). A két változó között nincs korreláció: Spearman r: (p=0.91) Számítsuk ki a magas anti-hsp60 szint OR-át, a Chl.pneum. szeronegatívoknál (2.06 ( )) és a Chl. pneum. szeropozitívoknál (3.85 ( ). Tehát az ISZB és a magas anti-hsp közötti összefüggés fennáll a Chl. pneumoniae fertőzéstől függetlenül, a két változó nem (gyengén?) befolyásolja egymást

35

36 Két változó együttes hatása

37 INTERAKCIÓ

38 Az alap szérum IL-6 szint és a 3 éves mortalitás

39 A korábbi cerebrovascularis betegség (CVB) hatása az IL-6 és a mortalitás közötti összefüggésre (interakciót találtak, p=0.09)

40 HaplotípusEgészséges kontrollok Egyének száma (%) Colorectalis carcinomások Egyének száma (%) P érték LTA 252G+TNF  - 308A +HSP G + RAGE -429C non carrier heterozygote 108 (92.3) 9 (7.7) 148 (80.9) 35 (19.1) A 6.1 kiterjesztett haplotípus és a colorectalis carcinoma

41 Interakció 8.1 haplotípus*nem p= haplotípus*életkor p=0.009

42 =67 éves (B); nők (C) and férfiak (D)

43 Table 4 Gender-adjusted risk of carriers vs non carriers of the LTA 252A+TNF  -308A+ HSP G + RAGE -429T haplotype belonging to different age groups at diagnosis to have colorectal cancer GroupOdds ratio (95% confidence interval) P values < 67 years old5.878 ( )0.021 > 67 years old1.858 ( )0.244 All patients2.870 ( )0.008

44 GroupOdds ratio (95% confidence interval) P values Females4.208 ( )0.024 Males1.828 ( )0.315 All patients2.870 ( )0.008 Table 5 Age-adjusted risk of females and male carriers vs non carriers of the LTA 252A+TNF  -308A+HSP G + RAGE -429T haplotype to have colorectal cancer

45 TOVÁBBI PÉLDÁK

46 1. példa. Dean D és mtsai: (PLoS Med 5(1): e14. doi: /journal.pmed A trachoma a vakság egyik leggyakoribb oka, a Földön, elsősorban az elmaradott országokban 6 millió trachoma miatt megvakult ember él. A szerzők azt vizsgálták, hogy a trachoma ismert kórokozója (Chlamydia trachomatis) mellett más Chlamydia speciesek (Chl. psittaci és Chl. pneumonia) is mutatnak-e a betegséggel összefüggést. A kérdést az teszi indokolttá, hogy a betegség kifejlődést gátló, ill. a progressziót lassító gyógyszeres és műtéti beavatkozások hatékonysága elmaradt a várttól és ezért felmerült a vakcináció szükségessége. A vizsgálat során egy nepáli völgyben élő trachomások és nem trachomás kontrollok könny és vérmintáiban vizsgálták a háromféle Chlamydia species elleni IgG típusú antitestek előfordulását

47 Két Chlamydia (Chl trachomatis és Chl. psittaci) species elleni antitest jelenléte erősen szignifikánsan megnöveli a trachoma rizikóját, míg a Chl pneumoniae esetében nem találtak ilyen összefüggést

48 2. példa. Feng B-J és mtsai (PLoS Genet 5(8): e doi: /journal.pgen ) A psoriasis a bőr gyulladásos betegsége minden 50-dik európaiban jelen van. Jól ismert a psoriasis erős kapcsolata az MHC I. osztályú HLA-C antigénekkel, azonban több adat, köztük a szerzők által végzett teljes genom szűrés is arra mutat, hogy más az MHC régióban kódolt gének is hozzájárulhatnak a psoriasis iránti hajlam megnöveléséhez. Jelen munkában azt vizsgálták, hogy a régióban hol találhatók még a psoriasissal asszociált polimorfizmusok és ezek függetlenek-e a HLA-Cw rizikó allélektől.

49 A HLA-B40 esetében szignifikáns védő hatást tapasztaltak, míg a HLA-B57 hordozás esetében szignifikánsan megnövekedett psoriasis rizikóval járt együtt

50 3. példa. Gonzalo V és mtsai (PLoS ONE 5(1): e8777. doi: /journal.pone ) A szerzők a vastagbélrák és gén-promoterek abnormális metilációja közötti kapcsolatot vizsgálták 47 betegben és ugyanennyi nemben és életkorban illesztett kontrollban. a gén metilációjának mértékét mérték, kvantitatív metilációt mérő PCR reakciót használva. Szoros összefüggést észleltek a tumoros léziók száma és a metiláció mértéke között. Mivel más tényezők is összefüggtek a tumoros léziók számával, az összefüggést többszörös logisztikus regresszióval is megvizsgálták..

51 Három gén-promoter esetében találtak olyan összefüggést, amely még az adjusztálás után is szignifikáns volt, mutatva, hogy a e gének metilációjának mértéke összefügg a léziók számával


Letölteni ppt "TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ."

Hasonló előadás


Google Hirdetések