REGRESSZIÓS SZÁMÍTÁSOK II

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

4. Két összetartozó minta összehasonlítása
Az onkológiai betegek pszicho-szociális szükségleteinek felmérése
IBM SPSS Statistics Regressziós elemzések Informatikai Tudományok Doktori Iskola.
A terápia specialitása renális hypertoniában Prof. Dr. de Châtel Rudolf egyetemi tanár Semmelweis Egyetem ÁOK I. sz. Belgyógyászati Klinika, Budapest.
3. Két független minta összehasonlítása
Perifériás érbetegségek
Földrajzi összefüggések elemzése
Valószínűség számítás
Lineáris és nemlineáris regressziók, logisztikus regresszió
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Összefüggés vizsgálatok
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Az analitikus epidemiológia vizsgálat célja:
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Regresszióanalízis 10. gyakorlat.
Varianciaanalízis 12. gyakorlat.
Dr. Gombos Tímea SE, III.sz. Belgyógyászati Klinika
Miért kell többváltozós modellekhez folyamodnunk (a túlélési analízis során)?
Dr. Masszi Gabriella November 12. SOTE –NET Barna-terem
III. Sz. Belgyógyászati Klinika
SPSS többváltozós (lineáris) regresszió (4. fejezet)
SPSS többváltozós regresszió
Hyperuricaemia és hypertonia Hypertonia Központ Óbuda, Budapest
KÉT VÁLTOZÓ KÖZÖTTI KAPCSOLAT MÉRÉSI MÓDJAI: A KORRELÁCIÓ ÉS A REGRESSZIÓ Az alapvető kérdés: van-e kapcsolat két, ugyanabban az egyénben, állatban, kísérleti.
TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II
Többszörös regresszió I. Többszörös lineáris regresszió
REGRESSZIÓS SZÁMÍTÁSOK II
Hipotézisvizsgálat (1. rész) Kontingencia táblák
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Nem-paraméteres eljárások, több csoport összehasonlítása
TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II
Kovarianciaanalízis Tételezzük fel, hogy a kvalitatív tényező(k) hatásának azonosítása után megmaradó szóródás egy részének eredete ismert, és nem lehet,
ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.
A két vagy több független változó elemzéséhez használható különböző módszerek (Dawson, Trapp, 2001)
KÉT VÁLTOZÓ KÖZÖTTI KAPCSOLAT MÉRÉSI MÓDJAI: A KORRELÁCIÓ ÉS A REGRESSZIÓ Az alapvető kérdés: van-e kapcsolat két, ugyanabban az egyénben, állatban, kísérleti.
Többszörös regresszió I. Többszörös lineáris regresszió miért elengedhetetlen a többszörös regressziós számítás? a többszörös regressziós számítások fajtái.
A regressziós egyenes egyenlete
Kvantitatív módszerek
Adatmodellek A modellezés statisztikai alapjai. Statisztikai modell??? cél: feltárni, hogy bizonyos jelenségek között létezik-e az általunk feltételezett.
Nemparaméteres próbák Statisztika II., 5. alkalom.
1 Szemléletváltás az ST-elevatióval járó acut myocardialis infarctus kezelésében a váci Jávorszky Ödön Kórház Kardiológiai Osztályán az elmúlt 35 év során.
XVIII. Pest Megyei Orvosnapok
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
STATISZTIKA II. 7. Előadás
Matematikai statisztika Készítették: Miskoltzy Judit Sántha Szabina Szabó Brigitta Tóth Szabolcs Török Tamás Marketing Msc I. évf., I. félév, levelező.
Matematikai statisztika Készítették: Miskoltzy Judit Sántha Szabina Szabó Brigitta Tóth Szabolcs Török Tamás Marketing Msc I. évf., I. félév, levelező.
Az élettársi kapcsolatban élők házasságkötése - az értékek és beállítódások szerepe a párkapcsolatok (ki)alakulásában Spéder Zsolt Kapitány Balázs KSH.
Kvantitatív Módszerek
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapsokaság (populáció)
Lineáris regresszió.
Többtényezős ANOVA.
t A kétoldalú statisztikai próba alapfogalmai

Diszkrét változók vizsgálata
Valószínűségszámítás
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Kard és pajzs viszonya az egészségügyben
SIMON ZSÓFIA, MILTÉNYI ZSÓFIA, MAGYARI FERENC, BARNA SÁNDOR 1, KENYERES ANNA, JÓNA ÁDÁM, ILLÉS ÁRPÁD DEKK BELGYÓGYÁSZATI INTÉZET, HEMATOLÓGIA TANSZÉK,
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
Márk Ágnes, Barna Gábor, Csomor Judit, Kriston Csilla, Matolcsy András
Kiváltott agyi jelek informatikai feldolgozása 2016
Dr. Varga Beatrix egyetemi docens
Trendelemzés előadó: Ketskeméty László
Valószínűségi változók együttes eloszlása
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Dr. Varga Beatrix egyetemi docens
Előadás másolata:

REGRESSZIÓS SZÁMÍTÁSOK II LOGISZTIKUS REGRESSZIÓ

Logisztikus regresszió 1. binomiális vagy kétváltozós (bináris) logisztikus regresszió Analyze  Regression  Binary Logistic … akkor használjuk, ha a célváltozónk dichotóm (pl. igen/nem) a próba megmutatja, hogy a bemeneti változók közül melyiknek van szignifikáns hatása ha a hatás szignifikáns, az esélyhányados /Exp(B)/ megmutatja, hogy a dichotóm célváltozó egyik értékének mennyivel nagyobb a valószínűsége Szabó Gábor, 2005.

Logisztikus regresszió 2. alkalmas a próba a közvetett hatások kimutatására is ha egy változó szignifikáns hatása eltűnik egy újabb változó bevonásával, ott közvetett hatásra gyanakodhatunk szemüveges-e Szign.:0,04; Exp(B)=2,0 sikeresen vizsgázott? (igen/nem) szemüveges-e Szign.:0,25; Exp(B)=1,2 sikeresen vizsgázott? (igen/nem) Szign.:0,03; Exp(B)=1,8 hány könyvet olvas évente Szabó Gábor, 2005.

Bináris logisztikus regresszió AZ Y ESEMÉNY BEKÖVETKEZÉSÉNEK ESÉLYE A vizsgált Y esemény lehet pl. a szívinfarktus (bekövetkezett vagy nem következett be), transzplantáció eredménye (a beültetett szerv kilökődött vagy nem lökődött ki) a tüdőrák megfigyelésének az eredménye egy prospektív vizsgálat során (kialakult a megfigyelt egyéneknél a tüdőrák vagy sem). Ilyen esetekben – az xi független változók egyaránt tartalmazhatnak folytonos és nominális adatokat –, az Y esemény bekövetkezési valószínűségét logisztikus regresszióval becsüljük. Az eljárás nagyon hasonlít a korábban megismert lineáris regresszióhoz

Logisztikus regresszió (folyt) A logisztikus regreszió használata előtt az y függő változót binárissá kell kódolni (0= az esemény nem következett be, 1= az esemény bekövetkezett). A számítógépes programok a regressziós koefficiensek mellett (a, bi) az OR értékeket és azok 95%-os konfidenciaintervallumát is meghatározzák. A számítási eljárás bonyolultabb mint a lineáris regressziónál. Általában az iteratív maximum likelihood módszert használják a számítógépes programok. A logisztikus regresszió alkalmazásánál vegyük figyelembe a következőket: az egyéneket egymástól függetlenül, random módon válasszuk a mintába legalább 5 - 10 esemény jusson mindegyik vizsgált prediktor változóra.

Logistic regression (1) Table 2 Age and signs of coronary heart disease (CD)

How can we analyse these data? Compare mean age of diseased and non-diseased Non-diseased: 38.6 years Diseased: 58.7 years (p<0.0001) Linear regression?

Dot-plot: Data from Table 2

Logistic regression (2) Table 3 Prevalence (%) of signs of CD according to age group

Dot-plot: Data from Table 3 Diseased % Age group

Logistic function (1) Probability of disease x

{ Transformation a = log odds of disease in unexposed b = log odds ratio associated with being exposed e b = odds ratio logit of P(y|x) {

Fitting equation to the data Linear regression: Least squares Logistic regression: Maximum likelihood Likelihood function Estimates parameters a and b Practically easier to work with log-likelihood

Maximum likelihood Iterative computing Results Choice of an arbitrary value for the coefficients (usually 0) Computing of log-likelihood Variation of coefficients’ values Reiteration until maximisation (plateau) Results Maximum Likelihood Estimates (MLE) for  and  Estimates of P(y) for a given value of x

TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ

A többszörös elemzés a klinikai orvostudományban, egy példa Volpato, S et al: Cardiovascular Disease, Interleukin-6 and Risk of Mortality in Older Women. The Women’s Health and Aging Study. Circulation, 103, 947, 2001 620 >65 éves nő, anamnézis, orvosi vizsgálat, vérvétel, különböző gyulladásos markerek meghatározása: IL-6, CRP, albumin 3 éves követés (PROSPEKTÍV VIZSGÁLAT), a halálozás és ennek okának regisztrálása

Az alap szérum IL-6 szint és a 3 éves mortalitás

A különböző IL-6 szérumszintű betegek demográfiai és egészségügyi jellemzői

Kérdés Mennyivel nagyobb kockázatuk (relatív rizikó) a magas IL-6 szintű egyéneknek a közepes és az alacsony IL-6 szintű egyénekhez viszonyítva arra, hogy 3 éven belül meghaljanak? Prospektív vizsgálat, RR számolható.

A feladat az, hogy matematikai módszerekkel kiküszöböljük az egyéb tényezőket, amelyek a három IL-6 szintű csoportban különböznek és így adjunk választ a fenti kérdésre Ebből a célból különböző modelleket építünk fel, és a logisztikus regresszió módszerével végezzük el a számítást.

A 3 éves mortalitás nyers és adjusztált relatív rizikója (95% CI) az IL-6 szérumszint szerint

Kiechl, S. et al.: Chronic Infections and the Risk of Carotid Atherosclerosis. Circulation, 103, 1064, 2001 Bruneck tanulmány: 1990, 826 40-79 éves egyén, carotis duplex scan: carotis atherosclerosis foka, plakkok száma). A vizsgált egyéneknél rögzítették, hogy szenvednek-e valamilyen krónikus légúti, húgyúti, fogászati vagy egyéb infekcióban. A vizsgált egyének vérében megmértek egyes a krónikus infekcióra jellemző laboratóriumi markereket)

KÉRDÉSEK 1) VAN-E ÖSSZEFÜGGÉS A KRÓNIKUS FERTŐZÉSEK KLINIKAI ÉS LABORATÓRIUMI JELEI ÉS A CAROTIS ATHEROSCLEROSIS MÉRTÉKE KÖZÖTT A VIZSGÁLAT IDŐPONTJÁBAN (keresztmetszeti vizsgálat) 2) VAN-E ÖSSZEFÜGGÉS A KRÓNIKUS FERTŐZÉSEK KLINIKAI ÉS LABORATÓRIUMI JELEI ÉS AZ ÚJ CAROTIS PLAKKOK KIFEJLŐDÉSE KÖZÖTT (prospektív vizsgálat) Számítás módja: többszörös lépcsőzetes logisztikus regressziós analízis

500 egyénben a kezdeti vizsgálatkor nem találtak carotis plakkot, közülük 125-ben fejlődött ki carotis plakk az 5 éves megfigyelési idő alatt. Mi jelezte ezt előre? OR: kategorikus: igen/nem, folyamatos: 1 egység növekedés

Tsobuno Y et al. Green Tea and the Risk of Gastric Cancer in Japan Tsobuno Y et al. Green Tea and the Risk of Gastric Cancer in Japan. NEJM 344, 632, 2001. 1984, 26311 > 40 éves Miyagi tartomány, kérdőív: zöldtea fogyasztás mértéke Követési idő: 1999 748 személy-év 1982 dec.-ig. 419 gyomorrák, diagnózis időpontja Kérdés: befolyásolja-e a zöldtea fogyasztás a gyomorrák kifejlődésének az esélyét? Számítás: Cox regressiós analízis, reletív rizikó (prospektív vizsgálat): alap: <1 csésze/nap. A gyomorrák kimenetelét esetleg még befolyásoló változók (confounding variables): életkor, nem, ulcus az anamnézisban, dohányzás, alkohol, rizs, hús/zöldség fogyasztás

A zöldtea fogyasztás és a gyomorrák kifejlődésének relatív rizikója

Kimenetel (függő változó) Példa a kimenetelre A használandó többszörös analitikai módszer Folyamatos Vérnyomás, testsúly, hőmérséklet Többszörös lineáris regresszió Dichotóm (igen-nem) Halál, rák, felvétel intenzív osztályra Többszörös logisztikus regresszió Az igen eseményig eltelt idő A halálig, a rák dg-ig eltelt idó Cox regresszió (proportinal hazard analízis)

A cukorbetegek magas testtömeg-indexe ill A cukorbetegek magas testtömeg-indexe ill. HDL-koleszterin szintje befolyásolja-e az ischemiás szívbetegség kifejlődésének kockázatát? Változó Nem ISZB-s (n=156) ISZB-s (n=76) p-érték (Fisher exact teszt) BMI (kg/m2) <25 64 16 0,003 >25 92 60   HDL-koleszterin (mmol/l) <1,3 88 56 0,014 >1,3 68 20

Változó B SEM Wald df p-érték BMI magas/normál* 0,959 0,325 8,701 1 0,003 Konstans -1,386 0,280 24,599 0,0002 A BMI anti-ln(B)-je (esélyhányados, odds ratio, OR)   OR Az OR 95%-os CI-je 2,609 1,380 - 4,933

Változó B SEM Wald df p-érték HDL normál/alacsony* -0,772 0,306 6,342 1 0,012 Konstans 0,500-0,4523 0,171 6,991 <0,0001 A HDL anti-ln(B)-je (esélyhányados, odds ratio, OR) OR Az OR 95%-os CI-je 0,462 0,253 - 0,843

A többszörös modellek feltételezései (assumptions) TÖBBSZÖRÖS LINEÁRIS TÖBBSZÖRÖS LOGISZTIKUS PROPRCIONÁLIS HAZARD ANALÍZIS MIT MODELLEZÜNK? A függő változó átlaga A függő változó egyik értéke bekövetkezése esélyének (odds) temészetes logaritmusa (logit) A relativ kockázat (hazard) logaritmusa A FOLYAMATOS FÜGGETLEN VÁLTOZÓK VISZONYA A FÜGGŐHÖZ (KIMENETELHEZ) A függő változó átlaga lineárisan változhat több független változóval is A függő változó logitja lineárisan változhat több független áltozóval is A relatív hazard logaritmusa lineárisan változhat több független áltozóval is A SKALARIS FÜGGETLEN VÁLTOZÓK VISZONYA A FÜGGŐHÖZ (KIMENETELHEZ) A függő változó átlaga lineárisan változhat több független változó egységnyi változásával is A függő változó logitja lineárisan változhat több független változó egységnyi változásával is A relatív hazard logaritmusa lineárisan változhat több független változó egységnyi változásával is A FÜGGŐ VÁLTOZÓ ELOSZLÁSA Normális Binomiális Nincs meghatározva

Többszörös logisztikus regresszió Számszerűen (odds ratio formájában) fejezi ki az összefüggést egy független változó és egy dichotóm (beteg/nem beteg, férfi/nő, magas/nem magas, stb) függő változó között úgy, hogy ezt az összefüggést a többi független változóhoz illeszti (adjusted) tehát matamatikai módszerekkel a többi független változó hatását kiküszöböli. A cél általában a predikció.

Relatív rizikó (relative risk) , esély-arány (odds ratio) Példa: Az AIDS definiciójának megfelelő opportunista infekciók vagy tumorok előfordulása (továbbiakban röviden és helytelenül AIDS) előrehaladott HIV betegségben szenvedő betegekben. A betegeket folyamatosan két reverz transzkriptáz gátló szerrel kezelték, és két csoportra randomizálták. Az egyik csoport egy proteáz inhibitort (Ritonavir) is kapott, a másik csak placebot az alapkezelés mellett. 16 hétig regisztrálták az AIDS definiciójának megfelelő opportunista infekciók vagy tumorok előfordulását. (Cameron et al. Lancet 351, 543, 1998)

Relatív rizikó Relatív rizikó: A/A+B osztva C/C+D-vel: a példában 119/543 osztva 205/547-el: 0.22/0.37=0.59 (95% CI: 0,48-0.71), tehát az AIDS kiejlõdésének a relatív kockázata a Ritonavírral kezelt csoportban csaknem a fele a szokásos kezelést kapott betegek kockázatának

Esély-arány (OR) Először mindkét csoportban kiszámítjuk az esélyét annak, hogy egy esemény, példánkban az AIDS kifejlődése, bekövetkezzen. Ez A/B, ill C/D, tehát példánkban 119/424=0.28, ill. 205/342=0.60. A két esély arány tehát A/B osztva C/D-vel, 0.28/0.60=0.47 (95% CI 0.33-0.67). Tehát a ritonavírrel is kezelt betegeknek az esélye arra, hogy bennük AIDS fejlõdjön ki. kevesebb, mint fele annak, amely a ritonavirrel nem kezelt betegek esetében áll fenn. EZ AZ ÖSSZEFÜGGÉS AZONBAN CSAK AKKOR IGAZ, HA A KÉT CSOPORT MÁS SZEMPONTBÓL NEM KÜLÖNBÖZIK EGYMÁSTÓL. HA IGEN: TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ VAGY MÁS HASONLÓ ELJÁRÁS ELVÉGZÉSE SZÜKSÉGES

A TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ Matematikai-statisztikai eljárás, amelyet akkor alkalmazunk, ha egy dichotóm változó bekövetkezésének valószínűsége és az egyes független változók közötti kapcsolatot szeretnénk kiszámítani. Ha a független változó nominális, akkor ezt 0-val, ill 1-el jelőljük, ha folyamatos, akkor egy egységnyi növekedésre vonatkozik a kapcsolat, az OR.

A logisztikus regresszió során alkalmazott számítási mód A lineáris regresszióval ellentétben, amelynél a számítás az ún. legkisebb négyzetek módszerén alapszik, a logisztikus regresszió számítási módja az un. maximum likehood ratio kiszámítása. Ez, mint minden valószínűség-arány számítás, exponenciális, tehát a természetes logaritmus alapra vonatkozik. Ezt átalakítjuk úgy, hogy az egyenlet mindkét oldalán ln-t számítunk.

A logisztikus regresszió egyenlete odds (bekövetkezik/nem következik be, A/B= P/1-P. Ha a ln-át vesszük, ln (odds) = ln (P/1-P) = ßo + ßII Ha ezt az egyes független változók szerint részeire bontjuk, akkor ln (odds) = ßo + X1ß1 + X2ß2.... A ßo azt jelenti, hogy a ln(odds) mennyivel egyenlő, ha minden független változó = 0. A ß1 érték egyenlő az X változóra vonatkozó OR ln-ával, stb.

A logisztikus regresszió egyenlete (folyt.) A 0 hipotézisünk az, hogy a vizsgált változók által meghatározott esély-arány (OR) nem különbözik 1-től, tehát ezek a változók nem növelik az adott esemény bekövetkeztének valószínűségét. Ennek az OR-nek vesszük a ln-át, majd az egyenletet úgy alakítjuk át, hogy ezt az OR-t felbontjuk az egyes változók által meg-határozott OR-ekre, pontosabban ezek ln-ára ln (OR) = X1(lnOR1) + X2(lnOR2).... Az egyes komputer programok vagy a ß vagy az OR értékeket adják meg, átszámíthatók: ß = ln(OR)

Modell felépítés a logisztikus regresszióban Hasonló a lineáris regresszióhoz manuális automatikus: forward selection backward elimination stepwise selection A számítógépes programok mérőszámot adnak (vö R2 a lineáris regressziónál), amely az egyes modellek „jóságát” (goodness of fit) fejezik ki.

A többszörös logisztikus regresszióval kapcsolatos legfontosabb kérdések Elegendő a megfigyelések száma? (5-10-szer több eset, mint változó) A modell megfelelő-e? Ha van interakció az egyes változók között, ezt a modell felépítésnél figyelembe kell és lehet is venni. Van-e az eredményeknek biológiai értelme? (automatikus modellfelépítés!) Ha váratlan összefüggés jön ki, lehet véletlen, de lehet értelme is: hipotézis felállítás, de ellenőrzés új vizsgálatban!!!

Példa a többszörös logisztikus regresszióra (Burián et al, Circulation, 2001)

Kérdés A négy paraméter előre képes-e jelezni, hogy egy adott egyén az ISZB-s beteg vagy kontroll-csoportba tartozik? Számítás többszörös logisztikus regresszió független változók: HDL-koleszterin, a triglicerid és az anti-hsp60 szintek (folyamatos változók, 1 SD változás) és a Chl, pneumoniae (nominális 0 (szeroneg), 1 (szeropoz) Függő változó: csoport 0: kontroll, 1: ISZB

STATISTICA OUTPUT Model: Logistic regression (logit) N of 0's:48 1's:241 Dep. var: CSOPORT Loss: Max likelihood (MS-err. scaled to 1) Final loss: 115,14789192 Chi˛(4)=29,591 p=,00001 Const.B0 LOGHSP60 HDL_CHOL TRIGLICE CHL_PNEU Estimate -,74 ,9383 -,186086 ,51 ,71548 SE ,68 ,2997 ,284498 ,18 ,36015 t(284) -1,08 3,1305 -,654084 2,81 -1,98662 p-level ,28 ,0019 ,513587 ,01 ,04792 -95%CL -2,08 ,3483 -,746078 ,15 -1,42439 +95%CL ,61 1,5282 ,373907 ,86 -,00658 Wald's khi2 1,16 9,8000 ,427826 7,88 3,94668 p-level ,28 ,0017 ,513062 ,00 ,04697 OR (unit ch) ,48 2,5556 ,830202 1,66 ,48896 -95%CL ,12 1,4167 ,474223 1,16 ,24066 +95%CL 1,84 4,6101 1,453402 2,37 ,99344

Milyen jó a modell? (Goodness of fit) SPSS A measure of how well the model fits the data. It is based on the squared differences between the observed and predicted probabilities. A small observed significance level for the goodness-of-fit statistic indicates that the model does not fit well.

MIHEZ SZÁMÍTSUK AZ ODDS RATIOT? Ha a független változó kategorikus, főleg, ha bináris, akkor OK (beteg/nem beteg, dohányzik/nem dohányzik, férfi/nő, stb.). Ha viszont a független változó folyamatos, akkor koncepcionálisan nehéz felfogni, hogy egy egység változás mit jelent. Megoldások: értelmes kategóriákat állítok fel: pl. életkorban 10 év, binárissá teszem a független változót ( alacsony/nem alacsony, magas/nem magas labor. lelet, IQ, stb.)

HOL HÚZZUK MEG A HATÁRT? A binárissá átalakítandó független változó minden adatát (a függő változó eredményétől függetlenül!!!) sorba rendezzük és megállapítjuk, hol van a 90. percentilis, a legfelsőbb (legalsóbb) kvartilis, tercilis, esetleg a medián határa. (legtöbb program megcsinálja) Ezután megvizsgáljuk, hogy a függő változóhoz tartozó két csoportban a magas/nem magas stb. kategóriába tartozó független változó hány esetben fordul elő Végül a logisztikus regressziós egyenletbe bevisszük mint bináris változót (nem magas: 0, magas: 1) ezt a független változót, és kiszámítatjuk az OR-t

Anti-hsp60 legfelső kvartilis vs. többi Példánkban az anti-hsp60 legfelső kvartilisának határa: 183,24 AU/ml. Ezután átkódoljuk a változót, úgy, hogy 0: <183.24, 1: >183.24. Megszámoltatjuk a géppel, hogy a beteg, ill kontroll csoportban hány 0 és 1 anti-hsp60 antitest szintű egyén van. HSP60KV HSP60KV Row alacsony magas Totals KO 51 3 54 PS 175 73 248 All Grps 226 76 302 Végül elvégezzük a logisztikus analízist a folyamatos változót a binárissal helyettesítve

STATISTICA OUTPUT Const.B0 HDL_CHOL TRIGLICE HSP60_M_ CHL_PNEU Estimate 2,06560 -,79768 ,1339 2,00283 -,92184 SE ,54187 ,34038 ,1409 ,62255 ,36728 t(287) 3,81201 -2,34351 ,9505 3,21714 -2,50987 p-level ,00017 ,01979 ,3426 ,00144 ,01263 -95%CL ,99906 -1,46764 -,1434 ,77749 -1,64475 +95%CL 3,13214 -,12773 ,4112 3,22817 -,19892 Wald's khi214,531405,49206 ,9035 10,35002 6,29946 p-level ,00014 ,01911 ,3419 ,00130 ,01208 OR(u.ch) 7,89002 ,45037 1,1433 7,40998 2.34 -95%CL 2,71574 ,23047 ,8664 2,17600 1.18 +95%CL 22,92288 ,88009 1,5086 25,23339 4.66

A logisztikus regressziós számítással megoldható problémák Az egyes vizsgált változók hatásának számszerűsítése esély-arány (95% CI) formájában Ha két változó egymástól független és nem befolyásolják egymás hatását, akkor vizsgálni lehet, hogy van-e együttes hatásuk (joint effect) A két független változó egymástól független, de befolyásolják egymás hatását a függő változóra, számszerűsíteni lehet ezt a kölcsönhatást (interakciót) is

Független egymást nem befolyásoló változók Mind a magas anti-hsp60 szint, mind a Chl. pneum. fertőzöttség összefüggésben van az ISZB-vel (OR: 7.47 (2.18-25.2), ill. 2.17 (1.18-4.66). A két változó között nincs korreláció: Spearman r: - 0.007 (p=0.91) Számítsuk ki a magas anti-hsp60 szint OR-át, a Chl.pneum. szeronegatívoknál (2.06 (1.12-3.78)) és a Chl. pneum. szeropozitívoknál (3.85 (2.63-5.62). Tehát az ISZB és a magas anti-hsp közötti összefüggés fennáll a Chl. pneumoniae fertőzéstől függetlenül, a két változó nem (gyengén?) befolyásolja egymást

Két változó együttes hatása

Az alap szérum IL-6 szint és a 3 éves mortalitás

A korábbi cerebrovascularis betegség (CVB) hatása az IL-6 és a mortalitás közötti összefüggésre (interakciót találtak, p=0.09)

A 6.1 kiterjesztett haplotípus és a colorectalis carcinoma Egészséges kontrollok Egyének száma (%) Colorectalis carcinomások P érték LTA 252G+TNF -308A +HSP70 1267G + RAGE -429C non carrier heterozygote 108 (92.3) 9 (7.7) 148 (80.9) 35 (19.1) 0.006

Interakció 8.1 haplotípus*nem p=0.0489 8.1 haplotípus*életkor p=0.009

<67 éves (A) and >=67 éves (B); nők (C) and férfiak (D)

Odds ratio (95% confidence interval) P values Table 4 Gender-adjusted risk of carriers vs non carriers of the LTA 252A+TNF -308A+ HSP70 1267G + RAGE -429T haplotype belonging to different age groups at diagnosis to have colorectal cancer Group Odds ratio (95% confidence interval) P values < 67 years old 5.878 (1.300-26.571) 0.021 > 67 years old 1.858 (0.655-5.266) 0.244 All patients 2.870 (1.316-6.263) 0.008

Odds ratio (95% confidence interval) P values Table 5 Age-adjusted risk of females and male carriers vs non carriers of the LTA 252A+TNF -308A+HSP70 1267G + RAGE -429T haplotype to have colorectal cancer Group Odds ratio (95% confidence interval) P values Females 4.208 (1.338-13.232) 0.024 Males 1.828 (0.564-5.929) 0.315 All patients 2.870 (1.316-6.263) 0.008

Variable Odds ratio (unadjusted) Odds ratio (adjusted to several factors*) (p values) C4B 0-1 vs 2-4 gene copy number 4.13 (1..65-10.37) (0.003) 4.65 (1.47-14.71) (0.009) Age, years 1.11 (1.05-1.18) (<0.001) 1.14 (1.07-1.22) (<0.001) Gender males/females 0.824 (0.301-2.252) (0.705) 0.518 (0.143-1.879) (0.317) Smoking history (never/quit/current) 0.983 (0.556-1.741) (0.983) 2,47 (1,00-6,08) (0.050) Family history of CVD, yes/no 0.718 (0.290-1.778) (0.475) 1.55 (0.49-4.89) (0.452) Hypertension, yes/no 1.27 (0.51-3.13) (0.605) 0.81 (0.24-2.68) (0.727) Type 2 DM, yes/no 1.37 (0.73-2.55) (0.323) 1.09 (0.48-2.48) (0.841) Atherogenic index 0.61 (0.12-3.40) (0.40) 2.16 (0.23-16.96) (0.496) PTCA yes/no 1.96 (0.63-6.07) (0.246) 1.81 (0.39-8.41) (0.447) Coronary bypass operation, yes/no 0.96 (0.09-10.10) (0.960) 0.58 (0.12-2.95) (0.515) Maximal creatinine kinase (CK) values 1.00 (0.99-1.00) (0.446) 1.00 (0.99-1.00) (0.195)

B S.E. P OR (95% CI) All patients (n=64) C1-INH low/normal* 1.9363 0.7646 0.0113 6.9330 (1.5493-31.0248) Patients w/ MBL2 A/A (n=37) 2.6369 1.0053 0.0087 13.9698 (1.9475-100.2056) Patients w/ MBL2 A/O or O/O (n=27) 1.3996 1.5912 0.3791 4.0535 (0.1792-91.6848)

Mennyi az esélye arra, hogy magas legyen a véralkoholszintje egy 27 éves kaukázusi férfinek, aki csütörtökön du. 2-kor kerül az osztályra?