Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Regresszió és korreláció 2013. 03. 09.. Lineáris regresszió Regressziós vizsgálatok Korrelációs együttható Korreláció és függetlenség.

Hasonló előadás


Az előadások a következő témára: "Regresszió és korreláció 2013. 03. 09.. Lineáris regresszió Regressziós vizsgálatok Korrelációs együttható Korreláció és függetlenség."— Előadás másolata:

1 Regresszió és korreláció

2 Lineáris regresszió Regressziós vizsgálatok Korrelációs együttható Korreláció és függetlenség

3 Bizonyos esetekben tudjuk/gyanítjuk, hogy az adatok ingadozásáért egy másik, ugyancsak változó tényező a felelős Pl.: –RR különböző életkorokban más értékek –Laboratóriumi mérést helyiség hőmérséklete befolyásol, növeli a szórást

4 Kézenfekvő lenne ennek a külső változónak az ingadozását megszüntetni, értékét azonos szinten tartani – nem mindig lehetséges Másik megoldás, hogy a zavaró változó hatását igyekszünk felderíteni, és számítással kiküszöbölni.

5 Bizonyos esetekben ennek a hatásnak a természete jobban érdekel minket, mint magának a szórásnak a csökkentése Pl.: Hogyan változik (és változik-e egyáltalán) –a korral a vérnyomás –a koncentrációval a törésmutató Eredeti változónkat tehát mintegy a másik függvényében vizsgáljuk – regressziós vizsgálatok

6

7 Adrenalin hatására vizsgáljuk az izomrángást Adrenalin dózis növekedésével a rángásidőt vizsgáljuk Próbáljuk egyenessel megközelíteni a hatás jellemzését

8

9 x változó vizsgált értékeit mi választjuk ki, y i adatok eltérését az egyenestől rögzített x i értéknél (tehát a függőlegesen vizsgáljuk) Célunk, hogy a függőleges egyenesekből számolt szórás a lehető legkisebb legyen y=a+bx ahol b a meredekség, a tengelymetszet

10

11

12 Regressziós vizsgálatok A regressziós összefügéseket nem mindig egyenes ábrázolja a legjobban Sokszor görbe jellemzi: parabola, hiperbola vagy exponenciális görbe Előfordul, hogy a dózis logaritmusa áll lineáris kapcsolatban a hatással

13 Valóságos regressziós egyenlet: 1., x és y tengelyen ábrázolt adatokra rátekintve mondhatjuk meg, hogy milyen görbe jellemzi 2., Megmérjük az összefüggés szorosságát, ezt a célt szolgálja a korrelációs együttható

14 Kovariancia (s xy ): az együttes ingadozás mértékszáma Korelációs együttható (r): a kovariancia a szórások szorzatával osztva

15 Pozitív hajlásszögű egyenes: b>0, a korrelációs együttható (r) is pozitív lesz, ezt pozitív korrelációnak nevezzük. Negatív hajlásszögű egyenes: a korrelációs együttható is negatív, negatív korrelációról beszélünk r=0 korrelálatlanságról beszélünk, ilyenkor regressziós egyenes vízszintes (b=0) (ilyenkor y átlagos értéke ugyanaz marad, akárhogyan is változik x)

16 A korrelációs együttható csak -1 és +1 közti értékeket vehet fel A együttható abszolút értéke jellemzi a kapcsolat szorosságát (mennél jobban tömörülnek a pontok az egyenes körül annál nagyobb r abszolút értéke) +1 vagy -1 értéket akkor és csak akkor éri el az együttható, ha a pontok valamennyien rajta fekszenek az egyenesen

17 Két változó együttváltozása lehet, hogy csak egy harmadik változó hatásának eredménye: mindkettejük alakulását az szabályozza, maguk a vizsgált változók azonban semmiféle befolyással nincsenek egymásra Pl.: gyulladásos folyamat lázat és fvs szám növekedést okoz. De sem a láztól a fvs, sem a fvs növekedéstől a testhőmérséklet nem változik

18 Még ha ok-okozati összefüggés áll is fenn a két vizsgált változó között, pusztán korrelációs együttható segítségével akkor sem tudjuk eldönteni hogy melyik befolyásolja a másikat Az ok megkeresése biológiai probléma nem pedig biometriai

19 A korreláció hiánya, a korrelálatlanság (r=0) hasonlóképpen hibás következtetésekre indíthat – mivel a változók közötti kapcsolat hiánya miatt könnyen értelmezhetjük úgy, hogy az adatok függetlenek egymástól Pl.: az életkor függvényében vizsgált összefüggések

20

21 Erre a legjobban közelítő egyenes a vízszintes lesz Erre az eredményt azonban a legjobban nem az egyenes reprezentálja hanem egy görbe.

22 Nem minden görbevonalú kapcsolat esetén ennyire félrevezető az r együttható segítségével szerzett információ, de ajánlatos azzal mindig óvatosan bánnunk A normális eloszlás fontos kivétel: elméletileg igazolható, hogy ilyenkor vagy lineáris kapcsolat van a változók között vagy semmilyen Normális eloszlás esetén tehát a korrelálatlanság (lineáris kapcsolat hiánya) már biztosítja a függetlenséget.

23 Fordított irányú következtetés viszont mindig helyes: a változók függetlensége esetén a korrelációs együttható mindenképp nulla

24 Bizonyos esetekben az r becsaphat: korrelációt találhatunk ott is ahol valójában függetlenség van, máskor meg kétségkívül fennálló lineáris kapcsolatot „nem veszi észre” a mintából számított r együttható, a mintaelemek speciális elhelyezkedése miatt

25 A körben elhelyezkedő végtelen sok érték közül választunk ki néhányat – a változóból a mintát -, és ezekből határozzuk meg a korrelációs együtthatót. Mivel a kiválasztott pontok véletlenül egy egyenes mentén helyezkednek el, a korrelációs együttható értéke közel lesz az 1-hez. Emiatt arra a következtetésre jutunk, hogy a változók közt szoros kapcsolat van.

26

27 Más esetben a változók értékeit ábrázoló pontokból a köztük lévő lineáris összefüggés nyilvánvaló; a kiválasztott pontok – ismét csak véletlenül – azonban úgy helyezkednek el, hogy rajtuk vízszintes egyenest fektethetünk át. Az így kapott r=0 alapján a változók korrelálatlanságára (sőt gyakran függetlenségére) következtethetünk

28

29 A fenti ellentmondásokat az eddigi módszerekkel már nem tudjuk feloldani. Statisztikai következtetés módszereinek helyes alkalmazása megvéd az utóbbi kettő tévedéstől.

30 Az eloszlások paramétereire vonatkozó próbák U próba T (student) próba F próba

31 u-próba He egy ismert σ szórású (normális eloszlású) alapsokaságból vett n elemszámú minta átlagára vonatkozó nullhipotézisünket akarjuk ellenőrizni

32 Átlagsúly kg A súlyok szórása 0.060kg Szignifikancia szint 5% (μ p =0.05) Ehhez tartozó kritikus érték: 1.96

33 t-(student) próba T-próbával ellenőrizhetjük két ismeretlen minta középértékeire vonatkozó hipotézisünket, a két mintaátlag különbségének szignifikanciáját. A két mintaátlag különbözősége önmagában nem bizonyítja a két várható érték eltérését, erre a t-próba ad felvilágosítást

34 t-(student) próba A t-próba alkalmazásának előfeltétele, hogy a két valószínűségi változó követi a normális eloszlást, és szórása egyenlő

35

36 F-próba Mind az u-próbánál, mind a t-próbánál feltéteteleztünk valamit a sokaság szórásáról: Az u-próbánál azt, hogy ismert, t-próbánál pedig azt, hogy az összehasonlított sokaságok szórása azonos. A szórással kapcsolatos ezen hipotéziseink ellenőrzésére alkalmas az F-próba

37 F-próba A nullhipotézis itt azt jelenti, hogy két normális eloszlású ismeretlen várható értékű sokaság szórása azonos (σ 1 =σ 2 ) A két sokaságból vett minta szórásnégyzeteinek hányadosa F- eloszlást követ

38 KÖSZÖNÖM A FIGYELMET!


Letölteni ppt "Regresszió és korreláció 2013. 03. 09.. Lineáris regresszió Regressziós vizsgálatok Korrelációs együttható Korreláció és függetlenség."

Hasonló előadás


Google Hirdetések