5. Változók kapcsolatának vizsgálata

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Füst György III. Belklinika
4. Két összetartozó minta összehasonlítása
Kvantitatív Módszerek
Erőállóképesség mérése Találjanak teszteket az irodalomban
MATEMATIKA Év eleji felmérés 3. évfolyam
Kvantitatív módszerek
3. Két független minta összehasonlítása

6) 7) 8) 9) 10) Mennyi az x, y és z értéke? 11) 12) 13) 14) 15)
Koordináta transzformációk
Földrajzi összefüggések elemzése
A tételek eljuttatása az iskolákba
Két változó közötti összefüggés
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Összefüggés vizsgálatok
Becsléselméleti ismétlés
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Gazdaságelemzési és Statisztikai Tanszék
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Regresszió és korreláció
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
III. előadás.
Lineáris korreláció és lineáris regresszió. A probléma felvetése y = 1,138x + 80,778r = 0,8962.
Regresszióanalízis 10. gyakorlat.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Lineáris egyenletrendszerek (Az evolúciótól a megoldáshalmaz szerkezetéig) dr. Szalkai István Pannon Egyetem, Veszprém /' /
Kvantitatív módszerek
Adatmodellek A modellezés statisztikai alapjai. Statisztikai modell??? cél: feltárni, hogy bizonyos jelenségek között létezik-e az általunk feltételezett.
Matematikai alapok és valószínűségszámítás
Asszociációs együtthatók
Nemparaméteres próbák Statisztika II., 5. alkalom.
szakmérnök hallgatók számára
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
6. Változók és csoportok összehasonlítása varianciaanalízissel
7. Csoportok és változók sztochasztikus összehasonlítása (összehasonlítások ordinális függő változók esetén)
Többváltozós adatelemzés
Következtető statisztika 9.
Hipotézis-ellenőrzés (Folytatás)
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapsokaság (populáció)
Lineáris regresszió.
Új kérdések a korrelációs együtthatóval kapcsolatban
t A kétoldalú statisztikai próba alapfogalmai


Diszkrét változók vizsgálata
Két kvantitatív változó kapcsolatának vizsgálata
A klinikai transzfúziós tevékenység Ápolás szakmai ellenőrzése
QualcoDuna interkalibráció Talaj- és levegövizsgálati körmérések évi értékelése (2007.) Dr. Biliczkiné Gaál Piroska VITUKI Kht. Minőségbiztosítási és Ellenőrzési.
TÁRSADALOMSTATISZTIKA Sztochasztikus kapcsolatok II.
1. Melyik jármű haladhat tovább elsőként az ábrán látható forgalmi helyzetben? a) A "V" jelű villamos. b) Az "M" jelű munkagép. c) Az "R" jelű rendőrségi.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Vargha András KRE és ELTE, Pszichológiai Intézet
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
1 Az igazság ideát van? Montskó Éva, mtv. 2 Célcsoport Az alábbi célcsoportokra vonatkozóan mutatjuk be az adatokat: 4-12 évesek,1.
Korreláció-számítás.
A számítógépes elemzés alapjai
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
A számítógépes elemzés alapjai
Lineáris regressziós modellek

Gazdaságstatisztika Konzultáció a korreláció- és regressziószámítás, idősorok elemzése témakörökből.
III. előadás.
Dr. Varga Beatrix egyetemi docens
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Dr. Varga Beatrix egyetemi docens
Előadás másolata:

5. Változók kapcsolatának vizsgálata

Tartalom Kétdimenziós minta (pontdiagram) Trendvizsgálat, lineáris regresszió Determinációs együttható A korrelációs együttható jelentései A Fisher-féle Z-transzformáció A parciális korreláció modellje A sztochasztikus monotonitás

Tanulással töltött idő (óra/nap) Kétdimenziós minta Tanuló Tanulással töltött idő (óra/nap) Tanulmányi átlag 1. 2 3,0 2. 4 4,0 3. 4. 5. 1 3,5 6. 3 2,5 7. 5 8. 5,0

Pontdiagram (kétváltozós) 5 4 Tanulmányi átlag 3 2 1 2 3 4 5 Hány órát tanul naponta?

Pozitív lineáris kapcsolat (I) 55 50 Születési hossz (cm) 45 40 35 1 2 3 4 5 Születési súly (kg)

Pozitív lineáris kapcsolat (II) 145 140 135 Testmag. 10 évesen 130 125 120 115 20 25 30 35 40 45 Testsúly 10 éves korban (kg)

Nem lineáris (U-alakú) kapcsolat Y X -3 3

Függetlenség 1 80 Y Y 0,5 50 20 X 0,5 X 1 20 50 80

Összefüggés, kapcsolat két változó (X és Y) között Az X-értékek és az Y-értékek együttjárása, együttmozgása, együtt-változása valamilyen szabály szerint

Mi a szabály az alábbi két változó kapcsolatában? 55 50 Születési hossz (cm) 45 40 35 1 2 3 4 5 Születési súly (kg)

Mire jó, ha egy ilyen szabályt feltárunk? Megértünk valamit (elméleti szempont) Segítségével következtetéseket vonhatunk le (gyakorlati szempont). Pl.: ha X értéke ennyi, Y értéke mennyi?

Előrejelzés egyenes segítségével: ha X = 2, Y = ? 55 50 Születési hossz (cm) 45 40 35 1 2 3 4 X 5 Születési súly (kg)

Regressziós feladat Az X és az Y változó között az összefüggés szabályának kitalálása: hogyan „függ” X-től Y? A függés nem feltétlenül ok-okozati (pl. a gyerekről is lehet a szülőre következtetni) A függés típusa többféle lehet: pl. lineáris vagy sokféle nemlineáris (U-alakú, exponenciális stb.)

Az előrejelzés alapfogalmai Jósolt (függő) változó: Y Jósló (előrejelző, független) változó: X Lineáris előrejelzés (jóslás): Ŷ = a + bX Az x értékhez tartozó igazi Y-érték: y Az x értékhez tartozó előrejelzés: ŷ = a + bx

Egy y = a + bx egyenes paraméterei 320 240  160 a 80 1 2 3 4 5 X ‘a’: Y-tengelymetszet ‘b’: meredekségi együttható: b = tg(

A lineáris kapcsolat jellemzője Nem mindig egyenes arányosság Azonos mértékű X-változást mindig azonos mértékű Y-változás kísér 1 egységnyi X-változás esetén Y várható változása b egységnyi

Példa lineáris regresszióra Változók: X: ThosszSzül, Y: Thossz10éves Regressziós egyenlet: Ŷ = 96,88 + 0,83X Következtetés (regressziós előrejelzés): Pl. X = 45cm esetén: Ŷ = 96,88 + 0,83·45 = 134,23 (cm) GYAK

A regressziós becslés hibája egy személynél Ha egy személynél a becsült (előrejelzett) 10 éves kori testmagasság 151 cm (Ŷ) és a valódi érték 146 cm (Y), akkor a hiba: Abszolút eltérés: |151-146| = 5 cm Négyzetes eltérés: (151-146)2 = 52 = 25 cm2

A regressziós becslés átlagos hibája: a standard hiba Átlagos négyzetes eltérés = Hibavariancia = Res Hibaszórás = Gyök(hibavariancia) = Standard hiba (SH)

Var(Y) és Res jelentése Var(Y): átlagtól való átlagos négyzetes eltérés = átlaggal való becslés hibavarianciája. (!!!) SH2 = Res: regressziós becslés hibavarianciája. Minél kisebb Var(Y)-nál Res, annál jobb a regressziós becslés Hibacsökkenés: Var(Y) – Res Relatív hibacsökkenés: (Var(Y) – Res)/Var(Y)

Példák GYAK Változó Átlag Variancia Res SH RHCS X: ThosszSzül 50,2 6,4 Y: Thossz10 138,7 41,5 37,09 6,1 0,107 X: Anyatesth 161,1 38,3 Y: Thossz10 138,7 41,5 36,02 6,0 0,132 X: Apatesth 173,4 46,0 Y: Thossz10 138,7 41,5 35,96 6,0 0,134 X: Tsúly10 33,2 46,4 Y: Thossz10 138,7 41,5 23,33 4,8 0,438 GYAK

A determinációs együttható Relatív hibacsökkenés = determinációs együttható Megmagyarázott variancia-arány Jelölés: Det(X, Y)

A korrelációs együttható A korrelációs együttható abszolút értéke a determinációs együttható négyzetgyöke: A korrelációs együttható előjele megegyezik a regresszió meredekségi együtthatójának (b) előjelével: Pozitív trend: +, negatív trend: -

A korrelációs együttható jelölései Populációbeli (elméleti) korrelációs együttható jelölése: ρ (ejtsd: ró), ρxy, ρ(x,y) Mintabeli (Pearson-féle) korrelációs együttható jelölése: r, rxy, r(x,y)

Egy korrelációs mátrix (n = 500) Változó Súly0 Súly10 Tmag0 Tmag10 1 0,16 0,79 0,24 0,23 0,66 0,33

Néhány tipikus korreláció Változók (X és Y) Korreláció IQ és egyetemi előmenetel 0,3–0,5 Egypetéjű, együtt nevelt ikrek IQ-ja 0,86 Együtt nevelt testvérek IQ-ja 0,47 Külön nevelt testvérek IQ-ja 0,24 CPI Jó közérzet skálája és a házassággal való elégedettség 0,25–0,35 Vallásgyakorlat és istenhit 0,68 Vallásgyakorlat és vallási kultúra ismerete 0,03 Férj és feleség testsúlya 0,22

0

0

0





A korrelációs együttható jellemzői Ha X és Y független, akkor (X,Y) = 0. Ha (X,Y) = 0, vagyis ha X és Y korrelálatlan, akkor nem feltétlenül függetlenek, de biztos, hogy nincs köztük lineáris típusú összefüggés (U vagy fordított U alakú kapcsolatban persze lehetnek). Ha X és Y együttes eloszlása normális, azaz bármely rögzített X = x mellett Y normális, akkor a függetlenség és a korrelálatlanság ekvivalens.

A lineáris transzformáció hatása a korrelációs együtthatóra Lineáris transzformációk: Szám hozzáadása a változóhoz: Y = X + 100 Változó számmal szorzása: Y = 10X Ezek kombinációja: Y = 50 + 3X ρ és r abszolút értéke nem változik, legfeljebb az előjele

A korrelációs együttható szignifikanciájának vizsgálata Nullhipotézis: H0: ρ = 0 Döntés alapja: egy n-elemű mintában kiszámított korrelációs együttható (r) Mitől függ H0 elutasíthatósága? Az r együttható nagysága Az f szabadságfok nagysága (f = n - 2)

Korrelációk férj és feleség ugyanazon jellemzői között CPI-skálák Rossz h. (n = 10) Közepes (n = 14) Jó ház. (n = 13) Dominancia -0,362 0,273 0,406 Szociális jelenlét -0,145 0,398 0,627* Önelfogadás -0,719* -0,061 0,278 Szorongás -0,588 -0,534* 0,259 Felelősségtudat 0,637* 0,541* -0,102 Tolerancia -0,308 0,364 0,431

Korrelációs mátrix szignifikanciákkal Lányok (n = 256) SúlySzül Súly10 MamaSúly 0,289*** 0,201** PapaSúly 0,097 0,282*** MamaTmag 0,213*** 0,121+ PapaTmag 0,126* 0,140* (f = 254; +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001) GYAK

Korrelációs mátrix p-értékekkel Lányok (n = 256) SúlySzül Súly10 MamaTmag 0,213*** p=0,0006 0,121+ p=0,0532 PapaTmag 0,126* p=0,0443 0,140* p=0,0251 (f = 254; +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001) GYAK

A H0: r = r0 hipotézis vizsgálata Szakmai kérdés: két változó (X és Y) korrelációja (r) egy populációban megegyezik-e egy feltételezett értékkel (r0)?

Z(r) normális eloszlású lesz H0: r = r0 Az r együtthatón végrehajtott Fisher-féle Z-transzformáció segítségével lehetséges Z(r) normális eloszlású lesz

Intervallumbecslés r-ra Szintén a Z-transzformáció segítségével: C0,95 = (r1; r2)

Intervallumbecslés -ra A nullhipotézis elutasítása csak annyit jelent, hogy valószínűleg ρ ≠ 0. Ez nem sokat mond nekünk. 95%-os konfidencia-intervallum (hol kell keresnünk nagy (95%-os) megbízhatósággal ρ-t? C0,95 = (ra; rf) Pl. n = 500, r = 0,79 esetén: C0,95 = (0,75; 0,82) Pl. n = 16, r = -0,87 esetén: C0,95 = (-0,96; -0,65) GYAK

Korrelációs együtthatók összehasonlítása független minták segítségével H0: r1 = r2

Ha H0 igaz, Z* st. norm. eloszlású H0: r1 = r2 Ha H0 igaz, Z* st. norm. eloszlású

Személyiség és házasság: korrelációk férj és feleség között CPI-skálák Rossz h. (n = 10) Közepes (n = 14) Jó ház. (n = 13) Önelfogadás -0,719* -0,061 0,278 Szorongás -0,588 -0,534* 0,259

A korreláció nem feltétlenül oki kapcsolat, csak egy együttjárás Ha r > 0, akkor három eset lehetséges: X pozitív hatással van Y-ra Y pozitív hatással van X-re Valamilyen Z háttérváltozó hat egyidejűleg X-re és Y-ra

A parciális korrelációs együttható Z

Meglepő korrelációk Milyen korreláció van egy általános iskola összes tanulójának a mintájában a szókészlet és a lábméret között?

A parciális korrelációs együttható logikája X ~~~~ Y Z

A parciális korrelációs együttható jelentése Milyen lenne X és Y között a korreláció, ha a Z változó hatását kiküszöbölnénk, állandó szinten tartva az értékét (feltételes korreláció)? Alkalmazási feltétel: X, Y és Z legyen külön-külön és együtt is normális eloszlású.

X és Y felbontása Xmar X változó Ymar Y változó Z-től nem függő rész Z-től függő rész Z-től nem függő rész Z-től függő rész Y változó

Lineáris regresszióval X = Xz + Xmar Y = Yz + Ymar rXY.Z = r(Xmar,Ymar)

A rXY.Z parciális korreláció a Z lineáris hatásától „megtisztított” X és Y közti sima korreláció

Érdekes példa 0,64 X ~~~~ Y 0,80 0,80 Z rxy.z = 0

Másik érdekes példa 0,10 X ~~~~ Y -0,60 0,60 Z rxy.z = 0,72

Egy Rorschach-példa (n = 359 normál személy) r(Isk, Ruha) = 0,32** r(Isk, Táj) = 0,26** r(Isk, Szem) = 0,18**

Korrelációk a Rorschach-Feleletszámmal Iskol. Ruha Táj Szem FSZ 0,38** 0,57** 0,29** 0,41**

Korrelációk és parciális korrelációk az iskolázottsággal X = Isk Y=Ruha Y=Táj Y=Szem Korr (rIsk,Y) 0,32** 0,26** 0,18** Parc. korr. (rIsk,Y.FSZ ) 0,13* 0,17** 0,03 GYAK

Mi történik, ha a parciális korreláció normalitási feltétele sérül? Ilyenkor a változók között nem csak lineáris kapcsolatok léphetnek fel A lineáris kapcsolat kiszűrésével nem szűrjük ki a háttérváltozó teljes hatását A parciális korreláció nem feltétlenül egyezik meg a feltételes korrelációval Téves értelmezés lehetősége!!!

Mit csináljunk, ha a változóink nem normális eloszlásúak? Wilcox-féle robusztus korreláció (rpb) Rangkorrelációk minimum ordinális változók között (monotonitási mérőszámok) Spearman-féle rangkorreláció: Pearson-korreláció a rangszámok között Kendall-féle rangkorreláció: pozitív és negatív kapcsolat arányának a különbsége

Két változó, X és Y sztochasztikus monoton kapcsolata

Ha X nő, akkor Y is nő. Determinisztikus monoton növekedés Y X 16 12 8 4 1 2 3 4 X

Sztochasztikus monoton növekedés 16 * Ha X nő, akkor való- színű, hogy Y is nő. * * 12 * * * Y 8 * * 4 * * * * * * * * * 1 2 3 4 X

Egy példa Ksz. X Y 1. 1 35 2. 1,5 34 3. 2 36 4. 3 37 5. 7 38 6. 10 39

Változónként rangsorolunk Ksz. X rang Y rang 1. 1 1 35 2 2. 1,5 2 34 1 3. 2 3 36 3 4. 3 4 37 4 5. 7 5 38 5 6. 10 6 39 6

Spearman-féle rangkorreláció (rS): korreláció a rangszámok között

Konkordancia és diszkordancia Y B + C A - X D

Konkordáns pár: kis X kis Y-nal, nagy X nagy Y-nal jár együtt (pozitív együttjárás) Diszkordáns pár: kis X nagy Y-nal, nagy X kis Y-nal jár együtt (negatív együttjárás)

t = p+ - p- Kendall-féle monotonitási e.h. p+: Konkordáns párok aránya a populációban p-: Diszkordáns párok t = p+ - p-

A Kendall-féle t jellemzői Ha X és Y független: t = 0 t = 0: nincs sztoch. monotonitás t = -1: tiszta monoton fogyó kapcsolat t = +1: tiszta monoton növő kapcsolat

Mit csináljunk, ha X és/vagy Y nem folytonos? Egyirányú monotonitási mérőszámok (Somers-féle DYX és DXY) Egyirányú mérőszámok geometriai átlaga: Kendall-féle tau-b Erős diszkrétség esetén: Kendall-féle gamma

A pozitív kapcsolat relatív fölénye. Diszkrét X és Y esetén javasolt. A Kendall-féle gamma monotonitási együttható A pozitív kapcsolat relatív fölénye. Diszkrét X és Y esetén javasolt.

A Kendall-féle G jellemzői Ha X és Y független: G = 0 Ha G = 0: nincs sztoch. monot. Ha G = -1: p+ = 0 Ha G = +1: p- = 0

A H0: t = 0 hipotézis vizsgálata Mintabeli tau: Kendall-féle rangkorrelációs együttható (rt) Sztochasztikus monotonitás tesztelése: rt szignifikanciájának vizsgálata H0: Nincs monoton kapcsolat

rt kiszámítása a mintában Y B E = n+ = 4 F = n- = 2 rt = (4-2)/6 = 2/6 = 0,33 + + C C + + A - - D X

rt = (E - F)/T, G = (E - F)/(E+F) Mikor teljesül az, hogy rt = G? rt és G képlete E = konkordanciák száma F = diszkordanciák száma T = összes párok száma = n(n-1)/2 rt = (E - F)/T, G = (E - F)/(E+F) Mikor teljesül az, hogy rt = G?