Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
5. Változók kapcsolatának vizsgálata
2
Tartalom Kétdimenziós minta (pontdiagram)
Trendvizsgálat, lineáris regresszió Determinációs együttható A korrelációs együttható jelentései A Fisher-féle Z-transzformáció A parciális korreláció modellje A sztochasztikus monotonitás
3
Tanulással töltött idő (óra/nap)
Kétdimenziós minta Tanuló Tanulással töltött idő (óra/nap) Tanulmányi átlag 1. 2 3,0 2. 4 4,0 3. 4. 5. 1 3,5 6. 3 2,5 7. 5 8. 5,0
4
Pontdiagram (kétváltozós)
5 4 Tanulmányi átlag 3 2 1 2 3 4 5 Hány órát tanul naponta?
5
Pozitív lineáris kapcsolat (I)
55 50 Születési hossz (cm) 45 40 35 1 2 3 4 5 Születési súly (kg)
6
Pozitív lineáris kapcsolat (II)
145 140 135 Testmag. 10 évesen 130 125 120 115 20 25 30 35 40 45 Testsúly 10 éves korban (kg)
7
Nem lineáris (U-alakú) kapcsolat
Y X -3 3
8
Függetlenség 1 80 Y Y 0,5 50 20 X 0,5 X 1 20 50 80
9
Összefüggés, kapcsolat két változó (X és Y) között
Az X-értékek és az Y-értékek együttjárása, együttmozgása, együtt-változása valamilyen szabály szerint
10
Mi a szabály az alábbi két változó kapcsolatában?
55 50 Születési hossz (cm) 45 40 35 1 2 3 4 5 Születési súly (kg)
11
Mire jó, ha egy ilyen szabályt feltárunk?
Megértünk valamit (elméleti szempont) Segítségével következtetéseket vonhatunk le (gyakorlati szempont). Pl.: ha X értéke ennyi, Y értéke mennyi?
12
Előrejelzés egyenes segítségével: ha X = 2, Y = ?
55 50 Születési hossz (cm) 45 40 35 1 2 3 4 X 5 Születési súly (kg)
13
Regressziós feladat Az X és az Y változó között az összefüggés szabályának kitalálása: hogyan „függ” X-től Y? A függés nem feltétlenül ok-okozati (pl. a gyerekről is lehet a szülőre következtetni) A függés típusa többféle lehet: pl. lineáris vagy sokféle nemlineáris (U-alakú, exponenciális stb.)
14
Az előrejelzés alapfogalmai
Jósolt (függő) változó: Y Jósló (előrejelző, független) változó: X Lineáris előrejelzés (jóslás): Ŷ = a + bX Az x értékhez tartozó igazi Y-érték: y Az x értékhez tartozó előrejelzés: ŷ = a + bx
15
Egy y = a + bx egyenes paraméterei
320 240 160 a 80 1 2 3 4 5 X ‘a’: Y-tengelymetszet ‘b’: meredekségi együttható: b = tg(
16
A lineáris kapcsolat jellemzője
Nem mindig egyenes arányosság Azonos mértékű X-változást mindig azonos mértékű Y-változás kísér 1 egységnyi X-változás esetén Y várható változása b egységnyi
17
Példa lineáris regresszióra
Változók: X: ThosszSzül, Y: Thossz10éves Regressziós egyenlet: Ŷ = 96,88 + 0,83X Következtetés (regressziós előrejelzés): Pl. X = 45cm esetén: Ŷ = 96,88 + 0,83·45 = 134,23 (cm) GYAK
18
A regressziós becslés hibája egy személynél
Ha egy személynél a becsült (előrejelzett) 10 éves kori testmagasság 151 cm (Ŷ) és a valódi érték 146 cm (Y), akkor a hiba: Abszolút eltérés: | | = 5 cm Négyzetes eltérés: ( )2 = 52 = 25 cm2
19
A regressziós becslés átlagos hibája: a standard hiba
Átlagos négyzetes eltérés = Hibavariancia = Res Hibaszórás = Gyök(hibavariancia) = Standard hiba (SH)
20
Var(Y) és Res jelentése
Var(Y): átlagtól való átlagos négyzetes eltérés = átlaggal való becslés hibavarianciája. (!!!) SH2 = Res: regressziós becslés hibavarianciája. Minél kisebb Var(Y)-nál Res, annál jobb a regressziós becslés Hibacsökkenés: Var(Y) – Res Relatív hibacsökkenés: (Var(Y) – Res)/Var(Y)
21
Példák GYAK Változó Átlag Variancia Res SH RHCS X: ThosszSzül 50,2 6,4
Y: Thossz , , ,09 6,1 0,107 X: Anyatesth , ,3 Y: Thossz , , ,02 6,0 0,132 X: Apatesth , ,0 Y: Thossz , , ,96 6,0 0,134 X: Tsúly , ,4 Y: Thossz , , ,33 4,8 0,438 GYAK
22
A determinációs együttható
Relatív hibacsökkenés = determinációs együttható Megmagyarázott variancia-arány Jelölés: Det(X, Y)
23
A korrelációs együttható
A korrelációs együttható abszolút értéke a determinációs együttható négyzetgyöke: A korrelációs együttható előjele megegyezik a regresszió meredekségi együtthatójának (b) előjelével: Pozitív trend: +, negatív trend: -
24
A korrelációs együttható jelölései
Populációbeli (elméleti) korrelációs együttható jelölése: ρ (ejtsd: ró), ρxy, ρ(x,y) Mintabeli (Pearson-féle) korrelációs együttható jelölése: r, rxy, r(x,y)
25
Egy korrelációs mátrix (n = 500)
Változó Súly0 Súly10 Tmag0 Tmag10 1 0,16 0,79 0,24 0,23 0,66 0,33
26
Néhány tipikus korreláció
Változók (X és Y) Korreláció IQ és egyetemi előmenetel 0,3–0,5 Egypetéjű, együtt nevelt ikrek IQ-ja 0,86 Együtt nevelt testvérek IQ-ja 0,47 Külön nevelt testvérek IQ-ja 0,24 CPI Jó közérzet skálája és a házassággal való elégedettség 0,25–0,35 Vallásgyakorlat és istenhit 0,68 Vallásgyakorlat és vallási kultúra ismerete 0,03 Férj és feleség testsúlya 0,22
27
0
28
0
29
0
30
31
32
A korrelációs együttható jellemzői
Ha X és Y független, akkor (X,Y) = 0. Ha (X,Y) = 0, vagyis ha X és Y korrelálatlan, akkor nem feltétlenül függetlenek, de biztos, hogy nincs köztük lineáris típusú összefüggés (U vagy fordított U alakú kapcsolatban persze lehetnek). Ha X és Y együttes eloszlása normális, azaz bármely rögzített X = x mellett Y normális, akkor a függetlenség és a korrelálatlanság ekvivalens.
33
A lineáris transzformáció hatása a korrelációs együtthatóra
Lineáris transzformációk: Szám hozzáadása a változóhoz: Y = X + 100 Változó számmal szorzása: Y = 10X Ezek kombinációja: Y = X ρ és r abszolút értéke nem változik, legfeljebb az előjele
34
A korrelációs együttható szignifikanciájának vizsgálata
Nullhipotézis: H0: ρ = 0 Döntés alapja: egy n-elemű mintában kiszámított korrelációs együttható (r) Mitől függ H0 elutasíthatósága? Az r együttható nagysága Az f szabadságfok nagysága (f = n - 2)
35
Korrelációk férj és feleség ugyanazon jellemzői között
CPI-skálák Rossz h. (n = 10) Közepes (n = 14) Jó ház. (n = 13) Dominancia -0,362 0,273 0,406 Szociális jelenlét -0,145 0,398 0,627* Önelfogadás -0,719* -0,061 0,278 Szorongás -0,588 -0,534* 0,259 Felelősségtudat 0,637* 0,541* -0,102 Tolerancia -0,308 0,364 0,431
36
Korrelációs mátrix szignifikanciákkal
Lányok (n = 256) SúlySzül Súly10 MamaSúly 0,289*** 0,201** PapaSúly 0,097 0,282*** MamaTmag 0,213*** 0,121+ PapaTmag 0,126* 0,140* (f = 254; +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001) GYAK
37
Korrelációs mátrix p-értékekkel
Lányok (n = 256) SúlySzül Súly10 MamaTmag 0,213*** p=0,0006 0,121+ p=0,0532 PapaTmag 0,126* p=0,0443 0,140* p=0,0251 (f = 254; +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001) GYAK
38
A H0: r = r0 hipotézis vizsgálata
Szakmai kérdés: két változó (X és Y) korrelációja (r) egy populációban megegyezik-e egy feltételezett értékkel (r0)?
39
Z(r) normális eloszlású lesz
H0: r = r0 Az r együtthatón végrehajtott Fisher-féle Z-transzformáció segítségével lehetséges Z(r) normális eloszlású lesz
40
Intervallumbecslés r-ra
Szintén a Z-transzformáció segítségével: C0,95 = (r1; r2)
41
Intervallumbecslés -ra
A nullhipotézis elutasítása csak annyit jelent, hogy valószínűleg ρ ≠ 0. Ez nem sokat mond nekünk. 95%-os konfidencia-intervallum (hol kell keresnünk nagy (95%-os) megbízhatósággal ρ-t? C0,95 = (ra; rf) Pl. n = 500, r = 0,79 esetén: C0,95 = (0,75; 0,82) Pl. n = 16, r = -0,87 esetén: C0,95 = (-0,96; -0,65) GYAK
42
Korrelációs együtthatók összehasonlítása független minták segítségével H0: r1 = r2
43
Ha H0 igaz, Z* st. norm. eloszlású
H0: r1 = r2 Ha H0 igaz, Z* st. norm. eloszlású
44
Személyiség és házasság: korrelációk férj és feleség között
CPI-skálák Rossz h. (n = 10) Közepes (n = 14) Jó ház. (n = 13) Önelfogadás -0,719* -0,061 0,278 Szorongás -0,588 -0,534* 0,259
45
A korreláció nem feltétlenül oki kapcsolat, csak egy együttjárás
Ha r > 0, akkor három eset lehetséges: X pozitív hatással van Y-ra Y pozitív hatással van X-re Valamilyen Z háttérváltozó hat egyidejűleg X-re és Y-ra
46
A parciális korrelációs együttható
Z
47
Meglepő korrelációk Milyen korreláció van egy általános iskola összes tanulójának a mintájában a szókészlet és a lábméret között?
48
A parciális korrelációs együttható logikája
X ~~~~ Y Z
49
A parciális korrelációs együttható jelentése
Milyen lenne X és Y között a korreláció, ha a Z változó hatását kiküszöbölnénk, állandó szinten tartva az értékét (feltételes korreláció)? Alkalmazási feltétel: X, Y és Z legyen külön-külön és együtt is normális eloszlású.
50
X és Y felbontása Xmar X változó Ymar Y változó Z-től nem függő rész
Z-től függő rész Z-től nem függő rész Z-től függő rész Y változó
51
Lineáris regresszióval
X = Xz + Xmar Y = Yz + Ymar rXY.Z = r(Xmar,Ymar)
52
A rXY.Z parciális korreláció a Z lineáris hatásától „megtisztított” X és Y közti sima korreláció
53
Érdekes példa 0,64 X ~~~~ Y 0,80 0,80 Z rxy.z = 0
54
Másik érdekes példa 0,10 X ~~~~ Y -0,60 0,60 Z rxy.z = 0,72
55
Egy Rorschach-példa (n = 359 normál személy) r(Isk, Ruha) = 0,32**
r(Isk, Táj) = 0,26** r(Isk, Szem) = 0,18**
56
Korrelációk a Rorschach-Feleletszámmal
Iskol. Ruha Táj Szem FSZ 0,38** 0,57** 0,29** 0,41**
57
Korrelációk és parciális korrelációk az iskolázottsággal
X = Isk Y=Ruha Y=Táj Y=Szem Korr (rIsk,Y) 0,32** 0,26** 0,18** Parc. korr. (rIsk,Y.FSZ ) 0,13* 0,17** 0,03 GYAK
58
Mi történik, ha a parciális korreláció normalitási feltétele sérül?
Ilyenkor a változók között nem csak lineáris kapcsolatok léphetnek fel A lineáris kapcsolat kiszűrésével nem szűrjük ki a háttérváltozó teljes hatását A parciális korreláció nem feltétlenül egyezik meg a feltételes korrelációval Téves értelmezés lehetősége!!!
59
Mit csináljunk, ha a változóink nem normális eloszlásúak?
Wilcox-féle robusztus korreláció (rpb) Rangkorrelációk minimum ordinális változók között (monotonitási mérőszámok) Spearman-féle rangkorreláció: Pearson-korreláció a rangszámok között Kendall-féle rangkorreláció: pozitív és negatív kapcsolat arányának a különbsége
60
Két változó, X és Y sztochasztikus monoton kapcsolata
61
Ha X nő, akkor Y is nő. Determinisztikus monoton növekedés Y X 16 12 8
4 1 2 3 4 X
62
Sztochasztikus monoton növekedés
16 * Ha X nő, akkor való- színű, hogy Y is nő. * * 12 * * * Y 8 * * 4 * * * * * * * * * 1 2 3 4 X
63
Egy példa Ksz. X Y ,
64
Változónként rangsorolunk
Ksz. X rang Y rang ,
65
Spearman-féle rangkorreláció (rS): korreláció a rangszámok között
66
Konkordancia és diszkordancia
Y B + C A - X D
67
Konkordáns pár: kis X kis Y-nal, nagy X nagy Y-nal jár együtt (pozitív együttjárás)
Diszkordáns pár: kis X nagy Y-nal, nagy X kis Y-nal jár együtt (negatív együttjárás)
68
t = p+ - p- Kendall-féle monotonitási e.h. p+: Konkordáns párok
aránya a populációban p-: Diszkordáns párok t = p+ - p-
69
A Kendall-féle t jellemzői
Ha X és Y független: t = 0 t = 0: nincs sztoch. monotonitás t = -1: tiszta monoton fogyó kapcsolat t = +1: tiszta monoton növő kapcsolat
70
Mit csináljunk, ha X és/vagy Y nem folytonos?
Egyirányú monotonitási mérőszámok (Somers-féle DYX és DXY) Egyirányú mérőszámok geometriai átlaga: Kendall-féle tau-b Erős diszkrétség esetén: Kendall-féle gamma
71
A pozitív kapcsolat relatív fölénye. Diszkrét X és Y esetén javasolt.
A Kendall-féle gamma monotonitási együttható A pozitív kapcsolat relatív fölénye. Diszkrét X és Y esetén javasolt.
72
A Kendall-féle G jellemzői
Ha X és Y független: G = 0 Ha G = 0: nincs sztoch. monot. Ha G = -1: p+ = 0 Ha G = +1: p- = 0
73
A H0: t = 0 hipotézis vizsgálata
Mintabeli tau: Kendall-féle rangkorrelációs együttható (rt) Sztochasztikus monotonitás tesztelése: rt szignifikanciájának vizsgálata H0: Nincs monoton kapcsolat
74
rt kiszámítása a mintában
Y B E = n+ = 4 F = n- = 2 rt = (4-2)/6 = 2/6 = 0,33 + + C C + + A - - D X
75
rt = (E - F)/T, G = (E - F)/(E+F) Mikor teljesül az, hogy rt = G?
rt és G képlete E = konkordanciák száma F = diszkordanciák száma T = összes párok száma = n(n-1)/2 rt = (E - F)/T, G = (E - F)/(E+F) Mikor teljesül az, hogy rt = G?
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.