Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

5. Változók kapcsolatának vizsgálata

Hasonló előadás


Az előadások a következő témára: "5. Változók kapcsolatának vizsgálata"— Előadás másolata:

1 5. Változók kapcsolatának vizsgálata

2 Tartalom Kétdimenziós minta (pontdiagram)
Trendvizsgálat, lineáris regresszió Determinációs együttható A korrelációs együttható jelentései A Fisher-féle Z-transzformáció A parciális korreláció modellje A sztochasztikus monotonitás

3 Tanulással töltött idő (óra/nap)
Kétdimenziós minta Tanuló Tanulással töltött idő (óra/nap) Tanulmányi átlag 1. 2 3,0 2. 4 4,0 3. 4. 5. 1 3,5 6. 3 2,5 7. 5 8. 5,0

4 Pontdiagram (kétváltozós)
5 4 Tanulmányi átlag 3 2 1 2 3 4 5 Hány órát tanul naponta?

5 Pozitív lineáris kapcsolat (I)
55 50 Születési hossz (cm) 45 40 35 1 2 3 4 5 Születési súly (kg)

6 Pozitív lineáris kapcsolat (II)
145 140 135 Testmag. 10 évesen 130 125 120 115 20 25 30 35 40 45 Testsúly 10 éves korban (kg)

7 Nem lineáris (U-alakú) kapcsolat
Y X -3 3

8 Függetlenség 1 80 Y Y 0,5 50 20 X 0,5 X 1 20 50 80

9 Összefüggés, kapcsolat két változó (X és Y) között
Az X-értékek és az Y-értékek együttjárása, együttmozgása, együtt-változása valamilyen szabály szerint

10 Mi a szabály az alábbi két változó kapcsolatában?
55 50 Születési hossz (cm) 45 40 35 1 2 3 4 5 Születési súly (kg)

11 Mire jó, ha egy ilyen szabályt feltárunk?
Megértünk valamit (elméleti szempont) Segítségével következtetéseket vonhatunk le (gyakorlati szempont). Pl.: ha X értéke ennyi, Y értéke mennyi?

12 Előrejelzés egyenes segítségével: ha X = 2, Y = ?
55 50 Születési hossz (cm) 45 40 35 1 2 3 4 X 5 Születési súly (kg)

13 Regressziós feladat Az X és az Y változó között az összefüggés szabályának kitalálása: hogyan „függ” X-től Y? A függés nem feltétlenül ok-okozati (pl. a gyerekről is lehet a szülőre következtetni) A függés típusa többféle lehet: pl. lineáris vagy sokféle nemlineáris (U-alakú, exponenciális stb.)

14 Az előrejelzés alapfogalmai
Jósolt (függő) változó: Y Jósló (előrejelző, független) változó: X Lineáris előrejelzés (jóslás): Ŷ = a + bX Az x értékhez tartozó igazi Y-érték: y Az x értékhez tartozó előrejelzés: ŷ = a + bx

15 Egy y = a + bx egyenes paraméterei
320 240 160 a 80 1 2 3 4 5 X ‘a’: Y-tengelymetszet ‘b’: meredekségi együttható: b = tg(

16 A lineáris kapcsolat jellemzője
Nem mindig egyenes arányosság Azonos mértékű X-változást mindig azonos mértékű Y-változás kísér 1 egységnyi X-változás esetén Y várható változása b egységnyi

17 Példa lineáris regresszióra
Változók: X: ThosszSzül, Y: Thossz10éves Regressziós egyenlet: Ŷ = 96,88 + 0,83X Következtetés (regressziós előrejelzés): Pl. X = 45cm esetén: Ŷ = 96,88 + 0,83·45 = 134,23 (cm) GYAK

18 A regressziós becslés hibája egy személynél
Ha egy személynél a becsült (előrejelzett) 10 éves kori testmagasság 151 cm (Ŷ) és a valódi érték 146 cm (Y), akkor a hiba: Abszolút eltérés: | | = 5 cm Négyzetes eltérés: ( )2 = 52 = 25 cm2

19 A regressziós becslés átlagos hibája: a standard hiba
Átlagos négyzetes eltérés = Hibavariancia = Res Hibaszórás = Gyök(hibavariancia) = Standard hiba (SH)

20 Var(Y) és Res jelentése
Var(Y): átlagtól való átlagos négyzetes eltérés = átlaggal való becslés hibavarianciája. (!!!) SH2 = Res: regressziós becslés hibavarianciája. Minél kisebb Var(Y)-nál Res, annál jobb a regressziós becslés Hibacsökkenés: Var(Y) – Res Relatív hibacsökkenés: (Var(Y) – Res)/Var(Y)

21 Példák GYAK Változó Átlag Variancia Res SH RHCS X: ThosszSzül 50,2 6,4
Y: Thossz , , ,09 6,1 0,107 X: Anyatesth , ,3 Y: Thossz , , ,02 6,0 0,132 X: Apatesth , ,0 Y: Thossz , , ,96 6,0 0,134 X: Tsúly , ,4 Y: Thossz , , ,33 4,8 0,438 GYAK

22 A determinációs együttható
Relatív hibacsökkenés = determinációs együttható Megmagyarázott variancia-arány Jelölés: Det(X, Y)

23 A korrelációs együttható
A korrelációs együttható abszolút értéke a determinációs együttható négyzetgyöke: A korrelációs együttható előjele megegyezik a regresszió meredekségi együtthatójának (b) előjelével: Pozitív trend: +, negatív trend: -

24 A korrelációs együttható jelölései
Populációbeli (elméleti) korrelációs együttható jelölése: ρ (ejtsd: ró), ρxy, ρ(x,y) Mintabeli (Pearson-féle) korrelációs együttható jelölése: r, rxy, r(x,y)

25 Egy korrelációs mátrix (n = 500)
Változó Súly0 Súly10 Tmag0 Tmag10 1 0,16 0,79 0,24 0,23 0,66 0,33

26 Néhány tipikus korreláció
Változók (X és Y) Korreláció IQ és egyetemi előmenetel 0,3–0,5 Egypetéjű, együtt nevelt ikrek IQ-ja 0,86 Együtt nevelt testvérek IQ-ja 0,47 Külön nevelt testvérek IQ-ja 0,24 CPI Jó közérzet skálája és a házassággal való elégedettség 0,25–0,35 Vallásgyakorlat és istenhit 0,68 Vallásgyakorlat és vallási kultúra ismerete 0,03 Férj és feleség testsúlya 0,22

27 0

28 0

29 0

30 

31 

32 A korrelációs együttható jellemzői
Ha X és Y független, akkor (X,Y) = 0. Ha (X,Y) = 0, vagyis ha X és Y korrelálatlan, akkor nem feltétlenül függetlenek, de biztos, hogy nincs köztük lineáris típusú összefüggés (U vagy fordított U alakú kapcsolatban persze lehetnek). Ha X és Y együttes eloszlása normális, azaz bármely rögzített X = x mellett Y normális, akkor a függetlenség és a korrelálatlanság ekvivalens.

33 A lineáris transzformáció hatása a korrelációs együtthatóra
Lineáris transzformációk: Szám hozzáadása a változóhoz: Y = X + 100 Változó számmal szorzása: Y = 10X Ezek kombinációja: Y = X ρ és r abszolút értéke nem változik, legfeljebb az előjele

34 A korrelációs együttható szignifikanciájának vizsgálata
Nullhipotézis: H0: ρ = 0 Döntés alapja: egy n-elemű mintában kiszámított korrelációs együttható (r) Mitől függ H0 elutasíthatósága? Az r együttható nagysága Az f szabadságfok nagysága (f = n - 2)

35 Korrelációk férj és feleség ugyanazon jellemzői között
CPI-skálák Rossz h. (n = 10) Közepes (n = 14) Jó ház. (n = 13) Dominancia -0,362 0,273 0,406 Szociális jelenlét -0,145 0,398 0,627* Önelfogadás -0,719* -0,061 0,278 Szorongás -0,588 -0,534* 0,259 Felelősségtudat 0,637* 0,541* -0,102 Tolerancia -0,308 0,364 0,431

36 Korrelációs mátrix szignifikanciákkal
Lányok (n = 256) SúlySzül Súly10 MamaSúly 0,289*** 0,201** PapaSúly 0,097 0,282*** MamaTmag 0,213*** 0,121+ PapaTmag 0,126* 0,140* (f = 254; +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001) GYAK

37 Korrelációs mátrix p-értékekkel
Lányok (n = 256) SúlySzül Súly10 MamaTmag 0,213*** p=0,0006 0,121+ p=0,0532 PapaTmag 0,126* p=0,0443 0,140* p=0,0251 (f = 254; +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001) GYAK

38 A H0: r = r0 hipotézis vizsgálata
Szakmai kérdés: két változó (X és Y) korrelációja (r) egy populációban megegyezik-e egy feltételezett értékkel (r0)?

39 Z(r) normális eloszlású lesz
H0: r = r0 Az r együtthatón végrehajtott Fisher-féle Z-transzformáció segítségével lehetséges Z(r) normális eloszlású lesz

40 Intervallumbecslés r-ra
Szintén a Z-transzformáció segítségével: C0,95 = (r1; r2)

41 Intervallumbecslés -ra
A nullhipotézis elutasítása csak annyit jelent, hogy valószínűleg ρ ≠ 0. Ez nem sokat mond nekünk. 95%-os konfidencia-intervallum (hol kell keresnünk nagy (95%-os) megbízhatósággal ρ-t? C0,95 = (ra; rf) Pl. n = 500, r = 0,79 esetén: C0,95 = (0,75; 0,82) Pl. n = 16, r = -0,87 esetén: C0,95 = (-0,96; -0,65) GYAK

42 Korrelációs együtthatók összehasonlítása független minták segítségével H0: r1 = r2

43 Ha H0 igaz, Z* st. norm. eloszlású
H0: r1 = r2 Ha H0 igaz, Z* st. norm. eloszlású

44 Személyiség és házasság: korrelációk férj és feleség között
CPI-skálák Rossz h. (n = 10) Közepes (n = 14) Jó ház. (n = 13) Önelfogadás -0,719* -0,061 0,278 Szorongás -0,588 -0,534* 0,259

45 A korreláció nem feltétlenül oki kapcsolat, csak egy együttjárás
Ha r > 0, akkor három eset lehetséges: X pozitív hatással van Y-ra Y pozitív hatással van X-re Valamilyen Z háttérváltozó hat egyidejűleg X-re és Y-ra

46 A parciális korrelációs együttható
Z

47 Meglepő korrelációk Milyen korreláció van egy általános iskola összes tanulójának a mintájában a szókészlet és a lábméret között?

48 A parciális korrelációs együttható logikája
X ~~~~ Y Z

49 A parciális korrelációs együttható jelentése
Milyen lenne X és Y között a korreláció, ha a Z változó hatását kiküszöbölnénk, állandó szinten tartva az értékét (feltételes korreláció)? Alkalmazási feltétel: X, Y és Z legyen külön-külön és együtt is normális eloszlású.

50 X és Y felbontása Xmar X változó Ymar Y változó Z-től nem függő rész
Z-től függő rész Z-től nem függő rész Z-től függő rész Y változó

51 Lineáris regresszióval
X = Xz + Xmar Y = Yz + Ymar rXY.Z = r(Xmar,Ymar)

52 A rXY.Z parciális korreláció a Z lineáris hatásától „megtisztított” X és Y közti sima korreláció

53 Érdekes példa 0,64 X ~~~~ Y 0,80 0,80 Z rxy.z = 0

54 Másik érdekes példa 0,10 X ~~~~ Y -0,60 0,60 Z rxy.z = 0,72

55 Egy Rorschach-példa (n = 359 normál személy) r(Isk, Ruha) = 0,32**
r(Isk, Táj) = 0,26** r(Isk, Szem) = 0,18**

56 Korrelációk a Rorschach-Feleletszámmal
Iskol. Ruha Táj Szem FSZ 0,38** 0,57** 0,29** 0,41**

57 Korrelációk és parciális korrelációk az iskolázottsággal
X = Isk Y=Ruha Y=Táj Y=Szem Korr (rIsk,Y) 0,32** 0,26** 0,18** Parc. korr. (rIsk,Y.FSZ ) 0,13* 0,17** 0,03 GYAK

58 Mi történik, ha a parciális korreláció normalitási feltétele sérül?
Ilyenkor a változók között nem csak lineáris kapcsolatok léphetnek fel A lineáris kapcsolat kiszűrésével nem szűrjük ki a háttérváltozó teljes hatását A parciális korreláció nem feltétlenül egyezik meg a feltételes korrelációval Téves értelmezés lehetősége!!!

59 Mit csináljunk, ha a változóink nem normális eloszlásúak?
Wilcox-féle robusztus korreláció (rpb) Rangkorrelációk minimum ordinális változók között (monotonitási mérőszámok) Spearman-féle rangkorreláció: Pearson-korreláció a rangszámok között Kendall-féle rangkorreláció: pozitív és negatív kapcsolat arányának a különbsége

60 Két változó, X és Y sztochasztikus monoton kapcsolata

61 Ha X nő, akkor Y is nő. Determinisztikus monoton növekedés Y X 16 12 8
4 1 2 3 4 X

62 Sztochasztikus monoton növekedés
16 * Ha X nő, akkor való- színű, hogy Y is nő. * * 12 * * * Y 8 * * 4 * * * * * * * * * 1 2 3 4 X

63 Egy példa Ksz. X Y ,

64 Változónként rangsorolunk
Ksz. X rang Y rang ,

65 Spearman-féle rangkorreláció (rS): korreláció a rangszámok között

66 Konkordancia és diszkordancia
Y B + C A - X D

67 Konkordáns pár: kis X kis Y-nal, nagy X nagy Y-nal jár együtt (pozitív együttjárás)
Diszkordáns pár: kis X nagy Y-nal, nagy X kis Y-nal jár együtt (negatív együttjárás)

68 t = p+ - p- Kendall-féle monotonitási e.h. p+: Konkordáns párok
aránya a populációban p-: Diszkordáns párok t = p+ - p-

69 A Kendall-féle t jellemzői
Ha X és Y független: t = 0 t = 0: nincs sztoch. monotonitás t = -1: tiszta monoton fogyó kapcsolat t = +1: tiszta monoton növő kapcsolat

70 Mit csináljunk, ha X és/vagy Y nem folytonos?
Egyirányú monotonitási mérőszámok (Somers-féle DYX és DXY) Egyirányú mérőszámok geometriai átlaga: Kendall-féle tau-b Erős diszkrétség esetén: Kendall-féle gamma

71 A pozitív kapcsolat relatív fölénye. Diszkrét X és Y esetén javasolt.
A Kendall-féle gamma monotonitási együttható A pozitív kapcsolat relatív fölénye. Diszkrét X és Y esetén javasolt.

72 A Kendall-féle G jellemzői
Ha X és Y független: G = 0 Ha G = 0: nincs sztoch. monot. Ha G = -1: p+ = 0 Ha G = +1: p- = 0

73 A H0: t = 0 hipotézis vizsgálata
Mintabeli tau: Kendall-féle rangkorrelációs együttható (rt) Sztochasztikus monotonitás tesztelése: rt szignifikanciájának vizsgálata H0: Nincs monoton kapcsolat

74 rt kiszámítása a mintában
Y B E = n+ = 4 F = n- = 2 rt = (4-2)/6 = 2/6 = 0,33 + + C C + + A - - D X

75 rt = (E - F)/T, G = (E - F)/(E+F) Mikor teljesül az, hogy rt = G?
rt és G képlete E = konkordanciák száma F = diszkordanciák száma T = összes párok száma = n(n-1)/2 rt = (E - F)/T, G = (E - F)/(E+F) Mikor teljesül az, hogy rt = G?


Letölteni ppt "5. Változók kapcsolatának vizsgálata"

Hasonló előadás


Google Hirdetések