Új kérdések a korrelációs együtthatóval kapcsolatban
1. A H0: r = r0 hipotézis vizsgálata H0: r = 0 esetén:
Fisher-féle Z-transzformáció: Z(r) normális eloszlású lesz Általános esetben: Fisher-féle Z-transzformáció: Z(r) normális eloszlású lesz
Pl. r = 0.80 esetén: lásd MiniStat
Z(r) ~ N(Z(r), sz) (sz )2 = 1/(n - 3) Például Z(0,80) = 1,099 n = 10 esetén: (sz )2 = 1/7
H0: r = r0 H0 igaz volta esetén Z* N(0, 1) eloszlású
Döntés Z* £ -1,96: r < r0 Z* ³ 1,96: r > r0 -1,96 < Z* < 1,96: H0-t megtartjuk Z* £ -1,96: r < r0 Z* ³ 1,96: r > r0
Egy példa H0: r = 0.5 n = 28, r = 0.8
2. Intervallumbecslés r-ra Z(r)-ra: C0,95 = Z(r) ± 1,96sz = (z1; z2) r-ra: visszatranszformálással C0,95 = (r1; r2)
Egy példa n = 28, r = 0,8 C0,95(Z(r)) = Z(0,8) ± 1,96/sz = 1,099 ± 1,96/5 = (0,707; 1,491) C0.95(r) = (0.610; 0.905)
3. H0: r1 = r2 Ha H0 igaz: Z*~N(0, 1)
Meglepő korrelációk (a) Wagner kedvelése és zoknik száma (b) Szókészlet és lábméret
4. A parciális korrelációs együttható X ~~~~ Y Z
r = 0,85 Y r3 = -0,20 20 r2 = -0,54 15 10 5 X 5 10 15 20 r1 = -0,61
X = Xz + Xmar Y = Yz + Ymar rXY.Z = r(Xmar,Ymar) Lineáris regresszióval X = Xz + Xmar Y = Yz + Ymar rXY.Z = r(Xmar,Ymar)
Az elméleti parciális korrelációs együttható képlete
A tapasztalati parciális korrelációs együttható képlete
X ~~~~ Y X ~~~~ Y Z Z Két példa rxy.z = 0 rxy.z = -0,50 0,64 0,46 0,80
X ~~~~ Y X ~~~~ Y Z Z Két másik példa rxy.z = -0,56 rxy.z = 0,72 0,10 0,10 X ~~~~ Y X ~~~~ Y 0,60 0,60 -0,60 0,60 Z Z rxy.z = -0,56 rxy.z = 0,72
Két összetartozó minta összehasonlítása
Ksz. X Y Y - X 1. 4 1 - 2. 1 0 - 3. 2 0 - 4. 0 0 0 5. 3 7 + 6. 3 11 + 7. 4,5 16 +
A két minta átlaga és mediánja X Y átlag 2,5 5,0 X < Y medián 3 1 X > Y
Sztochasztikus egyenlőség P(X < Y) = P(X > Y)
Értelmes nullhipotézisek H0: E(X) = E(Y) H0: Med(X) = Med(Y) H0: P(X < Y) = P(X > Y)
H0: E(X) = E(Y) Egymintás t-próba Alk. feltétel: normalitás Robusztus változatok: Johnson-próba Gayen-próba
H0: Med(X) = Med(Y) Wilcoxon-próba Alkalmazási feltételek: X és Y folytonos Y-X szimmetrikus
Ha X és Y szimmetrikus: Med(X) = Med(Y) és Med(Y-X) = 0 ekvivalens.
Ha X és Y folytonos: Med(Y-X) = 0 és P(X < Y) = P(X > Y) ekvivalens.
H0: P(X < Y) = P(X > Y) Előjelpróba Alkalmazási feltétel: Nincs De: jó, ha N nagy
Az előjelpróba végrehajtása Meghatározandók: n+: hányszor nagyobb X-nél Y n-: hányszor kisebb X-nél Y (ta - tf): megtartási tartomány
Döntés az előjelpróbában ta < n+ < tf : H0-t megtartjuk n+ £ ta : P(X < Y) < P(X > Y) (Y < X sztochasztikusan) n+ ³ tf : P(X < Y) > P(X > Y) (Y > X sztochasztikusan)
Példa az előjelpróbára N = 50 X = Nyugalmi pulzus Y = Kísérletben mért pulzus n+ = 33 (növek.); n- = 15 (csökk.) n = 33+15 = 48 és a = 5% esetén: (ta-tf) = (16-32) n+ ³ tf: P(X < Y) > P(X > Y)
Két független minta összehasonlítása
X-minta Y-minta 0 1 1 2 8 3 X < Y: (0; 1), (0; 2), (0; 3), (1;2), (1; 3) X > Y: (8; 1), (8; 2), (8; 3) n+ = 5 (növek.); n- = 3 (csökk.)
A két minta átlaga és mediánja X Y átlag 3 2 X > Y medián 1 2 X < Y
Sztochasztikus egyenlőség P(X < Y) = P(X > Y)
Értelmes nullhipotézisek H0: E(X) = E(Y) H0: Med(X) = Med(Y) H0: P(X < Y) = P(X > Y)
H0: E(X) = E(Y) Kétmintás t-próba Alkalmazási feltételek: normalitás, s1 = s2 Robusztus változat: Welch-féle d-próba
H0: P(X < Y) = P(X > Y) Mann-Whitney-próba Alkalmazási feltétel: s1 = s2 Robusztus változatok Brunner-Munzel-próba rang Welch-próba FPW-próba
A MW-próba végrehajtása xi rang yj rang 0 1 1 2,5 1 2,5 2 4 8 6 3 5 R1 = 9,5 R2 = 11,5 (ta - tf): megtartási tartomány
Döntés a MW-próbában ta < R1 < tf : H0-t megtartjuk R1£ ta: X< Y sztochasztikusan R1³ tf: X >Y sztochasztikusan
Két változó, X és Y sztochasztikus monoton kapcsolata
Ha X nő, akkor Y is nő. Determinisztikus monotonitás Y X 16 12 8 4 1 2 1 2 3 4 X
Ha X nő, akkor való- színű, hogy Y is nő. Sztochasztikus monotonitás Y 16 * Ha X nő, akkor való- színű, hogy Y is nő. * * 12 * * * 8 * * 4 * * * * * * * * * 1 2 3 4 X
Egy példa Ksz. X Y 1. 1 35 2. 1,5 34 3. 2 36 4. 3 37 5. 7 38 6. 10 39
Változónként rangsorolunk Ksz. X rang Y rang 1. 1 1 35 2 2. 1,5 2 34 1 3. 2 3 36 3 4. 3 4 37 4 5. 7 5 38 5 6. 10 6 39 6
Spearman-féle rangkorreláció (rS): korreláció a rangszámok között (a fenti példában r = 0,91, rS = 0,94)
Konkordancia Diszkordancia
Konkordancia és diszkordancia Y B + C A - X D
t = p+ - p- Kendall-féle monotonitási e.h. p+: Konkordáns párok aránya a populációban p-: Diszkordáns párok t = p+ - p-
A Kendall-féle t jellemzői Ha X és Y független: t = 0 Ha t = 0: nincs sztoch. monot. t = -1: det. monot. fogyó kapcs. t = +1: det. monot. növő kapcs.
monotonitási (asszociációs) Diszkrét X és Y esetén javasolt A Kendall-féle gamma monotonitási (asszociációs) együttható Diszkrét X és Y esetén javasolt
A Kendall-féle G jellemzői Ha X és Y független: G = 0 Ha G = 0: nincs sztoch. monot. Ha G = -1: p+ = 0 Ha G = +1: p- = 0
A H0: t = 0 hipotézis vizsgálata Mintabeli tau: Kendall-féle rangkorrelációs együttható (rt) Sztochasztikus monotonitás tesztelése: rt szignifikanciájának vizsgálata
rt kiszámítása a mintában Y B E = n+ = 4 F = n- = 2 rt = (4-2) /(4+2) = 2/6 = 0.33 + + C C + + A - - D X
rt = (E - F)/T, G = (E - F)/(E+F) Mikor teljesül az, hogy rt = G? rt és G képlete E = konkordanciák száma F = diszkordanciák száma T = összes párok száma = n(n-1)/2 rt = (E - F)/T, G = (E - F)/(E+F) Mikor teljesül az, hogy rt = G?
r = 0,91 rS = 0,94 rt = 0,84 Egy példa Ksz. X Y 1. 1 35 (p < 0,02); 1. 1 35 2. 1,5 34 3. 2 36 4. 3 37 5. 7 38 6. 10 39 r = 0,91 (p < 0,02); rS = 0,94 rt = 0,84 (p < 0,10);
Sztochasztikus monotonitás és sztochasztikus különbség t = p+ - p- d = P(X1 > X2) - P(X1 < X2) (Cliff, 1993)
Valószínűségi fölény mutatója A12 = P(X1 > X2) + 0,5·P(X1 < X2) Teljes sztochasztikus dominancia = 100% P(X1 > X2) P(X1 = X2) P(X2 > X1) A12 A21
Több független minta összehasonlítása
GBR-csökkenés Kísérleti csoport Agr1 Agr2 Agr3 Fény Verbális 80 60 40 20 GBR-csökkenés -20 -40 -60 Agr1 Agr2 Agr3 Fény Verbális Kísérleti csoport
Átlagos Rorschach válaszidő (perc) 2.5 2 1.5 1 0.5 Sine morbo Szem. zavar Holocaust csoport
Elméleti átlagok összehasonlítása H0: E(X1) = E(X2) = ... = E(XI) H0: m1 = m2 = ... = mI
Egyszempontos független mintás varianciaanalízis
Alapösszefüggés Qt = Qk + Qb Qt: Teljes variabilitás Qk: Átlagok összvariabilitása Qb: Minták összvariabilitása
Varianciaanalízis (VA) Vark = Qk/(I-1) = Qk/fk - Hatásvariancia Varb = Qb/(N-I) = Qb/fb - Hibavariancia Próbastatisztika: F = Vark/Varb
Hatásvariancia
Hibavariancia
VA alk. feltételei teljesülnek H0: m1 = m2 = ... = mI + VA alk. feltételei teljesülnek F = Vark/Varb F-eloszlást követ F ³ Fa: H0-t a szinten elutasítjuk
VA alkalmazási feltételei Minták függetlensége Normalitás Elméleti szórások egyenlősége (szóráshomogenitás)
Robusztus varianciaanalízisek Welch-próba James-próba Brown-Forsythe-próba
Szóráshomogenitás ellenőrzése Levene-próba: H0: d(X1) = d(X2) = ... = d(XI) O’Brien-próba: H0: D(X1) = D(X2) = ... = D(XI)
Mikor bízhatunk a VA érvényességében? Var1 » Var2 » ... » VarI vagy (és) n1 » n2 » ... » nI
Mikor alkalmazzunk robusztus VA-t? Különböző mintaelemszámok mintaszórások
VA utóelemzései Hij: mi = mj Legjobb eljárás: Tukey-Kramer-próba Robusztus eljárás: Games-Howell-próba
Nemlineáris determinációs együttható Qt = Qk + Qb Megmagyarázott variancia: e2 = Qk/Qt Nemlineáris korrelációs együttható: e
Egy számítási példa Agr Agr Agr Fény Verb. n 5 4 6 4 4 x 14,50 6,75 2 3 n 5 4 6 4 4 i x i 14,50 6,75 5,20 -13,45 -30,08 s 29,60 9,15 6,96 13,11 14,57 i
Szóráshomogenitás ellenőrzése Levene-próba: F(4; 7) = 0,784 (p > 0,10, n. sz.) O’Brien-próba: F(4; 8) = 1,318 (p > 0,10, n. sz.)
Nemlineáris det. együttható: Hagyományos VA Hatásvariancia: Vark = 1413,9 Hibavariancia: Varb = 286,2 F(4, 18) = 1413,9/286,2 = 4,940** Nemlineáris det. együttható: e2 = Qk/(Qk + Qb) = 0,523
Robusztus VA-k Welch-próba: W(4, 8) = 5,544* James-próba: U = 27,851+ Brown-Forsythe-próba: BF(4, 9) = 5,103*
Átlagok páronkénti összehasonlítása Tukey-Kramer-próba: T12= 0,97 T13= 1,28 T14= 3,48 T15= 5,55** T23= 0,20 T24= 2,39 T25= 4,35* T34= 2,42 T35= 4,57* T45= 1,97
Egyszempontos összetartozó mintás VA
Anya-gyerek megszólalások aránya 8 7 6 5 4 3 2 1 2 3 4 5 6 7 8 Gyerek kora (hónap)
Összetartozó mintás VA modellje Összehasonlított változók: X1, X2, ... , XJ Nullhipotézis: H0: E(X1) = E(X2) = ... = E(XJ) Ekvivalens felírás: H0: m1 = m2 = ... = mJ
Qt = Qk + Qp + Qe Teljes variabilitás Minták közötti variab. Személyek Maradék hiba Qt = Qk + Qp + Qe
A VA végrehajtása Hatásvariancia: Vark = Qk/fk Hibavariancia: Vare = Qe/fe Próbastatisztika: F = Vark/Vare
VA alkalm. feltételei teljesülnek H0: m1 = m2 = ... = mJ + VA alkalm. feltételei teljesülnek F = Vark/Vare F-eloszlást követ F ³ Fa: H0-t a szinten elutasítjuk
Egyszempontos összetartozó mintás VA alkalm. feltételei Normalitás Szóráshomogenitás Jelölés: Vik = Xi - Xk A Vik különbségváltozók elméleti szórásai legyenek ugyanakkorák: D(Vik) = D(Vlj)
A VA alkalmazásának elégséges feltétele Normalitás Szóráshomogenitás: H0: D(X1) = D(X2) = ... = D(XJ) Korrelációs homogenitás: r(Xi, Xk) = r
Egy számítási példa
Átlagok páronkénti összehas.: Hagyományos VA Hatásvariancia: Vark = 1686,9 Hibavariancia: Vare = 121,4 F-érték: F(2; 226) = 13,896** Átlagok páronkénti összehas.: T12= 6,01** T13= 0,82 T23= 6,83**
Robusztus VA Huynh-Feldt-féle epszilon: e = 0,98 F-érték: F(2; 222) = 13,896**
Kétszempontos VA
Az iskolázottság és a nem hatása a Szex%-ra 4 3 Nő Szex% Férfi 2 1 Alsófok Középfok Felsőfok
Az iskolázottság és a nem hatása a Ruha%-ra 5 4 3 Nő Ruha% Férfi 2 1 Alsófok Középfok Felsőfok
A diagnózis és az IQ-típus hatása az IQ-szintre 105 VIQ 100 95 PIQ 90 85 80 Paranoid Sch. Neurot. Organ. Alkohol. Sine morbo
A frusztráció és a nem hatása a pulzusra 105 100 Pulzus 95 Nő Férfi 90 85 1. mérés 2. mérés 3. mérés
Qt = QA + QB + QAB + Qb Teljes variabililitás A szemp. B szemp. AB inter. Maradék hiba Qt = QA + QB + QAB + Qb
A kétszempontos ftl. mintás VA összefoglaló táblázata Hatás f Variancia F-érték F Var A b = A f = I - 1 Var A A F Var B b = B f = J - 1 Var B B F Var AB b = AB f = f × f Var AB A B AB Hiba f = N - I × J Var b b
Modellegyenletek a VA-ban 1szemp. ftl. mintás: mi = m + ai 1szemp. öt. mintás: mij = m + ai + pj 2sz. ftl. mintás: mij = m + ai + bj + gij ai: „A” szempont i-edik szintjének hatása bj: „B” szempont j-edik szintjének hatása gi: (i, j) szintkombináció interakciós hatása
Kezelési hatás két független minta esetén Változás: m1 - m2 Cohen-féle delta: D = (m1 - m2)/s Cliff-féle sztochasztikus különbség: d = P(X1 > X2) - P(X2 > X1) = = A12 - A21