Új kérdések a korrelációs együtthatóval kapcsolatban

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Hipotézis-ellenőrzés (Statisztikai próbák)
4. Két összetartozó minta összehasonlítása
Kvantitatív Módszerek
5. Változók kapcsolatának vizsgálata
Erőállóképesség mérése Találjanak teszteket az irodalomban
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Kvantitatív módszerek
3. Két független minta összehasonlítása
Rangszám statisztikák
Utófeszített vasbeton lemez statikai számítása Részletes számítás
A tételek eljuttatása az iskolákba
Két változó közötti összefüggés
Általános lineáris modellek
Összefüggés vizsgálatok
Mérési pontosság (hőmérő)
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Gazdaságelemzési és Statisztikai Tanszék
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
1. IS2PRI2 02/96 B.Könyv SIKER A KÖNYVELÉSHEZ. 2. IS2PRI2 02/96 Mi a B.Könyv KönyvelésMérlegEredményAdóAnalitikaForintDevizaKönyvelésMérlegEredményAdóAnalitikaForintDeviza.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
III. előadás.
Szerkezeti elemek teherbírásvizsgálata összetett terhelés esetén:
Sárgarépa piaca hasonlóságelemzéssel Gazdaság- és Társadalomtudományi kar Gazdasági és vidékfejlesztési agrármérnök I. évfolyam Fekete AlexanderKozma Richárd.
SPSS leíró statisztika és kereszttábla elemzés (1-2. fejezet)
DRAGON BALL GT dbzgtlink féle változat! Illesztett, ráégetett, sárga felirattal! Japan és Angol Navigáláshoz használd a bal oldali léptető elemeket ! Verzio.
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Nem-paraméteres eljárások, több csoport összehasonlítása
Kvantitatív módszerek
Asszociációs együtthatók
Nemparaméteres próbák Statisztika II., 5. alkalom.
Nemparaméteres próbák
szakmérnök hallgatók számára
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Egytényezős variancia-analízis
A évi demográfiai adatok értékelése
LENDÜLETBEN AZ ORSZÁG A Magyar Köztársaság kormánya.
Kvantitatív Módszerek
6. Változók és csoportok összehasonlítása varianciaanalízissel
7. Csoportok és változók sztochasztikus összehasonlítása (összehasonlítások ordinális függő változók esetén)
Tartalom Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat 2-próbával) Arányok összehasonlítása összetartozó és független minták segítségével.
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika Hipotézisvizsgálatok Nemparaméteres próbák II. 17. előadás.
Gazdaságstatisztika 18. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Statisztikai módszerek áttekintése módszerválasztási tanácsok Makara Gábor.
Többváltozós adatelemzés
Hipotézis-ellenőrzés (Folytatás)
Várhatóértékre vonatkozó próbák
Hipotézis vizsgálat.
Lineáris regresszió.
t A kétoldalú statisztikai próba alapfogalmai


Diszkrét változók vizsgálata
Két kvantitatív változó kapcsolatának vizsgálata
A klinikai transzfúziós tevékenység Ápolás szakmai ellenőrzése
QualcoDuna interkalibráció Talaj- és levegövizsgálati körmérések évi értékelése (2007.) Dr. Biliczkiné Gaál Piroska VITUKI Kht. Minőségbiztosítási és Ellenőrzési.
Paleobiológiai módszerek és modellek 4. hét
1. Melyik jármű haladhat tovább elsőként az ábrán látható forgalmi helyzetben? a) A "V" jelű villamos. b) Az "M" jelű munkagép. c) Az "R" jelű rendőrségi.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Vargha András KRE és ELTE, Pszichológiai Intézet
1 Az igazság ideát van? Montskó Éva, mtv. 2 Célcsoport Az alábbi célcsoportokra vonatkozóan mutatjuk be az adatokat: 4-12 évesek,1.
A számítógépes elemzés alapjai
Nemparaméteres próbák
Statisztika segédlet a Statistica programhoz Új verzióknál érdemes a View menüsor alatt a Classic menu-s verziót választani – ehhez készült a segédlet.
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Előadás másolata:

Új kérdések a korrelációs együtthatóval kapcsolatban

1. A H0: r = r0 hipotézis vizsgálata H0: r = 0 esetén:

Fisher-féle Z-transzformáció: Z(r) normális eloszlású lesz Általános esetben: Fisher-féle Z-transzformáció: Z(r) normális eloszlású lesz

Pl. r = 0.80 esetén: lásd MiniStat

Z(r) ~ N(Z(r), sz) (sz )2 = 1/(n - 3) Például Z(0,80) = 1,099 n = 10 esetén: (sz )2 = 1/7

H0: r = r0 H0 igaz volta esetén Z* N(0, 1) eloszlású

Döntés Z* £ -1,96: r < r0 Z* ³ 1,96: r > r0 -1,96 < Z* < 1,96: H0-t megtartjuk Z* £ -1,96: r < r0 Z* ³ 1,96: r > r0

Egy példa H0: r = 0.5 n = 28, r = 0.8

2. Intervallumbecslés r-ra Z(r)-ra: C0,95 = Z(r) ± 1,96sz = (z1; z2) r-ra: visszatranszformálással C0,95 = (r1; r2)

Egy példa n = 28, r = 0,8 C0,95(Z(r)) = Z(0,8) ± 1,96/sz = 1,099 ± 1,96/5 = (0,707; 1,491) C0.95(r) = (0.610; 0.905)

3. H0: r1 = r2 Ha H0 igaz: Z*~N(0, 1)

Meglepő korrelációk (a) Wagner kedvelése és zoknik száma (b) Szókészlet és lábméret

4. A parciális korrelációs együttható X ~~~~ Y Z

r = 0,85 Y r3 = -0,20 20 r2 = -0,54 15 10 5 X 5 10 15 20 r1 = -0,61

X = Xz + Xmar Y = Yz + Ymar rXY.Z = r(Xmar,Ymar) Lineáris regresszióval X = Xz + Xmar Y = Yz + Ymar rXY.Z = r(Xmar,Ymar)

Az elméleti parciális korrelációs együttható képlete

A tapasztalati parciális korrelációs együttható képlete

X ~~~~ Y X ~~~~ Y Z Z Két példa rxy.z = 0 rxy.z = -0,50 0,64 0,46 0,80

X ~~~~ Y X ~~~~ Y Z Z Két másik példa rxy.z = -0,56 rxy.z = 0,72 0,10 0,10 X ~~~~ Y X ~~~~ Y 0,60 0,60 -0,60 0,60 Z Z rxy.z = -0,56 rxy.z = 0,72

Két összetartozó minta összehasonlítása

Ksz. X Y Y - X 1. 4 1 - 2. 1 0 - 3. 2 0 - 4. 0 0 0 5. 3 7 + 6. 3 11 + 7. 4,5 16 +

A két minta átlaga és mediánja X Y átlag 2,5 5,0 X < Y medián 3 1 X > Y

Sztochasztikus egyenlőség P(X < Y) = P(X > Y)

Értelmes nullhipotézisek H0: E(X) = E(Y) H0: Med(X) = Med(Y) H0: P(X < Y) = P(X > Y)

H0: E(X) = E(Y) Egymintás t-próba Alk. feltétel: normalitás Robusztus változatok: Johnson-próba Gayen-próba

H0: Med(X) = Med(Y) Wilcoxon-próba Alkalmazási feltételek: X és Y folytonos Y-X szimmetrikus

Ha X és Y szimmetrikus: Med(X) = Med(Y) és Med(Y-X) = 0 ekvivalens.

Ha X és Y folytonos: Med(Y-X) = 0 és P(X < Y) = P(X > Y) ekvivalens.

H0: P(X < Y) = P(X > Y) Előjelpróba Alkalmazási feltétel: Nincs De: jó, ha N nagy

Az előjelpróba végrehajtása Meghatározandók: n+: hányszor nagyobb X-nél Y n-: hányszor kisebb X-nél Y (ta - tf): megtartási tartomány

Döntés az előjelpróbában ta < n+ < tf : H0-t megtartjuk n+ £ ta : P(X < Y) < P(X > Y) (Y < X sztochasztikusan) n+ ³ tf : P(X < Y) > P(X > Y) (Y > X sztochasztikusan)

Példa az előjelpróbára N = 50 X = Nyugalmi pulzus Y = Kísérletben mért pulzus n+ = 33 (növek.); n- = 15 (csökk.) n = 33+15 = 48 és a = 5% esetén: (ta-tf) = (16-32) n+ ³ tf: P(X < Y) > P(X > Y)

Két független minta összehasonlítása

X-minta Y-minta 0 1 1 2 8 3 X < Y: (0; 1), (0; 2), (0; 3), (1;2), (1; 3) X > Y: (8; 1), (8; 2), (8; 3) n+ = 5 (növek.); n- = 3 (csökk.)

A két minta átlaga és mediánja X Y átlag 3 2 X > Y medián 1 2 X < Y

Sztochasztikus egyenlőség P(X < Y) = P(X > Y)

Értelmes nullhipotézisek H0: E(X) = E(Y) H0: Med(X) = Med(Y) H0: P(X < Y) = P(X > Y)

H0: E(X) = E(Y) Kétmintás t-próba Alkalmazási feltételek: normalitás, s1 = s2 Robusztus változat: Welch-féle d-próba

H0: P(X < Y) = P(X > Y) Mann-Whitney-próba Alkalmazási feltétel: s1 = s2 Robusztus változatok Brunner-Munzel-próba rang Welch-próba FPW-próba

A MW-próba végrehajtása xi rang yj rang 0 1 1 2,5 1 2,5 2 4 8 6 3 5 R1 = 9,5 R2 = 11,5 (ta - tf): megtartási tartomány

Döntés a MW-próbában ta < R1 < tf : H0-t megtartjuk R1£ ta: X< Y sztochasztikusan R1³ tf: X >Y sztochasztikusan

Két változó, X és Y sztochasztikus monoton kapcsolata

Ha X nő, akkor Y is nő. Determinisztikus monotonitás Y X 16 12 8 4 1 2 1 2 3 4 X

Ha X nő, akkor való- színű, hogy Y is nő. Sztochasztikus monotonitás Y 16 * Ha X nő, akkor való- színű, hogy Y is nő. * * 12 * * * 8 * * 4 * * * * * * * * * 1 2 3 4 X

Egy példa Ksz. X Y 1. 1 35 2. 1,5 34 3. 2 36 4. 3 37 5. 7 38 6. 10 39

Változónként rangsorolunk Ksz. X rang Y rang 1. 1 1 35 2 2. 1,5 2 34 1 3. 2 3 36 3 4. 3 4 37 4 5. 7 5 38 5 6. 10 6 39 6

Spearman-féle rangkorreláció (rS): korreláció a rangszámok között (a fenti példában r = 0,91, rS = 0,94)

Konkordancia Diszkordancia

Konkordancia és diszkordancia Y B + C A - X D

t = p+ - p- Kendall-féle monotonitási e.h. p+: Konkordáns párok aránya a populációban p-: Diszkordáns párok t = p+ - p-

A Kendall-féle t jellemzői Ha X és Y független: t = 0 Ha t = 0: nincs sztoch. monot. t = -1: det. monot. fogyó kapcs. t = +1: det. monot. növő kapcs.

monotonitási (asszociációs) Diszkrét X és Y esetén javasolt A Kendall-féle gamma monotonitási (asszociációs) együttható Diszkrét X és Y esetén javasolt

A Kendall-féle G jellemzői Ha X és Y független: G = 0 Ha G = 0: nincs sztoch. monot. Ha G = -1: p+ = 0 Ha G = +1: p- = 0

A H0: t = 0 hipotézis vizsgálata Mintabeli tau: Kendall-féle rangkorrelációs együttható (rt) Sztochasztikus monotonitás tesztelése: rt szignifikanciájának vizsgálata

rt kiszámítása a mintában Y B E = n+ = 4 F = n- = 2 rt = (4-2) /(4+2) = 2/6 = 0.33 + + C C + + A - - D X

rt = (E - F)/T, G = (E - F)/(E+F) Mikor teljesül az, hogy rt = G? rt és G képlete E = konkordanciák száma F = diszkordanciák száma T = összes párok száma = n(n-1)/2 rt = (E - F)/T, G = (E - F)/(E+F) Mikor teljesül az, hogy rt = G?

r = 0,91 rS = 0,94 rt = 0,84 Egy példa Ksz. X Y 1. 1 35 (p < 0,02); 1. 1 35 2. 1,5 34 3. 2 36 4. 3 37 5. 7 38 6. 10 39 r = 0,91 (p < 0,02); rS = 0,94 rt = 0,84 (p < 0,10);

Sztochasztikus monotonitás és sztochasztikus különbség t = p+ - p- d = P(X1 > X2) - P(X1 < X2) (Cliff, 1993)

Valószínűségi fölény mutatója A12 = P(X1 > X2) + 0,5·P(X1 < X2) Teljes sztochasztikus dominancia = 100% P(X1 > X2) P(X1 = X2) P(X2 > X1) A12 A21

Több független minta összehasonlítása

GBR-csökkenés Kísérleti csoport Agr1 Agr2 Agr3 Fény Verbális 80 60 40 20 GBR-csökkenés -20 -40 -60 Agr1 Agr2 Agr3 Fény Verbális Kísérleti csoport

Átlagos Rorschach válaszidő (perc) 2.5 2 1.5 1 0.5 Sine morbo Szem. zavar Holocaust csoport

Elméleti átlagok összehasonlítása H0: E(X1) = E(X2) = ... = E(XI) H0: m1 = m2 = ... = mI

Egyszempontos független mintás varianciaanalízis

Alapösszefüggés Qt = Qk + Qb Qt: Teljes variabilitás Qk: Átlagok összvariabilitása Qb: Minták összvariabilitása

Varianciaanalízis (VA) Vark = Qk/(I-1) = Qk/fk - Hatásvariancia Varb = Qb/(N-I) = Qb/fb - Hibavariancia Próbastatisztika: F = Vark/Varb

Hatásvariancia

Hibavariancia

VA alk. feltételei teljesülnek H0: m1 = m2 = ... = mI + VA alk. feltételei teljesülnek F = Vark/Varb F-eloszlást követ F ³ Fa: H0-t a szinten elutasítjuk

VA alkalmazási feltételei Minták függetlensége Normalitás Elméleti szórások egyenlősége (szóráshomogenitás)

Robusztus varianciaanalízisek Welch-próba James-próba Brown-Forsythe-próba

Szóráshomogenitás ellenőrzése Levene-próba: H0: d(X1) = d(X2) = ... = d(XI) O’Brien-próba: H0: D(X1) = D(X2) = ... = D(XI)

Mikor bízhatunk a VA érvényességében? Var1 » Var2 » ... » VarI vagy (és) n1 » n2 » ... » nI

Mikor alkalmazzunk robusztus VA-t? Különböző mintaelemszámok mintaszórások

VA utóelemzései Hij: mi = mj Legjobb eljárás: Tukey-Kramer-próba Robusztus eljárás: Games-Howell-próba

Nemlineáris determinációs együttható Qt = Qk + Qb Megmagyarázott variancia: e2 = Qk/Qt Nemlineáris korrelációs együttható: e

Egy számítási példa Agr Agr Agr Fény Verb. n 5 4 6 4 4 x 14,50 6,75 2 3 n 5 4 6 4 4 i x i 14,50 6,75 5,20 -13,45 -30,08 s 29,60 9,15 6,96 13,11 14,57 i

Szóráshomogenitás ellenőrzése Levene-próba: F(4; 7) = 0,784 (p > 0,10, n. sz.) O’Brien-próba: F(4; 8) = 1,318 (p > 0,10, n. sz.)

Nemlineáris det. együttható: Hagyományos VA Hatásvariancia: Vark = 1413,9 Hibavariancia: Varb = 286,2 F(4, 18) = 1413,9/286,2 = 4,940** Nemlineáris det. együttható: e2 = Qk/(Qk + Qb) = 0,523

Robusztus VA-k Welch-próba: W(4, 8) = 5,544* James-próba: U = 27,851+ Brown-Forsythe-próba: BF(4, 9) = 5,103*

Átlagok páronkénti összehasonlítása Tukey-Kramer-próba: T12= 0,97 T13= 1,28 T14= 3,48 T15= 5,55** T23= 0,20 T24= 2,39 T25= 4,35* T34= 2,42 T35= 4,57* T45= 1,97

Egyszempontos összetartozó mintás VA

Anya-gyerek megszólalások aránya 8 7 6 5 4 3 2 1 2 3 4 5 6 7 8 Gyerek kora (hónap)

Összetartozó mintás VA modellje Összehasonlított változók: X1, X2, ... , XJ Nullhipotézis: H0: E(X1) = E(X2) = ... = E(XJ) Ekvivalens felírás: H0: m1 = m2 = ... = mJ

Qt = Qk + Qp + Qe Teljes variabilitás Minták közötti variab. Személyek Maradék hiba Qt = Qk + Qp + Qe

A VA végrehajtása Hatásvariancia: Vark = Qk/fk Hibavariancia: Vare = Qe/fe Próbastatisztika: F = Vark/Vare

VA alkalm. feltételei teljesülnek H0: m1 = m2 = ... = mJ + VA alkalm. feltételei teljesülnek F = Vark/Vare F-eloszlást követ F ³ Fa: H0-t a szinten elutasítjuk

Egyszempontos összetartozó mintás VA alkalm. feltételei Normalitás Szóráshomogenitás Jelölés: Vik = Xi - Xk A Vik különbségváltozók elméleti szórásai legyenek ugyanakkorák: D(Vik) = D(Vlj)

A VA alkalmazásának elégséges feltétele Normalitás Szóráshomogenitás: H0: D(X1) = D(X2) = ... = D(XJ) Korrelációs homogenitás: r(Xi, Xk) = r

Egy számítási példa

Átlagok páronkénti összehas.: Hagyományos VA Hatásvariancia: Vark = 1686,9 Hibavariancia: Vare = 121,4 F-érték: F(2; 226) = 13,896** Átlagok páronkénti összehas.: T12= 6,01** T13= 0,82 T23= 6,83**

Robusztus VA Huynh-Feldt-féle epszilon: e = 0,98 F-érték: F(2; 222) = 13,896**

Kétszempontos VA

Az iskolázottság és a nem hatása a Szex%-ra 4 3 Nő Szex% Férfi 2 1 Alsófok Középfok Felsőfok

Az iskolázottság és a nem hatása a Ruha%-ra 5 4 3 Nő Ruha% Férfi 2 1 Alsófok Középfok Felsőfok

A diagnózis és az IQ-típus hatása az IQ-szintre 105 VIQ 100 95 PIQ 90 85 80 Paranoid Sch. Neurot. Organ. Alkohol. Sine morbo

A frusztráció és a nem hatása a pulzusra 105 100 Pulzus 95 Nő Férfi 90 85 1. mérés 2. mérés 3. mérés

Qt = QA + QB + QAB + Qb Teljes variabililitás A szemp. B szemp. AB inter. Maradék hiba Qt = QA + QB + QAB + Qb

A kétszempontos ftl. mintás VA összefoglaló táblázata Hatás f Variancia F-érték F Var A b = A f = I - 1 Var A A F Var B b = B f = J - 1 Var B B F Var AB b = AB f = f × f Var AB A B AB Hiba f = N - I × J Var b b

Modellegyenletek a VA-ban 1szemp. ftl. mintás: mi = m + ai 1szemp. öt. mintás: mij = m + ai + pj 2sz. ftl. mintás: mij = m + ai + bj + gij ai: „A” szempont i-edik szintjének hatása bj: „B” szempont j-edik szintjének hatása gi: (i, j) szintkombináció interakciós hatása

Kezelési hatás két független minta esetén Változás: m1 - m2 Cohen-féle delta: D = (m1 - m2)/s Cliff-féle sztochasztikus különbség: d = P(X1 > X2) - P(X2 > X1) = = A12 - A21