Bevezetés a Korreláció & Regressziószámításba Petrovics Petra Doktorandusz
Statisztikai kapcsolatok Asszociáció – 2 minőségi/területi ismérv között Vegyes kapcsolat – minőségi/területi és egy mennyiségi ismérv között Korreláció – mennyiségi ismérvek között
Korreláció Regresszió Célja a kapcsolat szorosságának mérése. Célja a kapcsolatban megfigyelhető törvényszerűség megfogalmazása, amelyet valamilyen függvény ír le. X (or X1, X2, … , Xp): magyarázó változó(k), független változó(k) Y: eredményváltozó, függő változó Ok-okozati kapcsolat: X okozza Y változását
Korrelációs mutatószámok Kovariancia (C) értéke - és + közötti; C = 0, amikor X és Y között nincs kapcsolat; a kapcsolat irányát mutatja nem mutatja a kapcsolat értékét!!! Korrelációs együttható (r) A kapcsolat irányát ÉS erősségét mutatja 0 <r<1 Csak lineáris kapcsolat esetében használható! Determinációs együttható (r2) %-os formában méri a kapcsolat erősségét hány %-ban befolyásolja X az Y-t
1. Feladat File / Open / Employee data.sav Van kapcsolat a - current salary és a - beginning salary között? KORRELÁCIÓ
Analyze / Correlate / Bivariate… Irányt és erősséget mutat 0 I r I 0,3 Gyenge kapcsolat 0,3 I r I 0,7 Közepesen erős kapcsolat 0,7 I r I 1 Erős kapcsolat C Csak irányt mutat!!! + -
Output Mean Std. Deviation N Current Salary $34,419.57 $17,075.661 474 Beginning Salary $17,016.09 $7,870.638 Current Salary Beginning Salary Pearson Correlation 1 ,880(**) Sig. (2-tailed) ,000 Sum of Squares and Cross-products 137916495436,340 55948605047,73 Covariance 291578214,45 118284577,27 N 474 29300904965,45 61946944,96
2. Feladat Van kapcsolat a: current salary previous experience (month) month since hire beginning salary között? Többváltozós KORRELÁCIÓ
Analyze / Correlate / Bivariate… Irányt és erősséget mutat 0 I r I 0,3 Gyenge kapcsolat 0,3 I r I 0,7 Közepesen erős kapcsolat 0,7 I r I 1 Erős kapcsolat C Csak irányt mutat!!! + -
Output r C Negatív irányú (inverz) kapcsolat Mátrix Negatív irányú (inverz) kapcsolat r C Negatív irányú (inverz) & gyenge kapcsolat Pozitív irányú kapcsolat Direkt (pozitív irányú) & erős kapcsolat
Lineáris regressziós modell X és Y közötti kapcsolatot ábrázoló egyenes. Az Y függ: x1, x2, …, xp – p db magyarázó változótól A véletlen ingadozásától (ε) β0, β1, …, βp regressziós együtthatóktól. y = β0 + β1x + ε ahol: y – függő vagy eredményváltozó x – független vagy magyarázó változó ε – véletlen hibatag β0 – x=0 helyen β1 – a függvény meredeksége E (y) x β0 β1
Legkisebb négyzetek módszere x Véletlen ŷi = b0 + b1X i
A legkisebb négyzetek módszere becsült mutatói: Regressziós egyenes Ŷ = b0 + b1X Kétváltozós normálegyenlet Σy = nb0 + b1Σx Σxy = b0Σx + b1Σx2
Scatter diagram Direkt kapcsolat Pozitív kapcsolat Inverz kapcsolat lineáris nemlineáris Direkt kapcsolat Pozitív kapcsolat Inverz kapcsolat Negatív kapcsolat
Nincs kapcsolat
Hatványkitevős regresszió (Power) Y = a Xb logY = loga + b logX ↓ ↓ ↓ V = b0 + b1 ∙ x b1 = b b0 = lga
Exponenciális regresszió (Compound) Y = a bx logY = loga + logb x ↓ ↓ ↓ V = b0 + b1 ∙ x b1 = lgb b0 = lga
2. Feladat File / Open / Employee data.sav Milyen természetű a kapcsolat a fizetés és az életkor között? Új változó létrehozása!
Új változó: életkor = adott év – születési dátum (ÉV!) (date of birth) Analyze / Compute Variable… Adott év
Analyze / Regression / Curve Estimation… Lineáris Compound Power Diagram
Output Lineáris Compound Power Itt a legnagyobb az R2
Output Melyik regresszió-függvény illeszkedik a legjobban?
Regresszió Analyze / Regression / Linear…
Korrigált többszörös determinációs együttható Többszörös korrelációs együttható Többszörös determinációs együttható Az összes változónak a függő változóra gyakorolt hatását fejezi ki Összehasonlíthatóvá teszi a többszörös determinációs együtthatót a sokaságon belül. Kiszűri a különböző nagyságú mintákból eredő, különböző függő változó számú, különböző elemszámú (n) és független változó számú (p) sokaságokból eredő hibákat. Megmutatja, hogy a függő változó hány %-át határozza meg az összes független változó együttvéve. A függő változót (current salary) 2,1%-ban határozza meg ez a regressziós modell. Gyenge kapcsolat
Regresszió egyenes: ŷ = b0 + b1X Minden szignifikanciaszinten elfogadható a modell. Regresszió egyenes: ŷ = b0 + b1X b0: X = 0 helyen mennyi az Y. Ha 0 évesek a dolgozók, akkor a keresetük 41543,805$. (Nincs értelme.) b1: ha az X 1 egységgel nő, mennyivel változik az Y. Ha a dolgozók életkora 1 évvel nőne, a fizetésük 211,609$-ral csökkenne.
Köszönöm a figyelmet!