Regressziós modellek Regressziószámítás
Néhány példa Egy adott áru keresett mennyisége hogyan változik különböző árak mellett? (Keresleti görbe). Egy adott áru kínált mennyisége hogyan alakul különböző árak mellett? (Kínálati görbe). Adott tőkeállomány és technológia mellett a felhasznált munka különböző mennyiségeihez mekkora megtermelhető maximális termékmennyiség tartozik? (Rövid távú termelési függvény.) Hogyan változik a maximálisan előállítható termékmennyiség, ha nemcsak a felhasznált munka, hanem a tőkeállomány és az üzemméret is változik? (Hosszú távú termelési függvény) A munkabér különböző értékei hogyan befolyásolják az egyén által kínált munkamennyiséget? (Egyéni munkakínálati görbe). Hogyan befolyásolja a dolgozó életkora a táppénzen töltött napok számát? Milyen hatással van az adott bank kihelyezési kölcsön költségére az éves átlagos kölcsön nagysága, az évi összes kölcsönkérők száma, az új kölcsönkérvényezők száma és a bank fizetési skála indexe?
Regressziós modellek Jelölések: m: magyarázóváltozók száma n: megfigyelések száma X: tényezőváltozók, magyarázóváltozók Y: eredményváltozó, függőváltozó e: hibatag Problémák: Releváns változók köre? Adatok forrása? Függvénytípusa? Miért támadják a gazdasági modelleket?
Honnan sejthetjük meg a függvényformát? (grafikus ábrázolás, elméleti összefüggések, stb.)
Néhány függvényforma Kétváltozós regressziós modell (m=1) Többváltozós regressziós modell (m>1) Lineáris függvény Exponenciális függvény Lineáris függvény Exponenciális függvény
Néhány függvényforma Kétváltozós regressziós modell (m=1) Többváltozós regressziós modell (m>1) Hatványkitevős függvény Hatványkitevős függvény
Kérdések: 1. Mit mutatnak meg a regressziós paraméterek? Kétváltozós lineáris modell Többváltozós lineáris modell Ha a magyarázóváltozó értéke nulla, akkor az eredményváltozó modell alapján becsült értéke: b0 Ha a magyarázóváltozó értéke 1 egységgel nő, akkor az eredményváltozó modell alapján becsült értéke átlagosan b1 egységgel nő. Ha mindegyik magyarázóváltozó értéke nulla, akkor az eredményváltozó modell alapján becsült értéke: b0 Ha a j-edik magyarázóváltozó értéke 1 egységgel nő minden más változatlansága mellett (ceteris paribus), akkor az eredményváltozó modell alapján becsült értéke átlagosan bj egységgel nő.
Kérdések: 1. Mit mutatnak meg a regressziós paraméterek? Kétváltozós exponenciális modell Többváltozós exponenciális modell Ha a magyarázóváltozó értéke nulla, akkor az eredményváltozó modell alapján becsült értéke: b0 Ha a magyarázóváltozó értéke 1 egységgel nő, akkor az eredményváltozó modell alapján becsült értéke átlagosan b1 -szeresére nő. Ha mindegyik magyarázóváltozó értéke nulla, akkor az eredményváltozó modell alapján becsült értéke: b0 Ha a j-edik magyarázóváltozó értéke 1 egységgel nő minden más változatlansága mellett (ceteris paribus), akkor az eredményváltozó modell alapján becsült értéke átlagosan bj –szeresére nő.
Kérdések: 1. Mit mutatnak meg a regressziós paraméterek? Többváltozós hatványkitevős modell Kétváltozós hatványkitevős modell Ha a magyarázóváltozó értéke egységnyi, akkor az eredményváltozó modell alapján becsült értéke: b0 Ha a magyarázóváltozó értéke bármilyen szintről 1 százalékkal nő, akkor az eredményváltozó modell alapján becsült értéke átlagosan és megközelítőleg b1 százalékkal nő. Ha mindegyik magyarázóváltozó értéke egységnyi, akkor az eredményváltozó modell alapján becsült értéke: b0 Ha a j-edik magyarázóváltozó értéke bármilyen szintről 1 százalékkal nő minden más változatlansága mellett (ceteris paribus), akkor az eredményváltozó modell alapján becsült értéke átlagosan megközelítőleg bj százalékkal nő.
Standard (klasszikus) lineáris regressziós modell alkalmazási feltételei Kétváltozós modell Többváltozós modell Hibatag várható értéke nulla. A hibatag különböző megfigyelésekhez tartozó értékei egymástól függetlenek. A hibatag konstans varianciájú (reziduális szórásnégyzet). Hibatag várható értéke nulla. A hibatag különböző megfigyelésekhez tartozó értékei egymástól függetlenek. A hibatag konstans varianciájú (reziduális szórásnégyzet). A magyarázóváltozók egymástól függetlenek (nincs multikollinearitás)
2. kérdés: Ha tudom a függvényformát, hogyan számíthatom ki a regressziós paramétereket? Megoldás: legkisebb négyzetek módszere (LNM) angol rövidítés: OLS
Például: Lineáris regresszió (m=1)
Kérdések: 2. Ha tudom a függvényformát, hogyan számíthatom ki a regressziós paramétereket? Kétváltozós lineáris modell Többváltozós lineáris modell
Kérdések: 2. Ha tudom a függvényformát, hogyan számíthatom ki a regressziós paramétereket? Lineárisra függvényre próbálják visszavezetni (linearizálás) [csak SPSS] Exponenciális Hatványkitevős
Regressziós modellek jellemzői
Alapkérdések Mi a modell egyenlete, hogyan értelmezhetőek a regressziós paraméterek? A modell főbb statisztikai jellemezői Mekkora a modell magyarázó ereje? (többszörös) determinációs együttható Szignifikáns-e az ok(ok) kapcsolata az okozattal (milyen a modell illeszkedése)? (többszörös) korrelációs együttható+tesztelés Mekkora a becslés standard hibája, azaz a tényleges és becsült értékek átlagosan mennyivel térnek el egymástól? Reziduális szórás Minden magyarázóváltozót célszerű-e a modellben szerepeltetni.
Reziduális szórás (standard error of the estimates) az eredményváltozó tényleges és a modell alapján becsült értékeinek az átlagos eltérését adja meg
Magyarázóerő Kétváltozós modell: Determinációs együttható Alapja: varianciafelbontás Kétváltozós modell: Determinációs együttható Többváltozós modell: Többszörös Determinációs együttható Kifejezi, hogy az eredményváltozó értékeinek különbözőségét (szórásnégyzetét) mekkora hányadban értelmezhetjük a magyarázóváltozóval. Elvárás: min. 80% Kifejezi, hogy az eredményváltozó értékeinek különbözőségét (szórásnégyzetét) mekkora hányadban értelmezhetjük együttesen a magyarázóváltozókkal. Elvárás: min. 80%
Összegezve Regressziószámítás során feltétlenül meg kell vizsgálnunk a többszörös determinációs együtthatót (R-square) a többszörös korrelációs együtthatót a reziduális szórást a regressziós modell illeszkedésének jóságát. Végre kell hajtanunk a paraméterek tesztelését Miután megállapítottuk, hogy megfelelő a modell magyarázó ereje, a modellben csak megfelelő változók szerepelnek, felírhatjuk a regressziós modell egyenletét, majd értelmezzük ennek paramétereit.
Korreláció és regresszió Excelben: Lin.ill() függvény bn bn-1 … b2 b1 b0 sbn sbn-1 sb2 sb1 sb0 R2 se F df SSR SSE
Korreláció és regresszió Excelben: Adatelemzés bővítmény
Lineáris regresszió SPSS-ben Analyze/Regression/Linear
Nemlineáris regresszió SPSS-ben Analyze/Regression/Curve Estimation