Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Többváltozós lineáris regressziós modell feltételeinek tesztelése.

Hasonló előadás


Az előadások a következő témára: "Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Többváltozós lineáris regressziós modell feltételeinek tesztelése."— Előadás másolata:

1 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz

2 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Többváltozós lineáris regressziós modell x 1, x 2, …, x p és y közötti kapcsolatot ábrázoló egyenes. Az y függ: x 1, x 2, …, x p – p db magyarázó változótól A véletlen ingadozásától (ε) β 0, β 1, …, β p regressziós együtthatóktól. Y = β 0 + β 1 x 1 + β 2 x 2 +…+ β p x p +ε

3 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet A hibatagra vonatkozó feltételek 1.Várható értéke 0  M(ε) = 0 2.Varianciája konstans  Var(ε) =  2 3.A hibatag értékei nem autokorreláltak. 4.Normális eloszlású valószínűségi változó.

4 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet A magyarázó változókra vonatkozó feltételek 1.Egymástól lineárisan függetlenek legyenek. (egyik magyarázó változót se lehessen a többi magyarázó változó lineáris kombinációjaként előállítani) 2.Értékeik rögzítettek legyenek, ne változzanak mintáról mintára. 3.Mérési hibát nem tartalmaznak. 4.Nem korrelálnak a hibatényezővel.

5 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet FeltételFelt. sérüléseKöv.EllenőrzésMegjegyzés Függő és független változókra vonatkozó feltétel LinearitásNem lineáris kapcsolat Becsült értékek sérülése Pontdiagram, r 2 Független (egymástól) MultikollinearitásMegbízhatatlan becslés, magas st. hiba a regr. koefficiensnél F szignifikáns, t nem; Korrelációs mátrix; VIF-mutató Kizárólag többváltozós regr. esetében Hibatagokra vonatkozó feltétel Normális eloszlás Nem normális eloszlás F-teszt, t-teszt érvénytelen Reziduumok standardizált eloszlásának hisztogramjai Legkisebb négyzetek módszere kiküszöböli Nem korreláltak AutokorrelációNem hatásos, nagy KI Reziduumok ábrázolása az idő / a megfigyelések sorrendjében; Durbin- Watson teszt Idősornál merülhet fel a probléma. Homoszke- daszticitás Hetero- szkedaszticitás; korrelál az X i -vel Nem hatásos, nagy KI Pontdiagram a standardizált reziduumok szórásáról Logaritmizálás vagy a súlyozottan LNM segít Forrás: Sajtos-Mitev [2006], 217.o.

6 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Standard lineáris regressziós modell Ahol az előbb említett feltételek teljesülnek.  Amennyiben a mintabeli adatok nem igazolják a feltételek teljesülését, bonyolultabb modellre és becslési eljárásokra van szükség.

7 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet A hibatagra vonatkozó feltételek ellenőrzése a)Várható értéke 0  M(ε) = 0 b)Varianciája konstans  Var(ε) =  2 c)A hibatag értékei nem autokorreláltak. d)Normális eloszlású valószínűségi változó.

8 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 1. M(ε) = 0 A hibatagok pozitív és negatív értékei kiegyenlítik egymást. Ha eltér a 0-tól, annak oka lehet, hogy kihagytunk a modellből egy szignifikáns magyarázó változót. Nehéz a gyakorlatban ellenőrizni. Ha feltételezzük, hogy a legkisebb négyzetek módszere érvényesül, akkor teljesül ez a feltétel.

9 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet A hibatagra vonatkozó feltételek ellenőrzése a)Várható értéke 0  M(ε) = 0 b)Varianciája konstans  Var(ε) =  2 c)A hibatag értékei nem autokorreláltak. d)Normális eloszlású valószínűségi változó.

10 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 2. Homoszkedaszticitás (Var(ε) =  2 ) A hibatag varianciája állandó. Ha nem: heteroszkedaszticitás Tesztelése: o Grafikus – a becsült reziduumokat a kiválasztott magyarázó változó vagy az ŷ függvényében ábrázoljuk o Statisztikai tesztek – Goldfeld-Quandt-féle teszt

11 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet xixi xixi Homoszkedaszticitás grafikus tesztelése Homoszkedasztikus hibatagHeteroszkedasztikus hibatag e xixi ee ŷ ŷ ŷ e – reziduum x i – becsült érték

12 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet H 0 :  j 2 =  2 H 1 :  j 2 ≠  2 Lépései: 1.Rangsor 2.Független részminták (, ahol r > 0, > p ) 3.Regressziós függvények, reziduális szórásnégyzet (s e 2 ) 4.F-próba: Homoszkedaszticitás Goldfeld- Quandt-féle tesztelése (a varianciákeloszlást követnek és ezek egymástól függetlenek) H0H0 F (1-α/2); ν 1,ν 2 F (α/2)

13 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet SPSS (Feladat) y - árbevételx 1 -vagyonx 2 -létszám véletlenszerűen kiválasztott vállalat adatai a következők:

14 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Analyze / Regression / Linear… - Plots SPSS Függő változó Standardizált becsült érték Standardizált reziduum Törölt reziduum Korrigált becsült érték Studentizált reziduum Studentizált törölt reziduum Standardizált becsült érték (ZPRED) és a standardizált reziduum (ZRESID) viszonya – Homoszkedaszticitás?

15 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output A reziduumok varianciája ~konstans  Homoszkedaszticitás

16 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet A hibatagra vonatkozó feltételek ellenőrzése a)Várható értéke 0  M(ε) = 0 b)Varianciája konstans  Var(ε) =  2 c)A hibatag értékei nem autokorreláltak. d)Normális eloszlású valószínűségi változó.

17 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet A hibatag értékei korrelálatlanok Egyszerű véletlen mintavétel esetében ez a feltétel automatikusan teljesül. Ha a modell idősoros adatokra épül, gyakran előfordul a hibatagok autokorreláltsága. Autokorreláció oka: –Nem megfelelő függvénytípus. –Nem véletlen jellegű mérési hiba. –A modellben nem szerepel valamennyi lényeges magyarázó változó (nem tudjuk, hogy kell / túl rövid idősor / nincs adat).

18 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet A kihagyott változók miatt a reziduumok nem véletlenszerűek, hanem az egymást követő értékek között jelentős korreláció van. Autokorreláció grafikus tesztelése t e e t e t Az autokorreláció a függvénytípus helytelen megválasztásának a következménye. + KVANTITATÍV TESZTEK!

19 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet H 0 : ρ = 0 korrelálatlan H 1 : ρ ≠ 0 autokorreláció 0d l d u 24-d u 4-d l 4 Autokorreláció tesztelése Durbin- Watson próbával - zavaró autokorreláció + zavaró autokorreláció  Határai:  Pozitív autokorreláció:  Negatív autokorreláció:  Bizonytalansági tartomány: nem tudunk dönteni Növelni kell a megfigyelések számát Új változót kell bevonni a modellbe Elfogadási tartomány

20 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet A Durbin-Watson próba döntési táblázata H1H1 ElfogadjukH 0 :p=0 Elvetjük Nincs döntés p>0 Pozitív autokorreláció d>d u d4-d l 4-d l

21 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Durbin-Watson próba - SPSS Analyze / Regression / Linear… - Statistics

22 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Durbin-Watson statisztika (5%-os szignifikanciaszint mellett) nm = 1m = 2m = 3m = 4m = 5 dLdL dUdU dLdL dUdU dLdL dUdU dLdL dUdU dLdL dUdU 151,081,360,951,540,821,750,691,970,562,21 161,101,370,981,540,861,730,741,930,622,15 171,131,381,021,540,901,710,781,900,672,10 181,161,391,051,530,931,690,821,870,712,06 191,181,401,081,530,971,680,861,850,752,02 201,201,411,101,541,001,680,901,830,791,99 211,221,421,131,541,031,670,931,810,831,96 221,241,431,151,541,051,660,961,800,861,94 231,261,441,171,541,081,660,991,790,901,92 241,271,451,191,551,101,661,011,780,931,90 251,291,451,211,551,121,661,041,770,951,89 261,301,461,221,551,141,651,061,760,981,88 271,321,471,241,561,161,651,081,761,011,86 281,331,481,261,561,181,651,101,751,031,85 291,341,481,271,561,201,651,121,741,051,84 301,351,491,281,571,211,651,141,741,071,83 311,361,501,301,571,231,651,161,741,091,83 321,371,501,311,571,241,651,181,731,111,82 331,381,511,321,581,261,651,191,731,131,81 341,391,511,331,581,271,651,211,731,151,81 351,401,521,341,581,281,651,221,731,161,80 361,411,521,351,591,291,651,241,731,181,80 371,421,531,361,591,311,661,251,721,191,80 381,431,541,371,591,321,661,261,721,211,79 391,431,541,381,601,331,661,271,721,221,79 401,441,541,391,601,341,661,291,721,231,79 501,501,591,461,631,421,671,381,721,341,77 601,551,621,511,651,481,691,441,731,411,77 701,581,641,551,671,521,701,491,741,461,77 801,611,661,591,691,561,721,531,741,511,77 901,631,681,611,701,591,731,571,751,541, ,651,691,631,721,611,741,591,761,571,78 Forrás: Statisztikai képletgyűjtemény

23 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 0d l d u 24-d u 4-d l 4 0,951,542,463,05 1,381 d l

24 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet A hibatagra vonatkozó feltételek ellenőrzése a)Várható értéke 0  M(ε) = 0 b)Varianciája konstans  Var(ε) =  2 c)A hibatag értékei nem autokorreláltak. d)Normális eloszlású valószínűségi változó.

25 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet A hibatag eloszlása normális Tesztelése: Grafikusan – a reziduumokat várható értékük függvényében ábrázoljuk  haranggörbe – normális eloszlás Kvantitatív módszerekkel – illeszkedésvizsgálat - próba Ferdeségi, csúcsossági mérőszámokkal

26 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Illeszkedésvizsgálat H 0 : P r (ε j ) = P j (normális eloszláshoz tartozó megfelelő valószínűségi érték) H 1 : J j : P r (ε j ) ≠ P j Ha<  H 0 –t fogadjuk el

27 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Analyze / Regression / Linear… - Plots Grafikus tesztelés - SPSS Függő változó Standardizált becsült érték Standardizált reziduum Törölt reziduum Korrigált becsült érték Studentizált reziduum Studentizált törölt reziduum Hisztogram

28 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output A harang alakú standard normális eloszlás középértéke 0, szórása 1. Közelítőleg NORMÁLIS (de nem egyértelműen)

29 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 2. megoldás Analyze / Regression / Linear… - SAVE

30 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet  Graphs / Histogram - Display normal curve Közelítőleg normális eloszlás. A normális eloszlásgörbe harang alakú. Normális eloszlás grafikus tesztelése 2. - SPSS

31 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Nonparametric Test Analyze / Nonparametric Test / 1-Samle K-S... H 0 - normális eloszlás H 1 - nem normális eloszlás

32 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output Ha a szignifikanciaszint (p) kisebb mint 5% (0,05), elutasítjuk a nullhipotézist. Most nagyobb 0,05-nél, vagyis elfogadjuk, hogy normális eloszlású a görbe. Normális eloszlású

33 Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Köszönöm a figyelmet!


Letölteni ppt "Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Többváltozós lineáris regressziós modell feltételeinek tesztelése."

Hasonló előadás


Google Hirdetések