Energiatervezési módszerek Ökonometriai eszközök statisztikai jellemzők regressziószámítás
Ökonometria Mi az ökonometria? Az ökonometria feladata gazdasági-társadalmi jelenségek statisztikai modellezése. Milyen ismeretek szükségesek: matematika (algebra) statisztika Felhasznált módszer és eszköz: módszer: regressziószámítás eszköz: táblázatkezelő (MS Excel, OO Calc) és gretl. A gretl elérhető: http://gretl.sourceforge.net/
Modellalkotás A modellek jellemzői Mire jók a modellek? Modell = egyszerűsítő (torzított) lényegkiemelés Kényelmes eszközzel (matematikai módszer) vizsgálható Kulcskérdés: absztrakciós szint megválasztása Egyensúlyozás: kezelhetőség ↔ valósághűség Mire jók a modellek? elemzés előrejelzés
Modellalkotás lépései hipotézis felállítása (gondolkodási modell, célok és eszközök) adatgyűjtés matematikai modell megválasztása modellparaméterek meghatározása (becslése) validáció (ellenőrzés)
Matematikai (statisztikai) fogalmak Átlag (számtani): Szórás: Kovariancia: torzított becslés, n≥30 korrigált szórás torzítatlan becslés, n<30
Regressziószámítás Jelölések: eredmény- vagy függő változó: y vagy y (vektor) magyarázó- vagy független változó: x vagy X (mátrix) maradék vagy hiba: ε vagy ε (vektor) együtthatók: β vagy β (vektor) k számú változóval és változónként n megfigyeléssel:
Regressziószámítás Becsült lineáris regressziós fgv. (^: becsült paraméter) A becsült regressziós fgv. hibája: reziduum (maradék): Fontos!
Regressziószámítás Regressziós fgv. paramétereinek becslése Módszer: klasszikus legkisebb négyzetek módszere (Ordinary Least Squares, OLS) Célfüggvény: eltérések (reziduumok) négyzetösszege Cél: MIN(g)!
A regresszió „jóságát” meghatározó mutatók eltérések négyzetösszege: Regressziószámítás A regresszió „jóságát” meghatározó mutatók eltérések négyzetösszege: (sum of squares of residuals) regressziós (magyarázott) négyzetösszeg: (explained sum of squares) teljes négyzetösszeg: TSS=ESS+RSS determinációs együttható: (a korrelációs együttható négyzete)
Regressziószámítás Paramétertesztelés nullhipotézis H0: βj=0; ellenhipotézis H1: βj≠0 H0 fennáll ha t-statisztikára: α: szignifikanciaszint (fontosság) annak a valószínűsége, hogy a jó (null-) hipotézist elvetjük általában: 5% vagy 10% kockázat p-érték a nullhipotézis elfogadásának valószínűsége
Hipotézisvizsgálat az adatforrás működési „mechanizmusát” egy véletlen eloszlás/függvénykapcsolat jellemzi az adatok ismeretében megfogalmazódnak bizonyos hipotézisek erre az eloszlásra/függvénykapcsolatra nézve ellenőrizzük, hogy az adatok mennyire támasztják alá a hipotéziseket
Statisztikai próbák t-statisztika (egymintás t-próba): m: feltételezett (megadott) érték Nullhipotézis: Alternatív hipotézis: A nullhipotézist el kell vetni ha
t-próba Példa: sokaságból vett minta feltételezett normáleloszlás szabadságfok szignifikanciszint, α 0.1 0.05 0.01 0.001 1 6.31 12.71 63.66 636.62 2 2.92 4.30 9.93 31.60 3 2.35 3.18 5.84 12.92 4 2.13 2.78 4.60 8.61 5 2.02 2.57 4.03 6.87 6 1.94 2.45 3.71 5.96 7 1.89 2.37 3.50 5.41 8 1.86 2.31 3.36 5.04 9 1.83 2.26 3.25 4.78 10 1.81 2.23 3.17 4.59 11 1.80 2.20 3.11 4.44 12 1.78 2.18 3.06 4.32 13 1.77 2.16 3.01 4.22 14 1.76 2.14 2.98 4.14 15 1.75 2.95 4.07 16 2.12 4.02 17 1.74 2.11 2.90 3.97 18 1.73 2.10 2.88 3.92 19 2.09 2.86 3.88 20 1.72 2.85 3.85 21 2.08 2.83 3.82 22 2.07 2.82 3.79 23 1.71 3.77 24 2.06 2.80 3.75 25 2.79 3.73 26 27 1.70 2.05 2.77 3.69 28 2.76 3.67 29 3.66 30 2.04 2.75 3.65 40 1.68 2.70 3.55 60 1.67 2.00 2.66 3.46 120 1.66 1.98 2.62 3.37 ¥ 1.65 1.96 2.58 3.29 Példa: sokaságból vett minta feltételezett normáleloszlás minta: 483, 502, 498, 496, 502, 483, 494, 491, 505, 486 átlag: 494 szignifikás-e (jellegzetes-e) az eltérés, valóban 500 az átlag? Nullhipotézis: az átlag = 500 szabadságfok: f=n-1 elemszám: 10 szórás: 8,05 t=2,36 Táblázatból: t0,05=2,26, mivel t≥t0,05, ezért a sokaság átlaga nem 500, az eltérés szignifikáns
A p-érték fogalma a p-érték nagy a p-érték kicsi H0-t elfogadjuk Regressziószámítás A p-érték fogalma van egy olyan legkisebb szigni- fikanciaszint, amelyen már biztosan el kell fogadnunk a nullhipotézist elfogadási tartomány Ez az ún. p-érték a p-érték nagy a p-érték kicsi H0-t elfogadjuk H0-t elvetjük
Példa - Adatelemzés GDP-TPES (1990-2009): nem látszik kapcsolat
Példa - Adatelemzés GDP-villamos energia (1990-2009): lineáris (?) kapcsolat
Példa - Eredmények A GDP jó magyarázó változó β Std. hiba t-statisztika p-érték const 15326,4 3238,07 4,7332 0,00017 *** GDP 4,01053 0,466223 8,6022 <0,00001 *** Mean dependent var 43028,30 S.D. dependent var 351,920 SSR 87790511 S.E. of regression 2208,450 R-squared 0,838685 Adjusted R-squared 0,829723 F(1, 18) 73,99734 P-value(F) 8,59e-08 Log-likelihood -181,3261 Akaike criterion 366,6522 Schwarz criterion 368,6436 Hannan-Quinn 367,0409 rho 0,306655 Durbin-Watson 1,326367 A GDP jó magyarázó változó A modell meggyőző erejű (a változás 83%-át magyarázza)
Példa2 – Kétváltozós regresszió vill.en.=f(GDP, árindex) létezik?
Példa2 - Eredmények Coefficient Std. Error t-ratio p-value const -4440,38 11648,3 -0,3812 0,70777 GDP 4,83871 0,743157 6,5110 <0,00001 *** price_idx122,986 60,238 2,0417 0,05702 * Mean dependent var 43028,30 S.D. dependent var 51,920 Sum squared resid 79632667 S.E. of regression 2164,318 R-squared 0,853675 Adj. R-squared 0,836460 F(2, 17) 51,00601 P-value(F) 6,55e-08 Log-likelihood -180,3508 Akaike criterion 366,7016 Schwarz criterion 369,6888 Hannan-Quinn 367,2847 rho 0,270488 Durbin-Watson 1,375572 Az árindex még elfogadható (határeset) magyarázó változó. A modell jósága növekedett.
Regressziószámítás - Ellenőrzés Több változó további ellenőrzés Változók közötti kapcsolat: egymást magyarázzák? Kollinearitás, multikollinearitás Variancianövelő tényező: VIF (variance inflation factor) : determinációs együttható a j-edik és a többi vált. között : tolerancia VIF≥1, 10 felett: erős kollinearitás
Példa2 – Kollienearitás ellenrőzése Variance Inflation Factors Minimum possible value = 1.0 Values > 10.0 may indicate a collinearity problem GDP 3,386 price_idx 3,386 A változók nem magyarázzák egymást, függetlenek.
Regressziószámítás - Ellenőrzés Korrigált determinációs együttható n: változók száma p: paraméterek száma R2: eredeti det. együttható Jellemzői: „bünteti” új változók bevonását negatív is lehet
Regressziószámítás - Ellenőrzés Akaike információs kritérium (AIC) n: a mintaelemszám RSS: a hibanégyzet összeg, DFerror: a hiba szabadságfoka (n-p-1), p: a modell paraméterszáma Mivel a hibán (RSS) alapul, minél kisebb, annál jobb. Sok paraméter (p) jól magyaráz (RSS csökken) lényegkiemelő szerep csökken
Regressziószámítás - Ellenőrzés Normalitás vizsgálat A maradékoknak (e) normális eloszlásúnak kell lenniük! Eszközök (grafikus, vizuális eszközök): maradékok sűrűségfüggvénye (gyakoriságok) Q-Q plot (Q-Q diagram) további eszközök (pl. P-P plot stb.)
Példa2 – Normalitás vizsgálat Normalitás vizsgálat – maradékok gyakorisága
Példa2 – Normalitás vizsgálat Normalitás vizsgálat – Q-Q plot Pontok illeszkedjenek az egyenesre!