Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
Regresszió-számítás 2. hét
2
Regressziószámítás célja
Az analitikus regressziószámítás célja, a tényezőváltozónak az eredményváltozóra gyakorolt hatását matematikai modell segítségével fejezze ki. A matematikai modellben specifikáljuk az analitikus regressziófüggvényt. A sztochasztikus kapcsolatban megnyilvánuló törvényszerűség kifejezési formája.
3
Regresszió-függvények
A statisztikai gyakorlatban leggyakrabban a előforduló függvények: lineáris regresszió, hatványkitevős regresszió, exponenciális regresszió, parabolikus regresszió, hiperbolikus regresszió.
4
Az összefüggés–vizsgálatok általános menete
célkitűzések megfogalmazása, adatbázis megteremtése, függvény – specifikáció (függvény típusának kiválasztása), a kiválasztott függvény paramétereinek számítása, illeszkedésvizsgálat, szignifikancia-vizsgálatok (a modell és a paraméterek tesztelése), a regressziós értékek konfidencia határainak a megállapítása, elaszticitás (rugalmasság) meghatározása, korrelációszámítás (lineáris esetben a korreláció-számítás megelőzheti a regresszió-analízist), az eredmények értelmezése.
5
A lineáris regresszió modellje
Legyen X egy tényezőváltozó és Y egy eredményváltozó. Tételezzük fel, hogy X lineáris törvényszerűség szerint fejti ki hatását Y-ra, illetve közrejátszik egy véletlen mozzanat is. A két változó kapcsolatának a formulája: regressziós együtthatók véletlen változó
6
Lineáris regressziós modell feltételei
A változók közötti kapcsolat lineáris: Y változó megfelelő X-hez tartozó értéke X lineáris függvénye. Y/X=β0+ β1X+ ε/X A magyarázó változó(k) nem valószínűségi változó(k). Sztochasztikus specifikáció (maradékváltozó tulajdonságai): A maradékváltozók feltételes várható értéke 0: E(ε/X)=0 A maradékváltozók feltételes varianciája legyen állandó (homoszkedaszticitási feltétel): Var(ε/X)=σ2 A maradékváltozó különböző X-értékekhez tartozó értékei legyenek korrelálatlanok: Cov(ε/Xi, ε/Xi’)=0, ha i≠i’ A maradékváltozó feltételes eloszlásai legyenek normálisak.
7
A regressziós együtthatók becslése
A lineáris regresszió ismeretlen 0 és 1 paramétereinek becsléséhez kizárólag az (xi, yi) adatpárokkal (megfigyelési eredményekkel) rendelkezünk. Jelöljük a regressziós együtthatók becsléseit rendre b0 és b1 szimbólumokkal, a becsült regressziófüggvény pedig legyen:
8
Regressziós együtthatók becslése
A i feltételes várható érték becslése valamely rögzített X = xi helyen ennek megfelelően A becsült regressziós együtthatók kiszámításához a legkisebb négyzetek módszerét fogjuk alkalmazni.
9
A regressziós becslés normálegyenletei
A legkisebb négyzetek módszere szerint azzal az egyenessel becsüljük a lineáris regressziófüggvényt, amelyre nézve a négyzetösszeg a legkisebb értékét veszi fel.
10
A regresszió-függvények fontosabb tulajdonságai
A regressziós együtthatók becslése torzítatlan: M(b0) = 0 és M(b1) = 1 A feltételes várható érték torzítatlan becslése M( ŷi) = i A b0 és b1 a regressziós paraméterek legjobb lineáris torzítatlan becslései, abban az értelemben, hogy legkisebb a szórásuk (standard hibájuk). Ez az ún. Gauss-Markov-tétel. Ha a lineáris regressziós modell feltételeihez még azt is csatoljuk, hogy a véletlen változó normális eloszlást követ, akkor levezethetők a 0 és 1 maximum likelihood becslései is, amelyek azonosak a legkisebb négyzetek módszeréből származó becslő formulákkal.
11
Az eredmények értelmezése
A b0 regressziós együttható jelentőségét az adja meg, hogy az X = 0 helyen a függvény éppen ezt az értéket veszi fel. Értelmezése tehát attól függ, hogy a nulla beletartozik-e azon X értékek halmazába, amelyből a regressziót számítottuk, vagy legalábbis logikailag az értelmezési tartomány részének tekinthető-e? A b1 regressziós együttható geometriai értelemben az egyenes meredekségét meghatározó iránytangens, azaz dy/dx. A korrelációs kapcsolat elemzésekor ebből azt olvashatjuk le, hogy a tényezőváltozó egységnyi változása mekkora hatással jár együtt az eredményváltozóban.
12
Egy vállalat dolgozóinak keresete és havi megtakarítása
Átlagbér (Ft/fő) Havi megtakarítás (Ft/hó) 1 120000 13000 2 90000 10000 3 220000 35000 4 150000 18000 5 100000 12000 6 115000 12500 7 160000 20000 8 130000 13800 9 145000 14000 10 11800 Összesen 160100 x2 y2 dxdy dx2 xy 107000 80000 185000 132000 88000 102500 140000 116200 131000 88200
13
Havi megtakarítás (Ft/hó)
Mintapélda megoldása Dolgozó Bér (Ft/fő) Havi megtakarítás (Ft/hó) x2 y2 dxdy dx2 xy … Összesen 160100 Regressziós paraméterek értékei: b0=-8144,65 b1=0,1816 Regressziós egyenes: ŷ= =-8144,65+0,1816x Regressziós paraméterek értelmezése: b0=ha dolgozók bére 0 Ft, akkor a havi megtakarítás összege -8144,65 Ft: nem értelmezzük!!! b1=ha a dolgozók bére havonta 1 Ft-tal növekedne, akkor a havi megtakarítás összege 0,1816 Ft-tal növekedne.
14
Az elaszticitás fogalma
A rugalmasság mérőszáma arra ad választ, hogy Y relatív változása (növekménye) hányszorosa az X relatív változásának (pl. egyszázalékos X növekményre hány százalék Y növekmény jut). A lineáris regresszió elaszticitása Az elaszticitás átlagos szinten:
15
Elaszticitás a mintapélda alapján
Értelmezés: ha dolgozók keresete 1%-kal növekszik, akkor a havi megtakarított összeg átlagosan 1,51%-kal növekszik.
16
Nemlineáris regresszió
17
Hatványkitevős regresszió
A hatványkitevős regressziós összefüggés a társadalmi-gazdasági életben gyakran előfordul. Ezt figyelhetjük meg például a háztartások jövedelme és a fogyasztási kiadásai között. A hatványfüggvény általános képlete: Az „a” paramétert a gyakorlatban nem értelmezzük, a „b” paramétert rugalmassági (elaszticitási) együtthatónak is nevezzük. Jelentése: „x” egy százalékos változása, „y” hány százalékos változását vonja maga után. Ez hasonló a lineáris esetben számított rugalmassági együtthatóhoz, de ez minden „x” esetén ugyanannyi. A hatványfüggvény lefutása a „b” paraméter értékétől függ.
18
A függvény átalakítása
A hatványfüggvény lineárissá alakítható logaritmálás segítségével, így az átalakítás után alkalmazhatóak a lineáris függvénynél alkalmazott ismeretek. A logaritmizálás után a következő összefüggést kapjuk: Az átalakítás után nem „x”-ek és „y”-ok között van lineáris kapcsolat, hanem log „y”-ek és log „x”-ek között, tehát nincs más dolgunk, mint az eredeti változók logaritmusát képezni, és ezek között keresni a lineáris kapcsolatot.
19
Paraméterek értelmezése – grafikus ábrák által
Ha b1, akkor rugalmas (vagy gyorsuló növekedésű) hatványfüggvényről beszélünk. A rugalmas hatványfüggvény alakja
20
Paraméterek értelmezése – grafikus ábrák által
Ha 0b1, akkor rugalmatlan (lassuló növekedésű) a függvény. A rugalmatlan hatványfüggvény alakja
21
Paraméterek értelmezése – grafikus ábrák által
Ha b0, akkor csökkenő a függvény. A csökkenő hatványfüggvény alakja
22
Mintapélda: Néhány család jövedelem és fogyasztás értékei
ln x ln y 3,68 3,65 3,76 3,79 3,83 3,7 3,91 3,97 3,92 4,0 3,8 4,03 3,9 4,12 4,09 3,94 Rendelkezésre álló jövedelem (ezer Ft/fő) x változó Fogyasztásértéke y változó 39,8 38,6 43,1 44,4 46,2 40,4 49,7 45,9 52,8 50,5 54,8 44,8 56,1 49,5 61,6 53,2 59,7 51,4
23
A hatványfüggvény regresszió-analízisének outputja
REGRESSZIÓS STATISZTIKA r értéke 0,885 r-négyzet 0,783 Megfigyelések 9 VARIANCIAANALÍZIS Df SS MS F F szignifikanciája Regresszió 1 0,0758 25,278 0,0015 Maradék 7 0,02099 0,00299 Összesen 8 0,0968 Koefficiensek Standard hiba t érték p-érték Alsó 95% Felső 95% Tengelymetszet ("a" paraméter) 1,255 0,513 2,444 0,0445 0,0407 2,4689 X változó 1 ("b" paraméter) 0,656 0,131 5,028 0,3475 0,9645 Visszatranszformált "a" paraméter: 3,51
24
A táblázat alapján az eredmények értelmezése
A regressziós függvény a következő Csak a „b” paramétert értelmezzük, amely azt mutatja meg, hogy a jövedelem 1%-os emelkedése a fogyasztás 0,656%-os emelkedését vonja maga után. Hatványfüggvény esetén a „b” paramétert rugalmassági (elaszticitási) együtthatónak is hívják
25
Exponenciális regresszió
Ennek a típusnak is van gyakorlati jelentősége, főleg idősorok esetén, amikor azt vizsgáljuk, hogy egyik időszakról a másikra hány százalékkal változott a vizsgált jelenség. Az exponenciális-függvény képlete: Az „a” paramétert a gyakorlatban nem értelmezzük. A „b” paraméter azt mutatja meg, hogy „x” egy egységnyi változása az „y” hány %-os változását vonja maga után. Az exponenciális függvény lefutása a „b” paraméter értékétől függ.
26
Paraméterek értelmezése – grafikus ábrák által
Ha b1, akkor növekvő a függvényről beszélünk. Az emelkedő exponenciális függvény alakja:
27
Paraméterek értelmezése – grafikus ábrák által
Ha 0b1, akkor csökkenő a függvény A csökkenő exponenciális függvény alakja
28
A függvény átalakítása
Az exponenciális függvény is átalakítható lineárissá, logaritmizálás segítségével: Az átalakítás után nem „x”-ek és „y”-ok között van lineáris kapcsolat, hanem log „y”-ek és „x”-ek között, tehát az eredeti „y” változók logaritmusát kell képezni, és log „y”-ok és „x”-ek között keresni a lineáris kapcsolatot.
29
Mintapélda Az anyagköltség és a termelési érték kapcsolata
Változók Megfigyelések 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Anyagköltség (x változó) 34 38 44 48 56 62 70 76 82 90 Termelési érték (y változó) 66 80 104 125 100 126 110 135 130 ln y 4,189 4,5 4,38 4,644 4,828 4,605 4,836 4,7 4,905 4,867
30
Az exponenciális regresszió outputja
REGRESSZIÓS STATISZTIKA r értéke 0,834 r-négyzet 0,696 Megfigyelések 10 VARIANCIAANALÍZIS df SS MS F F szignifikanciája Regresszió 1 0,341 18,314 0,003 Maradék 8 0,149 0,019 Összesen 9 0,490 Koefficiensek Standard hiba t érték p-érték Alsó 95% Felső 95% Tengelymetszet 4,038 0,148 27,199 0,000 3,696 4,380 X változó 1 0,010 0,002 4,279 0,005 0,016 Visszatranszformált „a”: 56,71 Visszatranszformált „b”: 1,01
31
A táblázat alapján az eredmények értelmezése
A függvény képlete a következő: Az „a” paramétert nem értelmezzük. A „b” paraméter azt mutatja meg, hogy ha egy egységgel nő az „x”, akkor az „y”, b.100 százalékra változik. Konkrétan a mi példánkban, ha az anyagköltség 1000 Ft-tal emelkedik, akkor a termelési érték 1%-kal (101 %-ra) nő.
32
Köszönöm a figyelmet
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.