Regresszió-számítás 2. hét.

Slides:



Advertisements
Hasonló előadás
I. előadás.
Advertisements

Kvantitatív Módszerek
Kvantitatív módszerek
Gazdasági informatika
Gazdaságelemzési és Statisztikai Tanszék
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Földrajzi összefüggések elemzése
Két változó közötti összefüggés
Csoportosítás megadása: Δx – csoport szélesség
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Potenciális feladattípusok
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Gazdaságelemzési és Statisztikai Tanszék
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Regresszió és korreláció
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VIII.. Dr. Szalka Éva, Ph.D.2 Többváltozós korreláció és regresszióanalízis.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Lineáris korreláció és lineáris regresszió. A probléma felvetése y = 1,138x + 80,778r = 0,8962.
Regresszióanalízis 10. gyakorlat.
SPSS többváltozós (lineáris) regresszió (4. fejezet)
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Kvantitatív módszerek
Budapesti Műszaki és Gazdaságtudományi Egyetem
STATISZTIKA II. 7. Előadás
Idősor komponensei Trend vagy alapirányzat: az idősor alakulásának fő irányát mutatja meg. Szezonális vagy idényszerű ingadozás: szabályos időszakonként.
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Dr. Varga Beatrix egyetemi docens
Gazdaságstatisztika Korreláció- és regresszióelemzés 20. előadás.
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Következtető statisztika 9.
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapsokaság (populáció)
Alapfogalmak.
Lineáris regresszió.
Két kvantitatív változó kapcsolatának vizsgálata
Kereslet-rugalmassági számítások
I. előadás.
TÁRSADALOMSTATISZTIKA Sztochasztikus kapcsolatok II.
Petrovics Petra Doktorandusz
Korrelációszámítás 1. hét.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Korrelációs kapcsolatok elemzése
Valószínűségszámítás II.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
A számítógépes elemzés alapjai
Lineáris regressziós modellek
Gazdaságstatisztika Konzultáció a korreláció- és regressziószámítás, idősorok elemzése témakörökből.
I. Előadás bgk. uni-obuda
III. zárthelyi dolgozat konzultáció
III. előadás.
Dr. Varga Beatrix egyetemi docens
Trendelemzés előadó: Ketskeméty László
Gazdaságinformatikus MSc
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Dr. Varga Beatrix egyetemi docens
Előadás másolata:

Regresszió-számítás 2. hét

Regressziószámítás célja Az analitikus regressziószámítás célja, a tényezőváltozónak az eredményváltozóra gyakorolt hatását matematikai modell segítségével fejezze ki. A matematikai modellben specifikáljuk az analitikus regressziófüggvényt. A sztochasztikus kapcsolatban megnyilvánuló törvényszerűség kifejezési formája.

Regresszió-függvények A statisztikai gyakorlatban leggyakrabban a előforduló függvények: lineáris regresszió, hatványkitevős regresszió, exponenciális regresszió, parabolikus regresszió, hiperbolikus regresszió.

Az összefüggés–vizsgálatok általános menete célkitűzések megfogalmazása, adatbázis megteremtése, függvény – specifikáció (függvény típusának kiválasztása), a kiválasztott függvény paramétereinek számítása, illeszkedésvizsgálat, szignifikancia-vizsgálatok (a modell és a paraméterek tesztelése), a regressziós értékek konfidencia határainak a megállapítása, elaszticitás (rugalmasság) meghatározása, korrelációszámítás (lineáris esetben a korreláció-számítás megelőzheti a regresszió-analízist), az eredmények értelmezése.

A lineáris regresszió modellje Legyen X egy tényezőváltozó és Y egy eredményváltozó. Tételezzük fel, hogy X lineáris törvényszerűség szerint fejti ki hatását Y-ra, illetve közrejátszik egy véletlen mozzanat is. A két változó kapcsolatának a formulája: regressziós együtthatók véletlen változó

Lineáris regressziós modell feltételei A változók közötti kapcsolat lineáris: Y változó megfelelő X-hez tartozó értéke X lineáris függvénye. Y/X=β0+ β1X+ ε/X A magyarázó változó(k) nem valószínűségi változó(k). Sztochasztikus specifikáció (maradékváltozó tulajdonságai): A maradékváltozók feltételes várható értéke 0: E(ε/X)=0 A maradékváltozók feltételes varianciája legyen állandó (homoszkedaszticitási feltétel): Var(ε/X)=σ2 A maradékváltozó különböző X-értékekhez tartozó értékei legyenek korrelálatlanok: Cov(ε/Xi, ε/Xi’)=0, ha i≠i’ A maradékváltozó feltételes eloszlásai legyenek normálisak.

A regressziós együtthatók becslése A lineáris regresszió ismeretlen 0 és 1 paramétereinek becsléséhez kizárólag az (xi, yi) adatpárokkal (megfigyelési eredményekkel) rendelkezünk. Jelöljük a regressziós együtthatók becsléseit rendre b0 és b1 szimbólumokkal, a becsült regressziófüggvény pedig legyen:

Regressziós együtthatók becslése A i feltételes várható érték becslése valamely rögzített X = xi helyen ennek megfelelően A becsült regressziós együtthatók kiszámításához a legkisebb négyzetek módszerét fogjuk alkalmazni.

A regressziós becslés normálegyenletei A legkisebb négyzetek módszere szerint azzal az egyenessel becsüljük a lineáris regressziófüggvényt, amelyre nézve a négyzetösszeg a legkisebb értékét veszi fel.

A regresszió-függvények fontosabb tulajdonságai A regressziós együtthatók becslése torzítatlan: M(b0) = 0 és M(b1) = 1 A feltételes várható érték torzítatlan becslése M( ŷi) = i A b0 és b1 a regressziós paraméterek legjobb lineáris torzítatlan becslései, abban az értelemben, hogy legkisebb a szórásuk (standard hibájuk). Ez az ún. Gauss-Markov-tétel. Ha a lineáris regressziós modell feltételeihez még azt is csatoljuk, hogy a véletlen változó normális eloszlást követ, akkor levezethetők a 0 és 1 maximum likelihood becslései is, amelyek azonosak a legkisebb négyzetek módszeréből származó becslő formulákkal.

Az eredmények értelmezése A b0 regressziós együttható jelentőségét az adja meg, hogy az X = 0 helyen a függvény éppen ezt az értéket veszi fel. Értelmezése tehát attól függ, hogy a nulla beletartozik-e azon X értékek halmazába, amelyből a regressziót számítottuk, vagy legalábbis logikailag az értelmezési tartomány részének tekinthető-e? A b1 regressziós együttható geometriai értelemben az egyenes meredekségét meghatározó iránytangens, azaz dy/dx. A korrelációs kapcsolat elemzésekor ebből azt olvashatjuk le, hogy a tényezőváltozó egységnyi változása mekkora hatással jár együtt az eredményváltozóban.

Egy vállalat dolgozóinak keresete és havi megtakarítása Átlagbér (Ft/fő) Havi megtakarítás (Ft/hó) 1 120000 13000 2 90000 10000 3 220000 35000 4 150000 18000 5 100000 12000 6 115000 12500 7 160000 20000 8 130000 13800 9 145000 14000 10 11800 Összesen 1330000 160100 x2 14400000000 8100000000 48400000000 22500000000 10000000000 13225000000 25600000000 16900000000 21025000000 190150000000 y2 169000000 100000000 1225000000 324000000 144000000 156250000 400000000 190440000 196000000 139240000 3043930000 dxdy 39130000 258430000 1652130000 33830000 132330000 63180000 107730000 6630000 -24120000 138930000 2408200000 dx2 169000000 1849000000 7569000000 289000000 1089000000 324000000 729000000 9000000 144000000 13260000000 xy 107000 80000 185000 132000 88000 102500 140000 116200 131000 88200 1161900

Havi megtakarítás (Ft/hó) Mintapélda megoldása Dolgozó Bér (Ft/fő) Havi megtakarítás (Ft/hó) x2 y2 dxdy dx2 xy … Összesen 1330000 160100 190150000000 3043930000 2408200000 13260000000 1161900 Regressziós paraméterek értékei: b0=-8144,65 b1=0,1816 Regressziós egyenes: ŷ= =-8144,65+0,1816x Regressziós paraméterek értelmezése: b0=ha dolgozók bére 0 Ft, akkor a havi megtakarítás összege -8144,65 Ft: nem értelmezzük!!! b1=ha a dolgozók bére havonta 1 Ft-tal növekedne, akkor a havi megtakarítás összege 0,1816 Ft-tal növekedne.

Az elaszticitás fogalma A rugalmasság mérőszáma arra ad választ, hogy Y relatív változása (növekménye) hányszorosa az X relatív változásának (pl. egyszázalékos X növekményre hány százalék Y növekmény jut). A lineáris regresszió elaszticitása Az elaszticitás átlagos szinten:

Elaszticitás a mintapélda alapján Értelmezés: ha dolgozók keresete 1%-kal növekszik, akkor a havi megtakarított összeg átlagosan 1,51%-kal növekszik.

Nemlineáris regresszió

Hatványkitevős regresszió A hatványkitevős regressziós összefüggés a társadalmi-gazdasági életben gyakran előfordul. Ezt figyelhetjük meg például a háztartások jövedelme és a fogyasztási kiadásai között. A hatványfüggvény általános képlete: Az „a” paramétert a gyakorlatban nem értelmezzük, a „b” paramétert rugalmassági (elaszticitási) együtthatónak is nevezzük. Jelentése: „x” egy százalékos változása, „y” hány százalékos változását vonja maga után. Ez hasonló a lineáris esetben számított rugalmassági együtthatóhoz, de ez minden „x” esetén ugyanannyi. A hatványfüggvény lefutása a „b” paraméter értékétől függ.

A függvény átalakítása A hatványfüggvény lineárissá alakítható logaritmálás segítségével, így az átalakítás után alkalmazhatóak a lineáris függvénynél alkalmazott ismeretek. A logaritmizálás után a következő összefüggést kapjuk: Az átalakítás után nem „x”-ek és „y”-ok között van lineáris kapcsolat, hanem log „y”-ek és log „x”-ek között, tehát nincs más dolgunk, mint az eredeti változók logaritmusát képezni, és ezek között keresni a lineáris kapcsolatot.

Paraméterek értelmezése – grafikus ábrák által Ha b1, akkor rugalmas (vagy gyorsuló növekedésű) hatványfüggvényről beszélünk. A rugalmas hatványfüggvény alakja

Paraméterek értelmezése – grafikus ábrák által Ha 0b1, akkor rugalmatlan (lassuló növekedésű) a függvény. A rugalmatlan hatványfüggvény alakja

Paraméterek értelmezése – grafikus ábrák által Ha b0, akkor csökkenő a függvény. A csökkenő hatványfüggvény alakja

Mintapélda: Néhány család jövedelem és fogyasztás értékei ln x ln y 3,68 3,65 3,76 3,79 3,83 3,7 3,91 3,97 3,92 4,0 3,8 4,03 3,9 4,12 4,09 3,94 Rendelkezésre álló jövedelem (ezer Ft/fő) x változó Fogyasztásértéke y változó 39,8 38,6 43,1 44,4 46,2 40,4 49,7 45,9 52,8 50,5 54,8 44,8 56,1 49,5 61,6 53,2 59,7 51,4

A hatványfüggvény regresszió-analízisének outputja REGRESSZIÓS STATISZTIKA r értéke 0,885 r-négyzet 0,783 Megfigyelések 9 VARIANCIAANALÍZIS Df SS MS F F szignifikanciája Regresszió 1 0,0758 25,278 0,0015 Maradék 7 0,02099 0,00299 Összesen 8 0,0968   Koefficiensek Standard hiba t érték p-érték Alsó 95% Felső 95% Tengelymetszet ("a" paraméter) 1,255 0,513 2,444 0,0445 0,0407 2,4689 X változó 1 ("b" paraméter) 0,656 0,131 5,028 0,3475 0,9645 Visszatranszformált "a" paraméter: 3,51

A táblázat alapján az eredmények értelmezése A regressziós függvény a következő Csak a „b” paramétert értelmezzük, amely azt mutatja meg, hogy a jövedelem 1%-os emelkedése a fogyasztás 0,656%-os emelkedését vonja maga után. Hatványfüggvény esetén a „b” paramétert rugalmassági (elaszticitási) együtthatónak is hívják

Exponenciális regresszió Ennek a típusnak is van gyakorlati jelentősége, főleg idősorok esetén, amikor azt vizsgáljuk, hogy egyik időszakról a másikra hány százalékkal változott a vizsgált jelenség. Az exponenciális-függvény képlete: Az „a” paramétert a gyakorlatban nem értelmezzük. A „b” paraméter azt mutatja meg, hogy „x” egy egységnyi változása az „y” hány %-os változását vonja maga után. Az exponenciális függvény lefutása a „b” paraméter értékétől függ.

Paraméterek értelmezése – grafikus ábrák által Ha b1, akkor növekvő a függvényről beszélünk. Az emelkedő exponenciális függvény alakja:

Paraméterek értelmezése – grafikus ábrák által Ha 0b1, akkor csökkenő a függvény A csökkenő exponenciális függvény alakja

A függvény átalakítása Az exponenciális függvény is átalakítható lineárissá, logaritmizálás segítségével: Az átalakítás után nem „x”-ek és „y”-ok között van lineáris kapcsolat, hanem log „y”-ek és „x”-ek között, tehát az eredeti „y” változók logaritmusát kell képezni, és log „y”-ok és „x”-ek között keresni a lineáris kapcsolatot.

Mintapélda Az anyagköltség és a termelési érték kapcsolata Változók Megfigyelések 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Anyagköltség (x változó) 34 38 44 48 56 62 70 76 82 90 Termelési érték (y változó) 66 80 104 125 100 126 110 135 130 ln y 4,189 4,5 4,38 4,644 4,828 4,605 4,836 4,7 4,905 4,867

Az exponenciális regresszió outputja REGRESSZIÓS STATISZTIKA   r értéke 0,834 r-négyzet 0,696 Megfigyelések 10 VARIANCIAANALÍZIS df SS MS F F szignifikanciája Regresszió 1 0,341 18,314 0,003 Maradék 8 0,149 0,019 Összesen 9 0,490 Koefficiensek Standard hiba t érték p-érték Alsó 95% Felső 95% Tengelymetszet 4,038 0,148 27,199 0,000 3,696 4,380 X változó 1 0,010 0,002 4,279 0,005 0,016 Visszatranszformált „a”: 56,71 Visszatranszformált „b”: 1,01

A táblázat alapján az eredmények értelmezése A függvény képlete a következő: Az „a” paramétert nem értelmezzük. A „b” paraméter azt mutatja meg, hogy ha egy egységgel nő az „x”, akkor az „y”, b.100 százalékra változik. Konkrétan a mi példánkban, ha az anyagköltség 1000 Ft-tal emelkedik, akkor a termelési érték 1%-kal (101 %-ra) nő.

Köszönöm a figyelmet