Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
Gazdaságstatisztika Hol járunk? 2
Gazdaságstatisztika 3 A kétváltozós lineáris regressziós modell paramétereinek intervallumbecslése
Gazdaságstatisztika 4 A lineáris regressziós modell eredményeinek ellenőrzése: hipotézisvizsgálatok
Gazdaságstatisztika 5 A paraméterek szeparált tesztelése
Gazdaságstatisztika 6 A paraméterek szeparált tesztelése
Gazdaságstatisztika 7 A paraméterek együttes tesztelése
Gazdaságstatisztika 8 A paraméterek együttes tesztelése
Gazdaságstatisztika 9 Példa
10 Példa: grafikus ábrázolás
Gazdaságstatisztika A paraméterek becslései: Az alapterületek átlagos nagysága a minta alapján: Az eladási árak átlagos nagysága a minta alapján: 11 Példa: lineáris regressziós modell paramétereinek becslése
Gazdaságstatisztika 12 Példa: lineáris regressziós modell paramétereinek becslése Lakás sorszáma Eladási árAlapterületdydy dxdx dxdydxdy dx2dx2 124,883-25,0-77,21926,75957, ,8-72,21137,85210,2 340,6117-9,2-43,2395,71864,7 440,8120-9,0-40,2360,21614,6 545,8177-4,016,8-66,7282,9 647,6164-2,23,8-8,314,6 750,21860,425,811,3666,6 852,11922,331,874,31012,4 956,31916,530,8201,4949,8 1074,923325,172,81830,45302,5 1180,321130,550,81551,82582,5 Össz.547, ,825457,6 Átlag 49,8160,2
Gazdaságstatisztika A táblázatban szereplő értékek alapján: A regressziós egyenes egyenlete: A paraméterek közül a meredekségi paraméter jelentése az, hogy négyzetméterenként átlagosan 0,291 mFt-tal ( Ft-tal) nő az eladási ár. A tengelymetszet-paraméter jelentése az, hogy modellünk szerint a 0 négyzetméteres lakások ára 3,18 millió Ft. E paraméter kapcsán fontos kiemelni, hogy nem lehet neki minden esetben tárgyi jelentést tulajdonítani! 13 Példa: lineáris regressziós modell paramétereinek becslése
Gazdaságstatisztika A rugalmassági együttható: Ez minden x esetében más és más értéket ad. Ha rögzítjük az x értékét valamilyen szinten (pl. 60 négyzetméterben), akkor az elaszticitás egy konkrét értékét kapjuk eredményként Elaszticitás x=60 esetén: Ez azt jelenti, hogy ha a 60 négyzetméteres szintről kiindulva 1%- kal növeljük a területet, akkor az eladási ár átlagosan 0,84 6%-kal nő. 14 Példa: rugalmassági együttható
Gazdaságstatisztika Az elemzés következő lépése, hogy kiszámítjuk a regressziós egyenes pontjainak értékét, majd a megfigyelt és a becsült értékek különbözeteként a reziduumokat. 15 Példa: regressziós egyenes pontjainak és a reziduumok meghatározása Lakás sorszáma Eladási árAlapterületdydy dxdx dxdydxdy dx2dx2 dy2dy2 ŷŷ eiei 124,883-25,0-77,21926,75957,0623,227,3 2, ,8-72,21137,85210,2248,528,8 -5,2 340,6117-9,2-43,2395,71864,784,037,2 -3,4 440,8120-9,0-40,2360,21614,680,338,1 -2,7 545,8177-4,016,8-66,7282,915,754,7 8,9 647,6164-2,23,8-8,314,64,750,9 3,3 750,21860,425,811,3666,60,257,3 7,1 852,11922,331,874,31012,45,559,1 7,0 956,31916,530,8201,4949,842,758,8 2,5 1074,923325,172,81830,45302,5631,871,0 -3,9 1180,321130,550,81551,82582,5932,564,6 -15,7 Össz.547, ,825457,62669,1 Átlag 49,8160,2
Gazdaságstatisztika Az empirikus lineáris korrelációs együttható. Az eredmény azt mutatja, hogy a vizsgált két változó között meglehetősen szoros, pozitív irányú kapcsolat tapasztalható. A korrelációs együttható értéke közel áll a +1-hez, ami arra utal, hogy a regressziós egyenes jól illeszkedik a megfigyelési pontokhoz. 16 Példa: empirikus lineáris korrelációs együttható számítása
Gazdaságstatisztika SST=2669,1SSR=2155,6SSE=509,5 (Az értékek eltérései a korábbi egy tizedesre történő kerekítésekből adódnak.) 17 Példa: A teljes eltérésnégyzet-összeg felbontása Lakás sorszáma Eladási árAlapterületdy2dy2 ŷiŷi eiei y ̂ i - y ̅ (y ̂ i - y ̅ ) 2 ei2ei2 124,883623,227,3 2,5-22,4503,16, ,528,8 -5,2-21,0440,027,2 340,611784,037,2 -3,4-12,5157,211,4 440,812080,338,1 -2,7-11,7136,07,3 545,817715,754,7 8,94,924,279,0 647,61644,750,9 3,31,11,310,9 750,21860,257,3 7,17,556,950,5 852,11925,559,1 7,09,386,348,3 956,319142,758,8 2,59,081,06,1 1074, ,871,0 -3,921,2450,315,3 1180, ,564,6 -15,714,8219,6247,1 Össz.547, ,1 0,02155,8509,5 Átlag 49,8160,2
Gazdaságstatisztika A regressziós becslés során elkövetett hiba: Ez önmagában azt jelenti, hogy az egyes lakások ára átlagosan mintegy 7,5mFt-tal tér el attól, amit a regressziós modellel becsülni tudnánk. A paraméterek standard hibái: Ha megbízhatóságot 95%-os szinten rögzítjük, akkor, a keresett konfidencia intervallumok: 18 Példa: a regressziós függvény paramétereinek intervallumbecslése
Gazdaságstatisztika 19 Példa: a regressziós függvény paramétereinek szeparált tesztelése
Gazdaságstatisztika 20 Példa: a regressziós függvény paramétereinek szeparált tesztelése
Gazdaságstatisztika 21 Példa: a regressziós függvény paramétereinek együttes tesztelése A variancia forrása NégyzetösszegSzabadságfok Átlagos négyzetösszeg F RegresszióSSR=2155,81 MaradékSSE=509,5n-2=11-2=9 TeljesSST=2665,3n-1=10
Gazdaságstatisztika Gazdaságstatisztika NÉHÁNY GONDOLAT A NEM LINEÁRIS REGRESSZIÓRÓL
Gazdaságstatisztika 23 Kétváltozós, nem lineáris regresszió
Gazdaságstatisztika 24 Kétváltozós, nem lineáris regresszió
Gazdaságstatisztika Gazdaságstatisztika GYAKORLÓ FELADATOK A KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS TÉMAKÖRÉBŐL
Gazdaságstatisztika 1. Feladat Egy vállalat havi árbevétele (x) és havi üzleti eredménye (y) közötti kapcsolat egy 10 elemű minta alapján az y = -9+0,1x lineáris regressziós függvénnyel írható le. A mintában az árbevétel korrigált empirikus szórása 9,8 millió Ft, az üzleti eredményé 1,1 millió Ft. a.) Értelmezze a regressziós egyenes meredekségét! b.) Határozza meg az árbevétel és az üzleti eredmény közötti determinációs együtthatót, és értelmezze az eredményt! 26
Gazdaságstatisztika 1. Feladat - megoldás a.) A regressziós egyenes: y = -9+0,1x. Ennek meredeksége 0,1. Ez azt jeleneti, hogy az árbevétel egységnyi növekedése az üzleti eredmény átlagosan 0,1 egységnyi növekedését vonja maga után. b.) Az árbevétel (x) és az üzleti eredmény (y) közötti determinációs együttható meghatározása Egyrészt a determinációs együttható: Másrészt a regressziós egyenes meredeksége: Ez utóbbi két összefüggésből a determinációs együttható: 27
Gazdaságstatisztika 1. Feladat - megoldás A megadott empirikus szórások felhasználásával és meghatározható: A determinációs együttható: A determinációs együttható megadja, hogy az eredményváltozó (y) teljes változékonyságát mekkora hányadban magyarázza a magyarázó változó (x) a regresszión keresztül. Esetünkben ez azt jelenti, hogy az üzleti eredmény változékonyságát 79,37%-ban magyarázza az árbevétel. 28
Gazdaságstatisztika 2. Feladat Teherhajók tömege (x) és kirakodási idejük (y) között a tapasztalati lineáris korrelációs együttható értéke egy 10 elemű minta alapján 0,87. A mintában a hajótömegek korrigált tapasztalati szórása 7,2 tonna, a kirakodási időé 2,1 óra. a.) Hány %-ban magyarázza a kirakodási idő varianciáját a teherhajók tömege? b.) Adja meg a kirakodási idő és a hajótömeg közötti regressziós egyenes meredekségét! 29
Gazdaságstatisztika 2. Feladat - megoldás a.) A determinációs együttható megadja, hogy az eredményváltozó (y) teljes változékonyságát mekkora hányadban magyarázza a magyarázó változó (x) a regresszión keresztül. Esetünkben a korrelációs együttható értéke 0,87. Ennek négyzete 0,7569 a determinációs együttható értéke, azaz a kirakodási idő varianciájának 75,69%-át magyarázza a teherhajók tömege. b.) A regressziós egyenes meredekségének meghatározása: Egyrészt a regressziós egyenes meredeksége: Másrészt a korrelációs együttható: Ez utóbbi két összefüggésből a regressziós egyenes meredeksége: 30
Gazdaságstatisztika 2. Feladat - megoldás A megadott empirikus szórások felhasználásával és meghatározható: A regressziós egyenes meredekségéről tudjuk, hogy A teherhajók tömegének 1 egységnyi növekedése a kirakodási idő átlagosan 0,254 egységnyi növekedését eredményezi. 31