Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.

Slides:



Advertisements
Hasonló előadás
Hipotézisvizsgálat az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi az adatok ismeretében megfogalmazódnak bizonyos hipotézisek erre.
Advertisements

Kvantitatív Módszerek
Kvantitatív módszerek
Gazdasági informatika
Többváltozós standard lineáris regresszió.
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Földrajzi összefüggések elemzése
Csoportosítás megadása: Δx – csoport szélesség
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Potenciális feladattípusok
Becsléselméleti ismétlés
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Gazdaságelemzési és Statisztikai Tanszék
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VIII.. Dr. Szalka Éva, Ph.D.2 Többváltozós korreláció és regresszióanalízis.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Lineáris korreláció és lineáris regresszió. A probléma felvetése y = 1,138x + 80,778r = 0,8962.
PTE PMMK Matematika Tanszék dr. Klincsik Mihály Valószínűségszámítás és statisztika előadások Gépész-Villamosmérnök szak BSc MANB030, MALB030 Bevezető.
Regresszióanalízis 10. gyakorlat.
SPSS többváltozós (lineáris) regresszió (4. fejezet)
SPSS többváltozós regresszió
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Kvantitatív módszerek
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Egytényezős variancia-analízis
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
STATISZTIKA II. 7. Előadás
STATISZTIKA II. 9. Előadás
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Gazdaságstatisztika Korreláció- és regresszióelemzés 20. előadás.
Gazdaságstatisztika 22. előadás
RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Következtető statisztika 9.
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapsokaság (populáció)
Lineáris regresszió.
Két kvantitatív változó kapcsolatának vizsgálata
Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek.
TÁRSADALOMSTATISZTIKA Sztochasztikus kapcsolatok II.
Petrovics Petra Doktorandusz
Bevezetés a Korreláció & Regressziószámításba
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Korrelációs kapcsolatok elemzése
Bevezetés a méréskiértékelésbe (BMETE80ME19)
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Pedagógiai hozzáadott érték „Őrült beszéd, de van benne rendszer” Nahalka István
Kvantitatív módszerek
Korreláció, regresszió
Lineáris regressziós modellek
Részekre bontott sokaság vizsgálata, gyakorló feladatok
II. előadás.
Gazdaságstatisztika Korreláció- és regressziószámítás II.
Gazdaságstatisztika Konzultáció a korreláció- és regressziószámítás, idősorok elemzése témakörökből.
I. Előadás bgk. uni-obuda
III. zárthelyi dolgozat konzultáció
III. előadás.
Dr. Varga Beatrix egyetemi docens
Trendelemzés előadó: Ketskeméty László
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Dr. Varga Beatrix egyetemi docens
Előadás másolata:

Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.

Gazdaságstatisztika Hol járunk? 2

Gazdaságstatisztika 3 A kétváltozós lineáris regressziós modell paramétereinek intervallumbecslése

Gazdaságstatisztika 4 A lineáris regressziós modell eredményeinek ellenőrzése: hipotézisvizsgálatok

Gazdaságstatisztika 5 A paraméterek szeparált tesztelése

Gazdaságstatisztika 6 A paraméterek szeparált tesztelése

Gazdaságstatisztika 7 A paraméterek együttes tesztelése

Gazdaságstatisztika 8 A paraméterek együttes tesztelése

Gazdaságstatisztika 9 Példa

10 Példa: grafikus ábrázolás

Gazdaságstatisztika A paraméterek becslései: Az alapterületek átlagos nagysága a minta alapján: Az eladási árak átlagos nagysága a minta alapján: 11 Példa: lineáris regressziós modell paramétereinek becslése

Gazdaságstatisztika 12 Példa: lineáris regressziós modell paramétereinek becslése Lakás sorszáma Eladási árAlapterületdydy dxdx dxdydxdy dx2dx2 124,883-25,0-77,21926,75957, ,8-72,21137,85210,2 340,6117-9,2-43,2395,71864,7 440,8120-9,0-40,2360,21614,6 545,8177-4,016,8-66,7282,9 647,6164-2,23,8-8,314,6 750,21860,425,811,3666,6 852,11922,331,874,31012,4 956,31916,530,8201,4949,8 1074,923325,172,81830,45302,5 1180,321130,550,81551,82582,5 Össz.547, ,825457,6 Átlag 49,8160,2

Gazdaságstatisztika A táblázatban szereplő értékek alapján: A regressziós egyenes egyenlete: A paraméterek közül a meredekségi paraméter jelentése az, hogy négyzetméterenként átlagosan 0,291 mFt-tal ( Ft-tal) nő az eladási ár. A tengelymetszet-paraméter jelentése az, hogy modellünk szerint a 0 négyzetméteres lakások ára 3,18 millió Ft. E paraméter kapcsán fontos kiemelni, hogy nem lehet neki minden esetben tárgyi jelentést tulajdonítani! 13 Példa: lineáris regressziós modell paramétereinek becslése

Gazdaságstatisztika A rugalmassági együttható:  Ez minden x esetében más és más értéket ad. Ha rögzítjük az x értékét valamilyen szinten (pl. 60 négyzetméterben), akkor az elaszticitás egy konkrét értékét kapjuk eredményként Elaszticitás x=60 esetén:  Ez azt jelenti, hogy ha a 60 négyzetméteres szintről kiindulva 1%- kal növeljük a területet, akkor az eladási ár átlagosan 0,84 6%-kal nő. 14 Példa: rugalmassági együttható

Gazdaságstatisztika Az elemzés következő lépése, hogy kiszámítjuk a regressziós egyenes pontjainak értékét, majd a megfigyelt és a becsült értékek különbözeteként a reziduumokat. 15 Példa: regressziós egyenes pontjainak és a reziduumok meghatározása Lakás sorszáma Eladási árAlapterületdydy dxdx dxdydxdy dx2dx2 dy2dy2 ŷŷ eiei 124,883-25,0-77,21926,75957,0623,227,3 2, ,8-72,21137,85210,2248,528,8 -5,2 340,6117-9,2-43,2395,71864,784,037,2 -3,4 440,8120-9,0-40,2360,21614,680,338,1 -2,7 545,8177-4,016,8-66,7282,915,754,7 8,9 647,6164-2,23,8-8,314,64,750,9 3,3 750,21860,425,811,3666,60,257,3 7,1 852,11922,331,874,31012,45,559,1 7,0 956,31916,530,8201,4949,842,758,8 2,5 1074,923325,172,81830,45302,5631,871,0 -3,9 1180,321130,550,81551,82582,5932,564,6 -15,7 Össz.547, ,825457,62669,1 Átlag 49,8160,2

Gazdaságstatisztika Az empirikus lineáris korrelációs együttható. Az eredmény azt mutatja, hogy a vizsgált két változó között meglehetősen szoros, pozitív irányú kapcsolat tapasztalható. A korrelációs együttható értéke közel áll a +1-hez, ami arra utal, hogy a regressziós egyenes jól illeszkedik a megfigyelési pontokhoz. 16 Példa: empirikus lineáris korrelációs együttható számítása

Gazdaságstatisztika SST=2669,1SSR=2155,6SSE=509,5 (Az értékek eltérései a korábbi egy tizedesre történő kerekítésekből adódnak.) 17 Példa: A teljes eltérésnégyzet-összeg felbontása Lakás sorszáma Eladási árAlapterületdy2dy2 ŷiŷi eiei y ̂ i - y ̅ (y ̂ i - y ̅ ) 2 ei2ei2 124,883623,227,3 2,5-22,4503,16, ,528,8 -5,2-21,0440,027,2 340,611784,037,2 -3,4-12,5157,211,4 440,812080,338,1 -2,7-11,7136,07,3 545,817715,754,7 8,94,924,279,0 647,61644,750,9 3,31,11,310,9 750,21860,257,3 7,17,556,950,5 852,11925,559,1 7,09,386,348,3 956,319142,758,8 2,59,081,06,1 1074, ,871,0 -3,921,2450,315,3 1180, ,564,6 -15,714,8219,6247,1 Össz.547, ,1 0,02155,8509,5 Átlag 49,8160,2

Gazdaságstatisztika A regressziós becslés során elkövetett hiba:  Ez önmagában azt jelenti, hogy az egyes lakások ára átlagosan mintegy 7,5mFt-tal tér el attól, amit a regressziós modellel becsülni tudnánk. A paraméterek standard hibái: Ha megbízhatóságot 95%-os szinten rögzítjük, akkor, a keresett konfidencia intervallumok: 18 Példa: a regressziós függvény paramétereinek intervallumbecslése

Gazdaságstatisztika 19 Példa: a regressziós függvény paramétereinek szeparált tesztelése

Gazdaságstatisztika 20 Példa: a regressziós függvény paramétereinek szeparált tesztelése

Gazdaságstatisztika 21 Példa: a regressziós függvény paramétereinek együttes tesztelése A variancia forrása NégyzetösszegSzabadságfok Átlagos négyzetösszeg F RegresszióSSR=2155,81 MaradékSSE=509,5n-2=11-2=9 TeljesSST=2665,3n-1=10

Gazdaságstatisztika Gazdaságstatisztika NÉHÁNY GONDOLAT A NEM LINEÁRIS REGRESSZIÓRÓL

Gazdaságstatisztika 23 Kétváltozós, nem lineáris regresszió

Gazdaságstatisztika 24 Kétváltozós, nem lineáris regresszió

Gazdaságstatisztika Gazdaságstatisztika GYAKORLÓ FELADATOK A KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS TÉMAKÖRÉBŐL

Gazdaságstatisztika 1. Feladat Egy vállalat havi árbevétele (x) és havi üzleti eredménye (y) közötti kapcsolat egy 10 elemű minta alapján az y = -9+0,1x lineáris regressziós függvénnyel írható le. A mintában az árbevétel korrigált empirikus szórása 9,8 millió Ft, az üzleti eredményé 1,1 millió Ft.  a.) Értelmezze a regressziós egyenes meredekségét!  b.) Határozza meg az árbevétel és az üzleti eredmény közötti determinációs együtthatót, és értelmezze az eredményt! 26

Gazdaságstatisztika 1. Feladat - megoldás  a.) A regressziós egyenes: y = -9+0,1x. Ennek meredeksége 0,1. Ez azt jeleneti, hogy az árbevétel egységnyi növekedése az üzleti eredmény átlagosan 0,1 egységnyi növekedését vonja maga után.  b.) Az árbevétel (x) és az üzleti eredmény (y) közötti determinációs együttható meghatározása Egyrészt a determinációs együttható: Másrészt a regressziós egyenes meredeksége: Ez utóbbi két összefüggésből a determinációs együttható: 27

Gazdaságstatisztika 1. Feladat - megoldás A megadott empirikus szórások felhasználásával és meghatározható: A determinációs együttható: A determinációs együttható megadja, hogy az eredményváltozó (y) teljes változékonyságát mekkora hányadban magyarázza a magyarázó változó (x) a regresszión keresztül. Esetünkben ez azt jelenti, hogy az üzleti eredmény változékonyságát 79,37%-ban magyarázza az árbevétel. 28

Gazdaságstatisztika 2. Feladat Teherhajók tömege (x) és kirakodási idejük (y) között a tapasztalati lineáris korrelációs együttható értéke egy 10 elemű minta alapján 0,87. A mintában a hajótömegek korrigált tapasztalati szórása 7,2 tonna, a kirakodási időé 2,1 óra.  a.) Hány %-ban magyarázza a kirakodási idő varianciáját a teherhajók tömege?  b.) Adja meg a kirakodási idő és a hajótömeg közötti regressziós egyenes meredekségét! 29

Gazdaságstatisztika 2. Feladat - megoldás  a.) A determinációs együttható megadja, hogy az eredményváltozó (y) teljes változékonyságát mekkora hányadban magyarázza a magyarázó változó (x) a regresszión keresztül. Esetünkben a korrelációs együttható értéke 0,87. Ennek négyzete 0,7569 a determinációs együttható értéke, azaz a kirakodási idő varianciájának 75,69%-át magyarázza a teherhajók tömege.  b.) A regressziós egyenes meredekségének meghatározása: Egyrészt a regressziós egyenes meredeksége: Másrészt a korrelációs együttható: Ez utóbbi két összefüggésből a regressziós egyenes meredeksége: 30

Gazdaságstatisztika 2. Feladat - megoldás A megadott empirikus szórások felhasználásával és meghatározható: A regressziós egyenes meredekségéről tudjuk, hogy A teherhajók tömegének 1 egységnyi növekedése a kirakodási idő átlagosan 0,254 egységnyi növekedését eredményezi. 31