Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regresszióelemzés 20. előadás.

Hasonló előadás


Az előadások a következő témára: "Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regresszióelemzés 20. előadás."— Előadás másolata:

1 Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regresszióelemzés 20. előadás

2 Gazdaságstatisztika Hol járunk? 2

3 Gazdaságstatisztika Nyitó gondolatok 3 Eddig tömegjelenségek leírását mindig egy már bekövetkezett állapot valószínűségelméleti, matematikai statisztikai vizsgálatával végeztük el. A korreláció- és regresszió- számítás során arra keressük a választ, hogy egy adott állapot milyen tényezők hatására jött létre, az egyes tényezők milyen mértékben befolyásolják a jelenség alakulását, a tényezők milyen szoros kapcsolatban vannak egymással. Összefüggés-vizsgálat, azon belül sztochasztikus kapcsolatok vizsgálata a célunk.

4 Gazdaságstatisztika 4 Kezdeti, kiindulási feltételekből (peremfeltételekből) mennyire tudunk következtetni a vizsgált jelenség (esemény) végkimenetelére? Két lehetőség Ha a peremfeltételeket fel tudjuk tárni, és ismertek a jelenség lefolyásának szabályai is, és ezekből a jelenség végkimenetele nagy pontossággal megadható, akkor a jelenség determinisztikus. Más szavakkal, a peremfeltételek és a jelenség lefolyásának szabályai determinálják (egyértelműen meghatározzák) a jelenség kimenetelét. Pl. Ohm-törvénye. A peremfeltételeket nem ismerjük, vagy nem akarjuk feltárni, továbbá nem ismerjük a jelenség lefolyásának pontos törvényszerűségeit, ezért a jelenség pontos kimenetele nem határozható meg. Ezek a sztocasztikus jelenségek. Pl. BUX index alakulása. Determinisztikus és sztochasztikus jelenségek

5 Gazdaságstatisztika Determinisztikus és sztochasztikus kapcsolatok 5 A legegyszerűbb esetben két változó kapcsolatát vizsgáljuk X: magyarázó változó, Y: eredményváltozó Determinisztikus kapcsolat X determinálja Y-t, azaz X adott értékéhez Y meghatározott értéke tartozik Sztochasztikus kapcsolat X adott értékéhez Y-nak több lehetséges éréke is tartozhat A kapcsolat a P(Y|X) feltételes valószínűség eloszlásával ragadható meg A gyakorlatban az E(Y|X) feltételes várható értékkel és a V(Y|X) feltételes varianciával jellemezzük a kapcsolatot X értéke és Y átlagos értéke között van határozott kapcsolat. X és Y nem függetlenek, de nincs közöttük determinisztikus összefüggés. Y értékét X értéke és egyéb véletlen hatások is befolyásolják.

6 Gazdaságstatisztika 6 Empirikus regressziós függvények A sztochasztikus kapcsolat szemléltetése

7 Gazdaságstatisztika 7 Korrelációszámítás Az X magyarázó változó és az Y eredményváltozó közötti sztochasztikus kapcsolat erősségét korrelációszámítással határozzuk meg. (A kapcsolat intenzitásának és irányának mérése.) Regressziószámítás Az X magyarázó változó és az Y eredményváltozó közötti sztochasztikus kapcsolat (összefüggés) jellegét regressziószámítással határozzuk meg. (A kapcsolat jellegének feltárása, matematikai függvényekkel történő leírása.) Korreláció- és regressziószámítás

8 Gazdaságstatisztika Sztochasztikus kapcsolat Nem lineáris kapcsolat Nincs kapcsolat Erős pozitív lineáris kapcsolat 8

9 Gazdaságstatisztika 9 Az ábra alapján pozitív lineáris sztochasztikus kapcsolat feltételezhető a két vizsgált változó között Melyik az az egyenes, amely a “legjobban” illeszkedik a ponthalmazra Mit jelent a “legjobban”? A lineáris regressziószámítás alapjai

10 Gazdaságstatisztika 10 Az X magyarázó változó és az Y eredményváltozó közötti sztochasztikus kapcsolatot keressük: Y=f(X), f=? X és Y megfigyeléseiből adottak az (x i ; y i ) párok (i=1,..,n) A regressziós függvényt a legkisebb négyzetek módszere alapján határozzuk meg. Ez azt a követelményt jelenti, hogy az adott regressziós függvénytípus használata során a négyzetösszeg minimális, ahol a regressziós függvény helyettesítési értéke az helyen. Az különbségeket reziduumoknak nevezzük. A legkisebb négyzetek elve

11 Gazdaságstatisztika Elméleti lineáris regressziós modell magyarázó változó eredményváltozó maradékváltozó Becslés mintából: 11

12 Gazdaságstatisztika Lineáris kapcsolat Magyarázó változó (X) nem valószínűségi változó Maradékváltozóra vonatkozó feltételek:  M(  X) = 0  Var(  X) =  2 (homoszkedaszticitás)  A maradékváltozó független a magyarázóváltozótól.   X  N(0,  2 ) 12 Elméleti lineáris regressziós modell feltételei (1)

13 Gazdaságstatisztika x y xixi yiyi 13 Elméleti lineáris regressziós modell feltételei (2)

14 Gazdaságstatisztika 14 Az (x i ; y i ) párokból álló mintából a becsült empirikus regressziós egyenes pontjainak és a minta pontjainak négyzetes távolságösszege minimális. Lehetséges “távolságok” : Merőleges: ezt nehéz kezelni Függőleges Ha a függőleges négyzetes távolságösszeget, azaz -t minimalizáljuk, akkor az első regressziós egyenest kapjuk. Vízszintes Ha a vízszintes négyzetes távolságösszeget minimalizáljuk, akkor a második regressziós egyenest kapjuk Empirikus lineáris regresszió

15 Gazdaságstatisztika 15 A két egyenes csak akkor esik egybe, ha a minta minden pontja egy egyenesre esik. Ilyenkor abszolút lineáris kapcsolatról beszélünk. A lineáris regresszió alkalmazása során általában az első regressziós egyenest használjuk. Első- és második regressziós egyenes Első regressziós egyenes Második regressziós egyenes

16 Gazdaságstatisztika xixi x y yiyi  e i 2 minimum 16 Az epmirikus lineáris regressziós egyenes paramétereinek becslése (1)

17 Gazdaságstatisztika 17 Az epmirikus lineáris regressziós egyenes paramétereinek becslése (2) X és Y megfigyeléseiből adottak az (x i ; y i ) párok (i=1,..,n) Az első regressziós egyenes paramétereit szeretnénk becsülni, ehhez a legkisebb négyzetek módszere értelmében az függvényt (b 0 -tól és b 1 -től függő négyzetösszeg) kell minimalizálnunk. Belátható, hogy ez akkor minimális, ha E két egyenletet normálegyenleteknek nevezzük, megoldásuk adja az empirikus regressziós egyenes és paramétereit.

18 Gazdaságstatisztika 18 Az empirikus lineáris regressziós egyenes paramétereinek becslése (2) ahol, az x i, az y i értékek átlaga.

19 Gazdaságstatisztika 19 Az elméleti korrelációs együttható és becslése (1) Az X és Y valószínűségi változók kovarianciája: cov(X,Y) = M(XY)-M(X)M(Y) Ha X és Y függetlenek, cov(X,Y) = 0, de fordítva nem mindig igaz! Ha X és Y együttes eloszlása (kétváltozós) normális eloszlás, akkor cov(X, Y) = 0, pontosan akkor, ha X és Y függetlenek. Az X és Y valószínűségi változók elméleti korrelációs együtthatója (Pearson féle korrelációs együttható):

20 Gazdaságstatisztika 20 Az elméleti korrelációs együttható és becslése (2) X és Y közötti lineáris kapcsolat erősségét méri. Minél közelebb van az abszolút értéke 1-hez, annál szorosabb a lineáris kapcsolat. Ha R(X,Y) = 0, akkor X és Y korrelálatlanok. A korrelálatlanságból nem következik a függetlenség. Ha X és Y független, akkor R(X,Y) = 0. Ha X és Y együttes eloszlása (kétváltozós) normális eloszlás, akkor R(X, Y) = 0, pontosan akkor, ha X és Y függetlenek. R(X, Y) becslése mintából az empirikus korrelációs együttható:

21 Gazdaságstatisztika 21 A korrelációs együttható szignifikancia vizsgálata Hipotézisvizsgálat Ha H 0 igaz, akkor az próbastatisztika DF=n-2 szabadságfokú t-eloszlást követ, ahol r=r(x,y). H 0 elutasítása esetén a korrelációs együttható szignifikáns. Ez azt jelenti, hogy R(X, Y) értéke nagy valószínűséggel nem zérus. H 0 : R(X,Y) = 0 H 1 : R(X,Y)  0

22 Gazdaságstatisztika év adatai alapján vizsgáljuk meg az 1ha szántóterületre vonatkoztatott műtrágya felhasználás (x i =kg/ha) és az évi búza termés átlagok (y i =q/ha) közötti kapcsolatok jellegét és szorosságát. Példa i xixi yiyi 1.19,912,5 2.31,917,0 3.31,616,9 4.41,419,1 5.53,517,9 6.58,715,6 7.67,218,6 8.70,421,7 9.76,321, ,325, ,425, ,227, ,621, ,030,7

23 Gazdaságstatisztika 23 Korrelációs együttható és lineáris regressziós egyenes becslése – példa A példa adatai: i xixi yiyi 1.19,912,5-64,1-8,34108,868,9532,0 2.31,917,0-52,0-3,82704,014,4197,6 3.31,616,9-52,3-3,92735,315,2204,0 4.41,419,1-42,5-1,71806,22,972,2 5.53,517,9-30,4-2,9924,28,488,2 6.58,715,6-25,2-5,2635,027,0131,0 7.67,218,6-16,7-2,2278,94,836,7 8.70,421,7-13,50,9182,20,8-12,1 9.76,321,7-7,60,957,80,8-6, ,325,917,45,1302,826,088, ,425,240,54,41640,219,4178, ,227,152,36,32735,339,7329, ,621,382,70,56839,30,241, ,030,7111,19,912343,298,01099,9  1174,3291,237293,2326,52980,4 r(x,y) szignifikancia vizsgálata H o : R(X, Y)=0 DF=n-2=14-2=12  =0,05 t krit =2,17 t sz >t krit => H 0 -át elvetjük A lineáris regressziós egyenes paramétereinek becslése A regressziós egyenes egyenlete:

24 Gazdaságstatisztika 24 Az empirikus korrelációs együttható és a regressziós egyenes összefüggése Y-t a regressziós függvény és az e reziduum összegeként írtuk fel: Az összefüggés a szórásnégyzetekre is igaz: Tapasztalati (minta) adatokból: A teljes változékonyságnak az a része melyet a lineáris kapcsolaton keresztül x magyaráz A teljes változékonyságnak az a része melyet x nem magyaráz Determinációs együttható: azt fejezi ki, hogy a sztochasztikus kapcsolatban az eredményváltozó teljes varianciájának hányad része tulajdonítható a magyarázó változónak (x-nek)

25 Gazdaságstatisztika 25 Determinációs együttható kiszámítása – példa A mintapéldában az empirikus korrelációs együttható értéke: Ennek négyzete a determinációs együttható: Az eredményt úgy értelmezhetjük, hogy a termésátlagok változásában a műtrágya felhasználás 72 %-ban játszott szerepet.


Letölteni ppt "Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regresszióelemzés 20. előadás."

Hasonló előadás


Google Hirdetések