Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Kvantitatív módszerek 4. Korreláció- és regressziószámítás I. Dr. Kövesi János.

Hasonló előadás


Az előadások a következő témára: "Kvantitatív módszerek 4. Korreláció- és regressziószámítás I. Dr. Kövesi János."— Előadás másolata:

1 Kvantitatív módszerek 4. Korreláció- és regressziószámítás I. Dr. Kövesi János

2 Determinisztikus és sztochasztikus kapcsolatok n A korreláció- és regresszió- számítás során arra keressük a választ, hogy egy adott állapot milyen tényezők hatására jött létre, az egyes tényezők milyen mértékben befolyásolják a jelenség alakulását, a tényezők milyen szoros kapcsolatban vannak egymással. n A korrelációs és regressziós számítás a kapcsolatot jellemzi, de semmit nem mond az oksági viszonyról. Tehát két, vagy több változó közötti sztochasztikus kapcsolat megállapításából nem következik, hogy a változók oksági összefüggésben vannak, azaz, hogy egyik tényező változása oka a másik tényező változásának. Az oksági kapcsolatot csak alapos szakmai és statisztikai vizsgálattal lehet megállapítani. 56 

3 A kapcsolat szemléltetése Pozitív korreláció R-Sq = 62.5 % Y = -8.6E X Negatív korreláció Y = 5.07E X R-Sq = 70.9 % Nincs korreláció Y = -7.4E X R-Sq = 3.4 % Nem lineáris korreláció Y = X X**2 R-Sq = 88.4 % Pozitív korreláció R-Sq = 62.5 % Y = -8.6E X Negatív korreláció Y = 5.07E X R-Sq = 70.9 % Nincs korreláció Y = -7.4E X R-Sq = 3.4 % Nem lineáris korreláció Y = X X**2 R-Sq = 88.4 % 57 

4 Az előjel–korrelációs együttható Feladat: 14 év adatai alapján vizsgáljuk meg az 1 ha szántóterületre vonatkoztatott műtrágya felhasználás (x i =kg/ha) és az évi búza termés átlagok (y i =q/ha) közötti kapcsolatok jellegét és szorosságát. 71,    e r 

5 A regresszió számítás feladata a változók közötti összefüggés jellegének meghatározása. Ennek során a pontdiagramos ábrázolással érzékeltetett tendenciát valamilyen analitikusan ismert függvénnyel próbáljuk leírni. A regressziós függvényt a legkisebb négyzetek elve és módszere alapján határozzuk meg. Ez azt a követelményt támasztja, hogy az adott függvénytípust (egyenes, parabola, exponenciális, stb.) használata során a összeg minimális legyen. Az eltérések (rezidiumok) négyzeteinek összege jól jellemzi a ponthalmaz és a regressziós vonal kölcsönös viszonyát. A (lineáris) regresszió és korreláció 60 

6 A (lineáris) regresszió és korreláció A korrelációs együttható értéke nulla, ha X és Y függetlenek. Ez fordítva általában nem igaz: abból, hogy két valószínűségi változó korrelációs együtthatója nulla, nem feltétlenül következik, hogy a két változó független is egymástól (kivétel, ha X és Y együttes eloszlása normális). Ha a két változónál csak azt tudjuk, hogy r(x,y)=0, akkor korrelálatlannak nevezzük őket. 63 

7 A (lineáris) korrelációs együttható Az elméleti korrelációs együtthatót a mintabeli, tapasztalati korrelációs együtthatóból becsülhetjük: és ahol: 63 

8 Feladat: Számítsuk ki a mintapéldában szereplő változó korrelációs együtthatóját! Emlékeztetőül: az előjel – korrelációs együttható értéke 0,71 volt. 64 

9 Auto- és keresztkorreláció idősorok elemzése ,0 -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 Autocorrelation ,09 0,05 -0,06 -0,01 -0,05 -0,02 0,01 0,10 0,02 0,08 3,09 1,68 -2,11 -0,22 -1,65 -0,53 0,45 3,39 0,54 2,85 9,58 12,45 17,02 17,07 19,90 20,19 20,40 32,36 32,67 41,30 LagCorrTLBQLagCorrTLBQ BUX napi adatok autokorrelációja '94 -'99 65 

10 Kvantitatív módszerek 11. Korreláció- és regressziószámítás II. Dr. Kövesi János

11 A (lineáris) korrelációs együttható A korrelációs együttható értéke nulla, ha X és Y függetlenek. Ez fordítva általában nem igaz: abból, hogy két valószínűségi változó korrelációs együtthatója nulla, nem feltétlenül következik, hogy a két változó független is egymástól (kivétel, ha X és Y együttes eloszlása normális). Ha a két változónál csak azt tudjuk, hogy R(X,Y)=0, akkor korrelálatlannak nevezzük őket. 142 

12 A (lineáris) korrelációs együttható Az elméleti korrelációs együtthatót a mintabeli, tapasztalati korrelációs együtthatóból becsülhetjük: és ahol: 143 

13 A (lineáris) korrelációs együttható szignifikancia vizsgálata A két változó egymástól független normális eloszlású H o : R (X, Y) = 0 Ha H 0 igaz, akkor r(x,y) alábbi függvénye DF=n-2 szabadság fokkal t - eloszlást követ: Ha adott  mellett t sz >t krit, akkor H 0 -t elvetjük és  =1-  megbízhatósággal állíthatjuk, hogy a két változó között sztochasztikus kapcsolat áll fenn. 143 

14 A (lineáris) korrelációs együttható Feladat: Számítsuk ki a mintapéldában szereplő változó korrelációs együtthatóját és végezzük el a szignifikancia vizsgálatot! H o : R (X, Y) = 0 DF= n-2 =14-2 = 12  =0,05 t krit = 2,17 Mivel t sz  t krit, ezért a nullhipotézist elvetjük és nagy biztonsággal állíthatjuk, hogy a két változó között korrelációs (sztochasztikus) kapcsolat van. (Emlékeztetőül: az előjel – korrelációs együttható értéke 0,71 volt). 143 

15 Az r(x,y) és a regressziós egyenes összefüggése Az r 2 (x, y) – amelyet determinációs együtthatónak is neveznek – azt fejezi ki, hogy a sztochasztikus kapcsolatban a teljes változás hányad része tulajdonítható x-nek. Értékét %-os formában is megadhatjuk. 144 

16 Feladat A mintapélda adatai alapján határozzuk meg a determinációs index értékét! Az eredményt úgy értelmezhetjük, hogy a termésátlagok változásában a műtrágya felhasználás 72%-ban játszott szerepet. 144 

17 A regressziós becslés pontossága Nyilvánvaló, hogy a sztochasztikus kapcsolat mérőszámaiból csak akkor vonhatunk le helyes következtetéseket, ha megfelelően nagy mintánk van. Így, az eredmények értékeléséhez hozzátartozik a mérőszámok hibájának vizsgálata is. A pontosság jellemzése céljából tehát most az a, b, paraméterek becslésének szórását (standard hibáját) kell meghatároznunk: 1. A regressziós együtthatók standard hibái (pontbecslés). 2. Konfidencia intervalluma becsült paraméterekre. 3. A lineáris kapcsolat szignifikancia vizsgálata. 4. Az átlagos, vagy az egyedi y i értékek becslése. 145 

18 1. A regressziós együtthatók standard hibái (pontbecslés). A standard hibák azt mutatják meg, hogy végtelen sok n elemű mintát véve az alapsokaságból az egyes mintákból becsült b 0 és b 1 paraméterek átlagosan s b0 és s b1 egységgel szóródnak az alapsokasági regressziófüggvény körül. 145 

19 2. Konfidencia intervallum a becsült paraméterekre A becsült paraméterekre konfidencia intervallumokat is konstruálhatunk. Nagy minták esetén normális eloszlás táblázatot-, kis minták esetén a Student-eloszlás t- táblázatát használjuk (DF= n-2): 145 

20 3. A lineáris kapcsolat szignifikancia vizsgálata t- próba segítségével azt is ellenőrizhetjük, hogy az Y és X változók között szignifikáns lineáris kapcsolat van-e. Nullhipotézisünk és ellenhipotézisünk: A próbastatisztika: A t krit értéket  szignifikancia szinten DF=n – 2 szabadsági foknál találjuk meg. Ha t sz  t krit, elvetjük H o -t és valós lineáris összefüggést tételezünk fel X és Y között. 146 

21 4. Az átlagos, vagy az egyedi y i értékek becslése 147 

22 Feladat Korábban már többször foglalkoztunk a BUX havi hozamainak statisztikai elemzésével (leíró statisztika, hipotézisvizsgálatok). Az alábbi táblázat alapján vizsgáljuk meg, hogy az VII VI. közötti időszakban a havi hozam (%) alapján kimutatható-e sztochasztikus kapcsolat a BUX és a Zwack hozamai között? Adjunk – előzetes – szakmai magyarázatot az eredményekre! 148 

23 Feladat A diagram és/vagy a táblázat alapján határozzuk meg az előjel – korrelációs együtthatót! Következtetés: t sz > t krit Határozzuk meg a tapasztalati korrelációs együtthatót és  = 5 % mellett végezzük el a szignifikancia vizsgálatot! H o : R(x,y) = 0 DF = 12-2 = 10  = 5% t krit = 2,23 H 0 nem igaz ! 149 

24 Feladat Becsüljük meg a lineáris regressziófüggvény együtthatóit! Határozzuk meg a determinációs együtthatót és értelmezzük az eredményt! Következtetés: A Zwack hozamának változásában a BUX hozama 46,2 %-ban játszott szerepet. 149 

25 Feladat s e = 7,47s b0 = 2,157s b1 = 0,143 Készítsünk 95 %-os konfidencia intervallumot a becsült paraméterekre!  = 5% 23,2 2 1    t Int (1-α) (β o ) = 1,47  4,841 Int (1-α) (β 1 ) = 0,463  0,32 Ellenőrizzük  = 5 % mellett, hogy a lineáris kapcsolat szginifikáns-e? DF = 10t sz = 3,24t krit = 2,23 Következtetés: Mivel t sz >t krit a H 0 (β 1 =0) nem igaz, tehát x és y között szignifikáns lineáris kapcsolat van. Határozzuk meg a regressziós becslés pontosságát! 150 


Letölteni ppt "Kvantitatív módszerek 4. Korreláció- és regressziószámítás I. Dr. Kövesi János."

Hasonló előadás


Google Hirdetések