Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

STATISZTIKA II. 7. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.

Hasonló előadás


Az előadások a következő témára: "STATISZTIKA II. 7. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék."— Előadás másolata:

1 STATISZTIKA II. 7. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék

2

3 A regresszió: a változók közötti kapcsolat elemzésének elterjedt eszköze. Alapesetben azt vizsgálja, hogy egy kitüntetett, a vizsgálat tárgyát képező változó, amelyet eredményváltozónak (vagy függő változónak) nevezünk, hogyan függ egy vagy több ún. magyarázó (vagy független) változótól. Regressziószámítás

4 A regresszió számításkor: keressük azt a függvényt, amelyik leírja a magyarázó változó(k) és az eredményváltozó kapcsolatát, értelmezzük a függvény paramétereit és egyéb jellemzőit, elemezzük az egyes befolyásoló tényezők hatását, a kapcsolat szorosságát, az előrejelzés lehetőségeit. Regressziószámítás

5 Sok modellt lehet felépíteni attól függően, hogy mit tudunk vagy mit tételezünk fel a változókról és azok kapcsolatáról. Egy egyszerű modell: Itt csak annyit feltételezünk, hogy: van két változónk (magas mérési szintűek – intervallumskála), közöttük nagyjából lineáris kapcsolat van. Regressziószámítás

6 EredményváltozóMagyarázó változó Kétváltozós leíró (szemléletű) lineáris modell Regressziószámítás Hiba (0 átlagú)

7 A regressziószámítás megalkotója és első alkalmazója Francis Galton angol természettudós volt, aki biológiai vizsgálatai során fogalmazta meg az átlaghoz való visszatérés (regression to mean) elvét, melyet apák és fiaik testmagasságának kapcsolatára alkalmazott. Lényege, hogy magasabb apák fiai tendenciaszerűen („átlagosan”) magasabbaknak bizonyultak, azaz a fiúk „visszatértek” az apáikhoz. Ekkor számolt először függvényt a két megfigyelés-sorozat között, és ezt nevezte el regressziós függvénynek. Regressziószámítás

8 Apák és fiúk testmagassága (cm) SorszámApákFiúk

9

10 A közgazdaságtanban: Árak és a keresett (kínált) mennyiségek kapcsolata Jövedelem és a fogyasztás kapcsolata Valamely sportágra költött ráfordítások és az ág eredményességi mutatóinak kapcsolata A társadalom-kutatásokban: A társadalmi rétegződés folyamatát A házasságok és a válások okait Lakosság időmérlegének egyes kérdéseit Regressziószámítás

11 Ha a magyarázó változók száma (k) több (k>1), akkor többváltozós lineáris modellről beszélünk:

12 Feltételezzük, hogy valamennyi változóra n számú megfigyelésünk van, amelyeket célszerűen vektorokba, illetve mátrixba rendezhetünk:

13 k: a magyarázó változók száma, az y vektor i-edik eleme az eredményváltozó i-edik megfigyelését jelöli, a β vektor j-edik eleme a magyarázó változó együtthatója, az ε vektor i-edik eleme pedig az i-edik megfigyeléshez tartozó maradékváltozó, az X mátrix sorai megfigyeléseket (i=1, 2, …, n), oszlopai magyarázó változókat (j=1, 2, …, k) jelölnek, az első oszlop csupa 1 értéke a konstanshoz, mint „0”-dik változóhoz tartozó „megfigyelés”, a mátrix n sorból és k+1 oszlopból áll.

14

15

16

17

18

19 Regressziószámítás

20 Σ Reziduális négyzetösszeg

21 Klasszikus legkisebb négyzetek módszerrel készült becslés (KLN) – Ordinary Least Squares (OLS) A kapott paraméterek az adott megfigyelésekből számított, becsült regressziós együtthatók. A fontosabbjelentése az, hogy a magyarázó változó egységnyi növekedése átlagosan hány egységnyi növekedéssel / csökkenéssel jár együtt a becsült eredményváltozóban. a konstans együttható, vagy tengelymetszet paraméter (intercept) jelentése az, hogy ha a magyarázó változó 0 értéket vesz fel, a modell szerint mekkora lesz az eredményváltozó értéke.

22

23

24

25 Elaszticitás - rugalmasság. Olyan mutatószám, mely megadja, hogy a magyarázó változó egy százalékos elmozdulása hány százalékos és milyen irányú elmozdulással jár együtt az eredményváltozóban. ár és jövedelem rugalmassági együttható rugalmas ( I1I <) fogyasztás (közszükségleti cikkek) rugalmatlan ( I1I >) fogyasztás (luxuscikkek)

26 extrapolációinterpoláció Megfigyelési tartományx y extrapoláció interpoláció

27 A becsült regressziós függvény segítségével a megfigyelési pontokban meghatározhatjuk a reziduumok értékeit: A megfigyelések és a becsült függvényértékek különbségét adják meg. reziduum maradék változó Mintából számított értékmeghatározott tulajdonságokkal (e i )rendelkező ismeretlen (ε i ) (valószínűségi változó)

28 kis Ie i I értékek= jó illeszkedés nagy Ie i I értékek = gyenge illeszkedés Sum of Squares of the Errors reziduális szórás:

29

30

31 REZIDUÁLIS SZÓRÁS

32

33 Az r korrelációs együttható olyan -1 és +1 között elhelyezkedő mutatószám, amelyik 1-hez közeli abszolút értékei szoros, közel lineáris függvényszerű kapcsolatot, 0 körüli értékei a lineáris kapcsolat hiányát (az ún. korrelálatlanságot) jelentik. Az r a két változó kapcsolatszorosságának mérőszáma. kovariancia

34 regressziós vagy magyarázott négyzetösszeg: maradék vagy hiba négyzetösszeg: teljes négyzetösszeg:

35 Determinációs együttható - az eredményváltozónak a regresszió által magyarázott és teljes eltérésnégyzetösszegei hányadosaként számítható mutatószám. Jelölése R 2 Az R 2 százszorosa megmutatja, hogy a regressziós modellel az y adatokban meglévő variancia (bizonytalanság) hány százaléka szüntethető meg

36 ( SSR SST

37


Letölteni ppt "STATISZTIKA II. 7. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék."

Hasonló előadás


Google Hirdetések