Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Kvantitatív módszerek Készítette: Dr. habil. Kosztyán Zsolt Tibor

Hasonló előadás


Az előadások a következő témára: "Kvantitatív módszerek Készítette: Dr. habil. Kosztyán Zsolt Tibor"— Előadás másolata:

1 Kvantitatív módszerek Készítette: Dr. habil. Kosztyán Zsolt Tibor

2 A Kvantitatív módszerek c. tárgy célja Oktatási cél: A hallgatók megismerjék a legfontosabb mennyiségi módszereket, melyeket mind a termelésirányításban, mind a projektek, mind pedig a logisztika területén hatékonyan tudnak alkalmazni. Ezenkívül a hallgatók ismerkedjenek meg a legfontosabb statisztikai módszerekkel.

3 Matematikai statisztika A statisztikai megfigyelés véletlen tömegjelenségekre irányul. A statisztikai minta véletlen jelenségre vonatkozó véges számú megfigyelés eredménye. Események bekövetkezésének, illetve be nem következésének hosszú megfigyelés során valószínűsége van.

4 Hipotézisvizsgálat A statisztika egyik fő alkalmazási területe a döntések alátámasztása statisztikai hipotézisek vizsgálatával. 1. Null-hipotézis (H 0 ): különbség hiányát állítja 2. Alternatív hipotézis (H l ): különbség meglétét állítja

5 Hipotézisvizsgálat A nullhipotézis ismeretében egy próbastatisztikát számítunk, amelynek ismerjük az eloszlását. Az eloszlást ismerve megmondhatjuk, milyen valószínűséggel kaphatunk egy próbastatisztika értéket, ha a hipotézis igaz. Ha a valószínűség kicsi, a hipotézist elvetjük, azaz valószínűtlen, hogy H 0 igaz lenne.

6 Hipotézisvizsgálat Elsőfajú hiba: H 0 igaz, de elvetjük A hiba elkövetési valószínűségét szignifikancia-szintnek nevezzük (p=0,05) 95%, hogy H 0 igaz Másodfajú hiba: H 0 nem igaz, de elfogadjuk. H0 =H0 =H1 ≠H1 ≠H0 =H0 =H1 ≠H1 ≠ H0 =H0 =H1 >H1 >H0 =H0 =H1 >H1 > H0 =H0 =H1


7 Statisztikai próbák 1. Parametrikus próbák: normál eloszlású minták két mintát kell összevetnünk Átlagok azonosak-e: kétmintás t-próba Szórások azonosak-e: F-próba 2. Nem parametrikus próbák: teszt alkalmazása nem függ a változók eloszlásától; függetlenség- és homogenitás vizsgálat –  2 próba, KS- próba

8 Összefüggés-vizsgálat Több megfigyelt tényező hogyan függ egymástól Ellenőrzött, laboratóriumi körülmények között az összefüggés függvénykapcsolatként írható le. A társadalomtudomány területén előforduló jelenségek annyira bonyolultak, hogy az események bekövetkezése sokszor a véletlentől is függ.

9 Összefüggés-vizsgálat Sztochasztikus kapcsolat: a független változó értéke nem határozza meg egyértelműen a függő változó értékét, (pl. véletlenszerűen ingadozik egy legvalószínűbb érték körül.)

10 Összefüggés-vizsgálat 1. Egyik változó változásával a másik milyen irányba és mennyit változik? REGRESSZIÓ-ANALÍZIS 2. Két változó között milyen irányú és mennyire szoros kapcsolat van? KORRELÁCIÓ-ANALÍZIS

11 Regresszió-analízis Két változó kapcsolatát leíró függvényt kapjuk eredményül. Sokszor feltételezünk ok-okozati kapcsolatot, de a vizsgálat nem bizonyítja azt! Grafikusan pontdiagramra fektetett egyenes, ha lineáris összefüggést feltételezünk.

12 Regresszió-analízis

13 1. példa

14 Regresszió-analízis - SPSS

15 H0H0H0H0 H1H1H1H1 H1H1H1H1 SSR SSE SST

16 “Residual” “Total” “Regression” Determinációs együttható négyzete:

17 R 2 = SSR/SST

18 Regresszió-analízis A regressziós egyenes a vizsgálati tartományon belül érvényes, azon túl, hosszabb távon nem alkalmas predikciós célokra A regressziós egyenes egyenlete: Y=függő/magyarázott változó X=független/magyarázó változó Kapcsolat lehet pozitív ↗↗, vagy negatív ↗↘ Egyenes illesztése legkisebb négyzetek módszerével történik.

19 Regresszió-analízis alkalmazhatóságának feltételei 1. E(u)=0 2. VAR(u)=  2 3. A hibatagok függetlenek egymástól. 4. x és u függetlenek. 5. u ~ N(0,  )

20 Normalitás feltétel

21 Homoszkedaszticitás

22 A standard lineáris modell

23 Többváltozós regresszió-analízis Lineáris-e a regresszió? Mit jelent a korrelációs együttható értéke? Milyen feltételek mellett használható a lineáris regressziós modell? x1x1x1x1 x2x2x2x2 x3x3x3x3 xkxkxkxk y1y1y1y1 y2y2y2y2 ynynynyn Nem feltétlen, de legtöbb esetben jó közelítésként használható. Ha a linearitás nem teljesül, akkor át kell konvertálni olyan modellé, amely kölcsönösen egyértelmű az eredeti modellünkre. Az alkalmazhatóság feltételei megegyeznek a lineáris regressziós modell alkalmazásának feltételeivel. Nem feltétlen, de legtöbb esetben jó közelítésként használható. Ha a linearitás nem teljesül, akkor át kell konvertálni olyan modellé, amely kölcsönösen egyértelmű az eredeti modellünkre. Az alkalmazhatóság feltételei megegyeznek a lineáris regressziós modell alkalmazásának feltételeivel. R=1 esetén: LINEÁRIS függvénykapcsolat a magyarázó és a magyarázott változók között! R=0 esetén: nincs LINEÁRIS függvénykapcsolat a magyarázó és a magyarázott változók között! R=-1 esetén: (negatív) LINEÁRIS függvénykapcsolat van x és y között! R=1 esetén: LINEÁRIS függvénykapcsolat a magyarázó és a magyarázott változók között! R=0 esetén: nincs LINEÁRIS függvénykapcsolat a magyarázó és a magyarázott változók között! R=-1 esetén: (negatív) LINEÁRIS függvénykapcsolat van x és y között! 1.E(u i )=0, i :=1,2,…,n (szisztematikus hibát nem vétettünk) 2.var(u i )=  2, i :=1,2,…,n (nincs heteroszkedaszticitás) 3.u i és u j függetlenek minden i-re és j-re (nincs autokorreláció) 4.x i determinisztikus nem valószínűségi változó 5.u i ~N(0,  2 ), i :=1,2,…,n 6.az x j -k között nincs lineáris összefüggés (nincs multikollinearitás) 1.E(u i )=0, i :=1,2,…,n (szisztematikus hibát nem vétettünk) 2.var(u i )=  2, i :=1,2,…,n (nincs heteroszkedaszticitás) 3.u i és u j függetlenek minden i-re és j-re (nincs autokorreláció) 4.x i determinisztikus nem valószínűségi változó 5.u i ~N(0,  2 ), i :=1,2,…,n 6.az x j -k között nincs lineáris összefüggés (nincs multikollinearitás)

24 Többváltozós regresszió- analízis Magyarázó változók redukálása: Miért?Hogyan? Összes lehetséges megoldás FORWARD eljárás BACKWARD eljárás STEPWISE eljárás Fokozatos „kiléptetés”. Mindig a legkisebb parciális korrelációval rendelkező változót veszi ki. Kevesebb magyarázó változó → Kisebb a hiba varianciája. DE! torzított lesz a becslés! Fokozatos „beléptetés”. Mindig a legnagyobb parciális korrelációval rendelkező változót veszi be. Minden iterációban léphetnek be és léphetnek ki is elemek. Viszont a probléma nem lineáris. Nem biztos, hogy optimális lesz a megoldás.

25 2. példa Mi hat a jövedelemre? Feltételezhetjük pl., hogy Az iskolai végzettség/elvégzett iskolai osztályok A munkavállaló neme A munkavállaló kora ? Modell egyenlet: FOJOV=  0 +  1 ISKOSZT+  2 NEME+  3 KOR+u Dummy-változóDummy-változó

26 Beállítás – SPSS-ben

27 Eredmények (1) Valamennyi magyarázó változó szükséges! Kicsi a magyarázó képesség! A modellünk és a magyarázó változóink is szignifikánsak!

28 Eredmények (2) Nem normális eloszlást követNem homoszkedasztikus

29 Javítási lehetőségek A magyarázóképesség javítására: Új változók keresése (pl. a település típusa, foglalkoztatás

30 Eredmények

31 Korreláció-elemzés Függ-e egymástól két változó? A változók normál eloszlásúak Korrelációs együttható, vagy determinációs tényező (r): Két adatsor (minta) közötti lineáris összefüggés erősségét mérő szám.

32 Korreláció-elemzés Pearson féle korrelációs együttható: r -1<=r<=1 Nincs kapcsolat, ha értéke nulla, vagy ahhoz közeli. Az összefüggés jellemzésére az r számértéke alapján különböző fokozatokat állítottak fel. r=±1 1>|r|≥0,75 0,75>|r|≥0,5 0,5>|r|≥0,25 0,25>|r|≥0 r=0 Függvénykapcsolat Nagyon szoros kapcs. Szoros kapcsolat Laza kapcsolat Nagyon laza kapcs. Nincs kapcsolat

33 Modellek x1x1x1x1 x2x2x2x2 x3x3x3x3 xnxnxnxn y1y1y1y1 y2y2y2y2 ymymymym x 11 x 12 x1nx1nx1nx1n X1X1X1X1 xm1xm1xm1xm1 xm2xm2xm2xm2 x mk XmXmXmXm Y1Y1Y1Y1 YpYpYpYp y 11 y 12 y1ty1ty1ty1t yp1yp1yp1yp1 yp2yp2yp2yp2 y pq ab c d 1.(lineáris) regressziós modell 2.kovariancia- analízis 1.(lineáris) regressziós modell 2.kovariancia- analízis 1.X és Y sokszor nem mérhető közvetlenül. => Főkomponens analízis, faktor analízis. 2.Nem csupán a modellredukció a fontos, hanem a modell helyességének vizsgálata is! 1.X és Y sokszor nem mérhető közvetlenül. => Főkomponens analízis, faktor analízis. 2.Nem csupán a modellredukció a fontos, hanem a modell helyességének vizsgálata is! Az ok-okozati kapcsolatok felderítése a fontos => Útelemzés

34 Ok-okozati vizsgálatok Keresztmetszeti vizsgálatoknál nem lehet megnyugtatóan meghatározni az okot és okozatot! Módszer:Útelemzés Ahhoz, hogy a minden kétséget kizáróan el tudjam dönteni, hogy mi az ok és mi az okozat, longitudinális vizsgálatra van szükség.

35 Útelemzés Többszörös lineáris regresszió alkalmazása. Az utak erősségét is ki lehet számítani. Logikailag nehezen vitatható ok-okozati összefüggés kell. Csak nagyszámú mintaadatbázison alkalmazható. (min 200 elem) ab c d KözvetlenKözvetlen KözvetettKözvetett !

36 További lehetőségek Érzékenység-vizsgálatSzimuláció Ezek azonban nem igazán használható módszerek, ugyanis a szimuláció nem biztos, hogy visszaadja a tényleges ok- okozati kapcsolatot.  Megoldás: longitudinális vizsgálatok.  Legalább két ((időben is) független) mérés összehasonlítása.

37 Sztochasztikus folyamatok A sztochasztikus folyamatoknál beszélhetünk folytonos és diszkrét idejű esetről. Egy sztochasztikus folyamat A T halmazt időnek nevezik. A sztochasztikus folyamatot folytonos idejű folyamatnak nevezzük, ha, és diszkrét idejű folyamatnak, ha

38 Az idősorelemzés modelljei Determinisztikus modell (előre meghatározott pályát követnek az idősorok) Leíró Hosszú távú hatások Véletlennel keveset foglalkozik Sztochasztikus idősorelemzés Rövid távú hatásokkal foglalkozik Véletlennek fontos szerepe van

39 Idősor komponensei Trend vagy alapirányzat: az idősor alakulásának fő irányát mutatja meg. Szezonális vagy idényszerű ingadozás: szabályos időszakonként visszatérő, állandó periódushosszúságú hullámzás, amely mindig azonos irányban téríti el az idősor értékét az alapirányzattól. (pl. fagyifogyasztás) Ciklus: trend alatti vagy feletti tartósabb mozgás. Szabálytalan periodikus ingadozás, általában hosszabb idősoroknál figyelhető meg. (pl. gazdasági ciklusok) Véletlen ingadozás

40 Az egyes komponensek közötti kapcsolat Multiplikatív kapcsolat: periódusok (pl. évek) periódusok (pl. évek) perióduson belüli rövidebb időszakok(pl. negyedévek) Additív kapcsolat

41 Stacionaritás Az y jelenség időbeni lefutása: stabil, előre jelezhető, nincs trendhatás Időfüggetlen: várható érték, variancia,autokovariancia

42 Idősor analízis – ARIMA- modellek ARIMA(p,0,0)=AR(p) p-ed rendű autoregresszív folyamatok ARIMA(0,0,q)=MA(q) q-ad rendű mozgóátlag folyamatok

43 Idősor analízis – ARIMA- modellek ARIMA(p,0,q)=ARMA(p,q)=AR(p)+ MA(q) p-ed rendű autoregresszív folyamatok + q-ad rendű mozgóátlag folyamatok Integrált autoregresszív és mozgóátlag folyamatok, ARIMA(p,d,q) modellek: Derivált idősor: Második derivált sor: j-edik derivált sor:

44 A modellkészítés menete (1) Az ARIMA modellezés kiindulópontja annak megállapítása, hogy a vizsgálni kívánt idősorunk stacionárius-e, illetve, ha nem, akkor az, hogy alkalmas transzformációval stacionáriussá tehető-e. Ezzel eldöntöttük azt, hogy az adott idősorhoz illeszthető-e ARIMA modell; ha igen, milyen (d) dimenzióval rendelkezik. Az ARIMA(p,d,q) d-edik derivált sora ARMA(p,q) rendű folyamat!

45 A modellkészítés menete (2) A következő kérdés annak megválaszolása, hogy milyen típusú ARMA modell illesztésével próbálkozzunk, illetve milyen legyen az autoregresszivitás (p) és/vagy a mozgóátlagolás (q) rendje. Erre a kérdésre a választ a tapasztalati, vagy a transzformált idősor ACF és PACF értékei alapján adjuk meg. A modellezés ezen fázisát modellazonosításnak (identifikációnak) nevezi a szakirodalom.

46 ACF, PACF Autokovariancia függvény (AVF): Autokorrelációs függvény (ACF): Parciális autokorrelációs függvény (PACF):

47 Modell ACF PACF Modell ACF PACF MA(q) q-ad rendű MA folyamatEltűnikLecseng a q. tag után AR(p): p-ed rendű AR folyamatLecsengEltűnik a p. tag után ARMA(p,q)=AR(p)+MA(q) LecsengLecseng ARMA(p,q)= AR(p)+MA(q)Eltűnik Eltűnik a q. tag után a p. tag után Sem AR, sem MANincs szig.Nincs szig. (fehér zaj vagy véletlen folyamat)értékérték Modellbecslés ACF és PACF segítségével

48 ACF ACF PACF PACF MA(1) 0c 1

49 ACF PACF ACF PACF MA(2) 0

50 ACF PACF ACF PACF MA(2) 0>c 1, 0 c 1, 0c 1, 0>c 2

51 ACF PACF ACF PACF AR(1) 0

52 ACF PACF ACF PACF AR(2) 0a 1, 0 a 1, 0

53 ACF PACF ACF PAC F AR(2) 0 a 2 0>a 1, 0>a 2

54 ACF PAC F ACF ARMA(1,1) 0 a 1 0

55 ACF PACF ACF PACF ARMA(1,1) 0>c 1, 0 c 1, 0

56 A modellkészítés menete (3) Ezután a modellezés lépései alapvetően megfelelnek a már ismert lineáris regressziós modellezésnek. A választott modell paraméterbecslése után a modell ellenőrzése következik. A modell ellenőrzése során vizsgáljuk azt, hogy paraméterei szignifikánsak- e, illetve véletlen változóik fehér zaj folyamatot követnek-e.

57 A modellkészítés menete (4) Speciálisan az ARMA modelleknek van stacionaritási és invertibilitási feltétele is, melyek a modell paramétereinek értékére vonatkozó megszorításokként jelennek meg. Ezután döntünk arról, hogy felhasználható-e az illesztett modell elemzésre, előrejelzésre, vagy más modell választásával kell próbálkoznunk.

58 Előrejelzés sztochasztikus modellekkel – példa

59 Köszönöm a megtisztelő figyelmet! Elérhetőség:


Letölteni ppt "Kvantitatív módszerek Készítette: Dr. habil. Kosztyán Zsolt Tibor"

Hasonló előadás


Google Hirdetések