Gazdaságstatisztika Idősorok elemzése 21. előadás
Hol járunk?
Idősorok Az X magyarázó változó és az Y eredményváltozó sztochasztikus kapcsolatának speciális esete Idősorok esetén Az X magyarázó változó lehetséges értékei időpontok, vagy időtartamok. Az Y eredményváltozó sztochasztikusan függ X lehetséges értékeitől. Gyakran alkalmazunk idősorokat gazdasági jelenségek leírására. Például: a felsőfokú végzettséget szerző hallgatók száma évente BUX index napi záró értékei egy vállalkozás havi árbevételei egy bizonyos termék havonta értékesített mennyiségei
Idősorok elemzése Grafikus ábrázolás Vonaldiagramot célszerű készíteni, ez jól sugallja az adatsorban rejlő szabályszerűségeket
Idősorok elemzése Idősorok elemzése Tartamidősor Állapotidősor Alapvetően leíró statisztikai módszerekkel Átlagszámítás tekintetében azonban különbséget kell tennünk a tartamidősorok és állapotidősorok között Tartamidősor A magyarázó X változó értékei (általában azonos hosszúságú) időtartamok, az Y eredményváltozó értékei tartamadatok, amelyek összegezhetők, és egyszerű számtani átlaggal átlagolhatók. Állapotidősor A magyarázó X változó értékei időpontok, így az Y eredményváltozó értékei egy-egy időpontra vonatkozó adatok, melyek összegzésének tartalmi értelme nincs. Y értékeinek átlaga az átlagos állománynagyság, melyet a kronologikus átlaggal határozunk meg. Ha Y1, Y2, … Yn egy állapotidősor n db egymást követő értéke, akkor kronologikus átlaguk:
Példa tartam- és állapotidősorra Egy utazási iroda valutakészletének és értékesítésének adatai az alábbiak Határozzuk meg a 2. félévben a havi átlagos valutaértékesítést, s az átlagos valutakészletet! A havi valutaértékseítés adatok tartamidősort alkotnak A 2. félév adatainak átlaga: A hónap utolsó napján tekintett valutakészlet adatok állapotidősort alkotnak Az átlagos valutakészlet a kronologikus átlaggal számítható: Hónap Valutakészlet a hónap utolsó napján [eUSD] Valutaértékesítés [eUSD] Június 18,8 --- Július 19,6 35,8 Augusztus 20,2 35,2 Szeptember 19,8 34,3 Október 21,1 33,5 November 20,3 32,4 December 19,2
Idősorok összetevőinek vizsgálata Idősorok elemzésének két fő megközelítési módja ismert Sztochasztikus modell Az idősor pillanatnyi értékeit saját korábbi állapotából és a véletlen hatásokból lehet magyarázni. A véletlen változó a jelenség fő mozgatója. Determinisztikus modell Az idősor alakulását a következő összetevők határozzák meg: Tartósan érvényesülő hosszútávú tendencia (trend) Tartósan ható, szabályos, jól modellezhető periodikus ingadozás A véletlen, amely eseti-egyedi eltérítő hatást eredményez Két szemlélet, két modell Mi a determinisztikus modellt tárgyaljuk.
Idősorok összetevőinek vizsgálata - trendhatás Hosszútávú, tartósan érvényesülő irányzat a trend Hogyan határozzuk meg a trendet? Mozgóátlagolással (mi ezt alkalmazzuk…) Analitikusan, valamilyen trendfüggvény típus segítségével Lineáris, exponenciális, logaritmikus, hatvány, polinom
Idősorok összetevőinek vizsgálata - periodikus ingadozás Két fajtáját különböztetjük meg Ciklikus (konjunkturális) ingadozást Az üzleti és gazdasági tevékenységek esetében az ingadozásokat akkor nevezzük ciklikusnak, ha azok több mint egy éves időintervallum után ismétlődnek. Például: konjunktúra, recesszió, stagnálás, megújulás A hullámzás periódusa nem állandó Ezt a tárgy kereteiben nem vizsgáljuk Szezonális (idényszerű) ingadozás Az idősort úgy tekintjük, mint azonos hosszúságú időszakok (vagy időpontok) adatainak egymás utáni sorozatát. A trendtől nagyon hasonló, ismétlődő mintázatot mutató eltéréseket a szezonális ingadozás eredményének tudhatjuk be. Például: karácsony előtt a vásárlások A hullámzás periódusa állandó
Idősorok összetevőinek vizsgálata - szezonális ingadozás Hasonló, ismétlődő trendtől való eltérés mintázatok
Idősorok összetevőinek vizsgálata - szabálytalan, véletlen ingadozás Valószínűségi változónak tekintjük A véletlen ingadozás sok, önmagában nem jelentős tényező együttes hatása az idősorra Lehet, hogy egy-egy tényező (sztrájk, árvíz, stb.) jelentősebb hatást gyakorol a megfigyelt mennyiségre, de feltesszük, hogy ezek csak rövid ideig okoznak változást, így hatásuk összességében véletlennek tekinthető
Idősorok összetevőinek vizsgálata - dekompozíciós eljárás A determinisztikus modell az Y eredményváltozó összetevőkre (trend-, szezonális- és véletlen hatás) történő felbontásának matematikai leírása. Ezért szokták a modellt dekompozíciós eljárásnak is nevezni. Attól függően, hogy az idősor összetevői között milyen kapcsolatot tételezünk fel, a determinisztikus modell lehet additív vagy multiplikatív. Additív modell Y-t az összetevők összegének tekintjük Multiplikatív modell Y-t az összetevők szorzatának tekintjük
Idősorok összetevőinek vizsgálata - additív és multiplikatív dekompozíció n: az idősor elemeinek száma p: szezonok száma egy periódusban n/p: a periódusok száma yij : az idősor i-edik periódusának (i=1..n/p), j-edik (j=1..p) szezonjához tartozó adat Additív modell Multiplikatív modell Véletlen hatás Véletlen hatás Szezonális hatás Szezonális hatás Trendhatás Trendhatás
Trend becslése mozgóátlaggal Cél: szezonális és véletlen ingadozás hatásának “kiszűrése”, azaz a trendhatás, amennyire csak lehet, legyen mentes a szezonális és véletlen hatásoktól Eszközként a mozgóátlagot használjuk (sok más módszer is ismert) Mozgóátlag Az idősor első előre rögzített számú eleméből számtani átlagot képezünk, majd az első elemet kihagyva, s a következőt bevonva folytatjuk a számítást az utolsó adatig. Ha van szezonalitás, akkor a mozgóátlag taglétszámát úgy kell megválasztani, hogy az a perióduson belüli szakaszok (szezonok) számával azonos, vagy annak egész számú többszöröse legyen.
Trend becslése mozgóátlaggal Ha a mozgóátlag elemeinek száma páratlan (2l+1), akkor a trend k-adik eleme (k=l+1, l+2,…): Ha a mozgóátlag elemeinek száma páros (2l), akkor a trend k-adik eleme (k=l+1, l+2, …): ahol Ez a centírozás
Példa* Háztartások számára értékesített gázmennyiség (milló m3) Nógrád megyében 1990 és 1994 között negyedéves bontásban az alábbiak szerint alakult. Határozzuk meg a gázfogyasztás alakulását jellemző trendet mozgóátlagolás alkalmazásával! I. II. III. IV. 1990 3,5 3,1 2,4 3,9 1991 6,7 6,4 5,1 7,2 1992 7,4 5,2 8,0 1993 8,2 8,1 8,5 1994 9,3 11,7 * Forrás: Korpás A.-né: Általános statisztika II., Nemzeti Tankönyvkiadó, Budapest, 1997
Példa - trend meghatározása Ábrázoljuk az adatokat! Az adatok emelkedő trendhatásra utalnak Periódus az év Negyedéves szezonalitás feltételezhető, azaz a szezonok száma egy periódusban 4 Mozgóátlag elemszámának célszerű a 4-et választani
Példa - trend meghatározása Ért. Gáz (m3) Időszak cMA(4) 3.5 1990 - I 3.1 1990 - II 2.4 1990 - III 3.63 3.9 1990 - IV 4.44 6.7 1991 - I 5.19 6.4 1991 - II 5.94 5.1 1991 - III 6.44 7.2 1991 - IV 6.63 7.4 1992 - I 6.74 1992 - II 6.85 5.2 1992 - III 7.05 8 1992 - IV 7.26 8.2 1993 - I 7.63 8.1 1993 - II 7.94 1993 - III 8.14 8.5 1993 - IV 8.26 9.3 1994 - I 8.25 1994 - II 8.65 1994 - III 11.7 1994 - IV ? k=3, l=2 k=4, l=2
Példa - trend meghatározása
Szezonalitás vizsgálata Azt vizsgáljuk, hogy a rendszeresen (azonos periódushosszal) ismétlődő hatások, milyen mértékben vagy arányban térítik el az idősor értékeit a trendtől Cél: a trendhatás és a véletlen hatásának “kiszűrése” az adatokból Additív modell esetén a szezonalitást a trendtől való eltérés nagyságával, azaz a trendtől vett eltéréssel, multiplikatív modellnél a relatív eltéréssel jellemezzük
Szezonalitás vizsgálata A trendhatást úgy szűrjük ki, hogy az idősor értékeiből rendre kivonjuk (ill. az idősor értékeit rendre elosztjuk) a trendértékeket (értékekkel). Ezek az egyedi szezonális eltérések (hányadosok). Additív modell Multiplikatív modell
Szezonalitás vizsgálata A véletlen hatást úgy szűrjük ki, hogy minden periódusból vesszük az adott szezonhoz tartozó egyedi szezonális eltérések (hányadosok) átlagát. Ezek adják a szezonok nyers szezonális eltéréseit (szezondindexeit). Additív modell Multiplikatív modell j-edik nyers szezonális eltérés j-edik nyers szezonindex
Szezonalitás vizsgálata Ha a trendet nem lineáris függvénnyel határozzuk meg, akkor nem teljesül az a feltétel, hogy a szezonális eltérések összege (illetve átlaga) 0 (multiplikatív modellnél, hogy szorzatuk 1). Ilyenkor a szezonális eltéréseket (ill. szezonindexeket) korrigáljuk. Additív modell Multiplikatív modell j-edik korrigált szezonális eltérés j-edik korrigált szezonindex Az idősor értéke az adott szezonban átlagosan mennyivel tér el a trend szerinti értéktől. Az idősor értéke az adott szezonban átlagosan hányszorosa a trend szerinti értéknek.
Példa - szezonalitás meghatározása Itt additív szezonalítás feltétezhető.
Példa - szezonalitás meghatározása Ért. Gáz (m3) Időszak cMA(4) Egyedi sz. eltérések sj sj' Sz.korr. ért. 3.5 1990 - I 0.95 0.96 2.54 3.1 1990 - II 0.08 0.10 3.00 2.4 1990 - III 3.63 -1.23 -1.34 -1.32 3.72 3.9 1990 - IV 4.44 -0.54 0.25 0.27 6.7 1991 - I 5.19 1.51 5.74 6.4 1991 - II 5.94 0.46 6.30 5.1 1991 - III 6.44 6.42 7.2 1991 - IV 6.63 0.58 6.93 7.4 1992 - I 6.74 0.66 1992 - II 6.85 0.35 7.10 5.2 1992 - III 7.05 -1.85 6.52 8 1992 - IV 7.26 0.74 7.73 8.2 1993 - I 7.63 0.57 7.24 8.1 1993 - II 7.94 0.16 8.00 1993 - III 8.14 -0.94 8.52 8.5 1993 - IV 8.26 0.24 8.23 9.3 1994 - I 8.25 1.05 8.34 1994 - II 8.65 -0.65 7.90 1994 - III 11.7 1994 - IV 11.43 Trend + véletlen
Példa – grafikus összegzés
Autó- és keresztkorreláció idősorok elemzésénél Egy vagy több idősor egymást követő adatai szoros korrelációban állhatnak egymással (erős közöttük a sztochasztikus kapcsolat). Autókorreláció Egy változó egymást követő adatai közötti korreláció, azaz egy változó egymást követő adatai közötti sztochasztikus kapcsolat erőssége az autókorreláció. Keresztkorreláció Két különböző idősor időben eltolt adatai közötti korreláció a keresztkorreláció.