Idősorok elemzése Dr. Varga Beatrix
Idősorok grafikus ábrázolása Grafikus ábrázolás: Az idősorok alaptendenciáinak tömör, áttekintő jellemzése leggyakrabban vonal, vagy oszlopdiagram segítségével történik. Fő típusai: Állapotidősorok: az időbeli ismérv értékei egy-egy időponthoz tartoznak. Ábrázolásuk különálló oszlopokkal történik. Tartamidősorok: a vízszintes tengelyen elvben intervallumok szerepelnek, a jelenséget pedig célszerű ezen intervallumok fölé rajzolt oszlopokkal, vagy vonaldiagrammal bemutatni.
A lakónépesség alakulása Magyarországon
Torzítás esetei a grafikus ábrázolásnál Forrás:Walter Kramer: So lügt man mit Statistik 38-39. o
Egy kihalófélben lévő egyed számának az alakulása Forrás: Beck-Bernholdt,-Dubben: A tojást rakó kutya 67. o.
Idősorok egyszerű elemzési módszerei Számtani átlag (tartamidősorok adataiból - flow változóknál) Kronológikus átlag (állapot idősor adataiból – stock változóknál)
Átlagos változás mutatói : a változás átlagos mértéke: Az időegységre jutó átlagos változást adja meg. a változás átlagos üteme: Ez viszonyszámként adja meg a változás ütemét, fejlődést tükröz
A vadállomány alakulása Magyarországon (adatok ezer darab) év mezei nyúl fácán őz vaddisznó 1970 937 1.277 141 16 1980 706 1.838 185 20 1990 796 1.099 173 39 2000 514 789 292 76 2010 455 613 356 106 Forrás: KSH: Századok statisztikája 135.o,; Országos vadgazdálkodási adattár http://www.vmi.szie.hu/adattar/pdf/VA-2010-11.pdf év mezei nyúl fácán őz vaddisznó a változás átlagos mértéke (d) -120,5 e db -166 e db 53,75 e db 22,5 e db a változás átlagos üteme (l) -26,5% -26,8% +26,1 +60,4
Dinamikus viszonyszámok lánc viszonyszám bázisviszonyszám
Az idősorok elemzésének bonyolultabb eszközei
Az idősorelemzés megközelítési módjai Determinisztikus idősorelemzés: Az idősor értékeinek alakulását az idő múlásával magyarázza. Két egymástól azonos távolságra lévő időpillanat között ugyanolyan jellegű változást tételez fel, bárhol van ez a két időpont az időskálán. Sztochasztikus idősorelemzés: Az idősor adatai időben véletlenszerűen lejátszódó, sztochasztikus folyamatok empirikus adatai.
Determinisztikus idősorelemzés feltételezi, hogy az idősor előre adott pályát követ. Legismertebb modellje a dekompozíciós modell, amely feltételezi az egyes elemek szétválaszthatóságát.
Az idősorok összetevői alapirányzat vagy trend, periodikus ingadozás, ciklus, véletlen ingadozás.
Alapirányzat vagy trend Jele: az idősorban tartósan érvényesülő tendencia a fejlődés legfontosabb komponense. több tényező együttes hatásának a következménye, alapvetően társadalmi-gazdasági törvényszerűségek határozzák meg.
Periodikus ingadozás Jele: sj Az idősorokban rendszeresen ismétlődő hullámzás. Leggyakoribb típusai: az idényszerű ill. szezonális ingadozások Az idényhatás állandó periódushosszúságú hullámzás, ritmikus ingadozás; általában olyan idősorokban állapíthatjuk meg jelenlétét, amelynek adatai egy évnél rövidebb időszakra (hónap, negyedév) vonatkoznak. Vannak olyan periodikus hullámzások is, amelyeknél a periódus rövidebb, mint egy év.
Ciklus Jele: c Olyan periodikus ingadozás az idősorban, amely kevésbé szabályos, jelenlétét csak hosszabb idősorok alapján lehet felfedni és tanulmányozni. Az ingadozások periódusának hosszúságát egyrészt természeti okok is befolyásolhatják Fő típusai az ún. gazdasági (konjunktúra) ciklusok.
Véletlen ingadozás Jele: vij Ezt az összetevőt valószínűségi változónak tekintjük. Véletlennek igen sok, egyenként nem jelentős, egymás hatását elősegítő vagy keresztező végső eredményét tekintjük. A véletlen hatás eredménye, hogy az idősorok adatai a trendből, illetve a periodikus komponensből adódó görbe körül sztochasztikusan ingadoznak.
Idősorok elemzésének feladatai A fejlődés alapirányzatának megismerése, miközben eltekintünk a többi összetevőitől. Az idősort mintegy ki akarjuk simítani: a szezonális, a ciklikus és a véletlen ingadozást "el akarjuk tüntetni", hogy a trendvonalat tisztán lássuk. A mozgó átlagolás vagy a regressziós módszerekből származtatható analitikus kiegyenlítéssel számszerűsíteni az idősorban rejlő tendenciákat. Az idényszerű hullámzás jellemzőinek mérése, amelynek során ki kell küszöbölni az idősorban érvényesülő trendhatást és a véletlen ingadozást (gazdasági ciklus hatását). A konjunktúrahullám (gazdasági ciklus) kimutatása (a többi hatás kiszűrésével). A véletlen hatások kezelése.
Az egyes komponensek közötti kapcsolat Additív kapcsolat Multiplikatív kapcsolat: periódusok (pl. évek) perióduson belüli rövidebb időszakok(pl. negyedévek)
Idősorok felbontása: Y(i) = T(i) + S(i) + V(i) T(i) trend komponens S(i) periodikus tag V(i) maradéktag determinisztikus sztochasztikus (autoregresszív és véletlen) V(i) S(i)
Trendszámítás A trendszámítás feladata az idősor fő komponensének, az alapirányzatnak a kimutatása. Az idősor kiegyenlítése, kisimítása a célunk úgy, hogy a periodikus ingadozás és a véletlen ingadozás hatását kiküszöböljük.
Analitikus trendszámítás: az idősor alapirányzatát valamilyen matematikai függvénnyel írjuk le Mozgóátlagolás módszere: a t. időszakhoz tartozó trendértéket a környező időszakok adatainak dinamikus átlagaként határozzuk meg.
Trendszámítás mozgó átlagolással A mozgó átlagolás alapgondolata az, hogy a trendet az eredeti sor dinamikus átlagaként állítjuk elő. A számítás menete a következő: Kiszámítjuk az idősor első „k” adatának egyszerű számtani átlagát. Ez az első trendérték, amelyet az érintett időszak közepéhez - vagyis a (k+1) 1/2-edik időszakhoz - rendelünk. Ezután elhagyjuk az első adatot, és ehelyett vesszük a következő (k+1)-ediket. Ismét átlagot számítva nyerjük a következő mozgó átlagot, vagyis trendértéket, amelyet a megfelelő időszakhoz rendelünk. Így haladunk, amíg az utolsó adatot is felhasználjuk. Az eredményül kapott trendértékek sorozata a kiegyenlített idősor.
Háromtagú mozgó átlagok számítása
Háromtagú mozgó átlagok számítása Páratlan k tagszám esetén az yt (t = 1, 2, ..., n) idősorból számított k tagú mozgó átlagok sorozata a t = j+1-edik időszaktól a t = n-j-edik időszakig tart, ahol j = (k-1)/2. A t-edik időszakhoz rendelt mozgó átlag:
Páros tagszámú mozgóátlag számítása Páros tagszám esetén az az időszak, amelyet a mozgó átlag jellemez, mindig két, eredetileg megadott időszak közé esik, így pl. 12 tagú átlagnál a 6. és 7. időszak közé. Ezen a helyzeten egy újabb művelet, az ún. középre igazítás, vagy centírozás beiktatásával segítünk. A középre igazítás úgy történik, hogy a kiszámított mozgó átlagokat páronként rendre átlagoljuk, vagyis újabb, ezúttal kéttagú mozgó átlagok sorozatát számítjuk ki. Ezek a trendértékek már a megadott időszakra vonatkoznak.
Mintapélda páratlan tagszámú mozgó átlag alkalmazásához Valutaországba érkező turisták számának alakulása, ezer fő (2011-2014) Év Szezon Létszám yt 2011 előszezon 100 főszezon 110 utószezon 120 2012 140 162 2013 2014 130 132 150
Mintapélda megoldása Év Szezon Létszám yt 3 tagú mozgóátlag Valutaországba érkező turisták jellemzés mozgóátlagolás felhasználásával, ezer fő (2011-2014) Év Szezon Létszám yt 3 tagú mozgóátlag Mellékszámítás 2011 előszezon 100 - főszezon 110 utószezon 120 123,33 2012 140 140,67 162 147,33 134 2013 126,67 130 2014 127,33 132 137,33 150
Mintapélda páratlan tagszámú mozgó átlag alkalmazásához A Hold Kft. által értékesített gázolaj mennyisége 2012 és 2014 között negyedéves bontásban. (ezer liter) Év Negyedév Értékesített mennyiség yt 2012 I. 500 II. 520 III. 540 IV. 530 2013 560 590 600 2014 610 620 650 700
Értékesített mennyiség Mintapélda megoldása A Hold Kft. által értékesített gázolaj mennyiségének vizsgálata mozgóátlagolás felhasználásával 2012 és 2014 között negyedéves bontásban. (ezer liter) Év Negyedév Értékesített mennyiség yt 4 tagú átlag 4 tagú mozgóátlag 2012 I. 500 - II. 520 522,5 III. 540 527,5 532,5. IV. 530 537,5 542,5 2013 548,75 555. 560 563,75 572,5 590 581,25 600 597,5 605 2014 610 612,5 620 632,5 645 650 700
Mozgó átlagolás jellemzői A kapott mozgóátlag, mint trend megmutatja az idősor alapirányzatát, miközben eltekintünk a többi komponenstől. A véletlen hatás kiküszöbölését (csökkentését) az átlagolás művelete révén érjük el. A véletlen kikapcsolása annál tökéletesebb, minél nagyobb tagszámú mozgó átlagokat számítunk. A periodikus ingadozás hatását a mozgó átlag tagszámának megfelelő kijelölésével küszöbölhetjük ki. Fontos, hogy mindegyik mozgó átlag átfogjon egy (vagy több) teljes idényciklust. A mozgó átlag tagszáma: egy-egy ciklushoz tartozó adatok számával legyen egyenlő vagy annak egész számú többszöröse legyen.
Analitikus trendszámítás Analitikus trendszámítás: A vizsgált jelenség tartós irányzatát az idő függvényében valamilyen regressziós függvénnyel határozzuk meg. Az analitikus trendszámítás a leggyakrabban alkalmazott szűrő és simító eljárás. Az analitikus trendszámítás esetén két kérdést kell tisztázni: Milyen típusú függvénnyel akarjuk leírni az idősort? Hogyan mérjük az illeszkedést, és mikor tekintünk egy illeszkedést jónak?
Lineáris trend Alkalmazása: Ha azt tapasztaljuk, hogy az időegységenként bekövetkezett változás, abszolút értelemben közel állandó, a változás egyenletes. Lineáris trendfüggvény:
A paraméterek meghatározása
A paraméterek értelmezése b0 paraméter: Az alapirányzat értéke a t=0-val jelölt időpontban. Ha t=1, 2, …, n, akkor a vizsgálatba bevont időpontot megelőző időpont trend szerinti értéke. b1 paraméter: Az időegységenkénti átlagos abszolút változás mértéke. Előjelétől függően növekedést vagy csökkenést jelez a vizsgálatba bevont időtartam alatt.
Termelt mennyiség (edb) Mintafeladat Kis Kft. által előállított izzó mennyisége 2005-2007 között negyedéves bontásban, ezer db Év Negyedév Termelt mennyiség (edb) 2005 I. 4 II. 6 III. 8 IV. 7 2006 10 12 14 15 2007 18 20 22
Mintafeladat megoldása Év 2005 2006 2007 Összesen Negyedév I II III IV - yt 4 6 8 7 10 12 14 15 18 20 22 154 t 1 2 3 4 5 6 7 8 9 10 11 12 78 t2 1 4 9 16 25 36 49 64 81 100 121 144 650 ty 4 12 24 28 50 72 98 120 162 180 220 264 1234 ŷt 3,874 5,503 7,132 8,761 10,390 12,019 13,648 15,277 16,906 18,535 20,164 21,793 154,002 (y-ŷ)2 0,016 0,247 0,753 3,101 0,152 0,000 0,124 0,077 1,197 0,286 0,027 0,043 6,023
Mintafeladat megoldása Év Negyedév yt t t2 ty ŷt (y-ŷ)2 Összesen - 154 78 650 1234 154,002 6,023 Normálegyenletek a t=1, 2,…, n számítással: 154=12b0+78b1 1234=78b0+650b1 Az egyenletrendszer megoldásával kapott paraméterek: b0=2,245 b1=1,629 Trendegyenlet: ŷ=2,245+1,629*t
Relatív reziduális szórás Megmutatja, hogy a becsült értékek a valós értékektől átlagosan hány %-kal térnek el. A mutató által eldönthető, hogy a vizsgált idősor milyen trendfüggvénnyel írható le a legjobban. Jele: Ve
Relatív reziduális szórás kiszámítása a mintapélda alapján Reziduális szórásnégyzet meghatározása Az a függvény illeszkedik jobban, ahol ez a szórásnégyzet kisebb. Relatív szórás mutatószáma: Tehát a Kis Kft. által előállított izzó mennyiségének lineáris trenddel becsült értékei a valós értékektől átlagosan 5,5%-kal térnek el.
Exponenciális trend Alkalmazása: Ha a vizsgált jelenség egyik időszakról a másik időszakra megközelítőleg mindig ugyanannyiszorosára, azonos százalékkal változik, azaz az időegységenkénti relatív változás ingadozik egy állandó körül. Az exponenciális trendfüggvény általános alakja:
Exponenciális trend Az exponenciális függvény logaritmikus transzformációval lineáris alakra hozható. A paraméterek meghatározása visszavezethető a lineáris függvényre. A t=1,2,…, n időpontban mért y1,…,yn adatokból a legkisebb négyzetek módszerével meghatározhatjuk (új jelölések bevezetésével) az exponenciális trendfüggvényt.
Exponenciális trend normálegyenletei
Paraméterek értelmezése b0 : a jelenség exponenciális trend szerinti értéke a t=0-val jelölt időpontban b1 : az időegységenkénti átlagos relatív változás jelzi, hogy a vizsgált időszak alatt a jelenség értéke időegységenként átlagosan hányszorosára változott
Hitelt felvevők száma (efő) Mintafeladat Nagy Bank Nyrt.-től hitelt felvevők száma 2005-2007 között negyedéves bontásban, ezer fő Év Negyedév Hitelt felvevők száma (efő) 2005 I. 80 II. 90 III. 130 IV. 155 2006 180 230 280 340 2007 400 650 700 820
Mintafeladat megoldása Munkatábla Év 2005 2006 2007 Összesen Negyedév I II III IV - yt 80 90 130 155 180 230 280 340 400 650 700 820 4055 t 1 2 3 4 5 6 7 8 9 10 11 12 78 t2 1 4 9 16 25 36 49 64 81 100 121 144 650 logy 1,903 1,954 2,114 2,190 2,255 2,362 2,447 2,531 2,602 2,813 2,845 2,914 28,931 t*logyy 1,903 3,908 6,342 8,761 11,276 14,170 17,130 20,252 23,419 28,129 31,296 34,966 201,553 ŷt 77,976 96,900 120,418 149,644 185,962 231,095 287,182 356,881 443,496 551,132 684,892 851,116 4036,694 (y-ŷ)2 4,098 47,615 91,812 28,691 35,547 1,199 51,580 284,966 1891,897 9774,801 228,244 968,180 13408,630
Eredmények értelmezése Normálegyenletek a t=1, 2,…, n számítással: 28,931=12b0+78b1 201,553=78b0+650b1 Az egyenletrendszer megoldásával kapott paraméterek: Trendegyenlet: ŷ=62,747*1,2427t „a” : 2004. IV. negyedévében az exponenciális trend szerinti létszám 62,747 ezer fő volt. „b” : 1,2427 a Nagy Bank-nál hitelt felvevők létszáma 2005-2007 között negyedévenként átlagosan 1,2427-szeresére, azaz 24,27%-kal növekedett.
Az idősorok összetevői alapirányzat vagy trend, periodikus ingadozás, szezonalitás ciklus, véletlen ingadozás.
Szezonalitás vizsgálata Jele: sj Az idősorokban rendszeresen ismétlődő hullámzás. Leggyakoribb típusai: az idényszerű ill. szezonális ingadozások Az idényhatás állandó periódushosszúságú hullámzás, ritmikus ingadozás Olyan idősorokban állapíthatjuk meg jelenlétét, amelynek adatai egy évnél rövidebb időszakra (hónap, negyedév) vonatkoznak.
Az egyes komponensek közötti kapcsolat Additív kapcsolat Multiplikatív kapcsolat: periódusok (pl. évek) perióduson belüli rövidebb időszakok(pl. negyedévek)
Munkatábla a szezonális eltérések kiszámításához 1. né 2. né 3. né 4. né 2005 0,1282 0,4988 0,8694 -1,7600 2006 -0,3894 -0,0188 0,3518 -0,2776 2007 1,0930 -0,5364 -0,1658 0,2048 nyers szezonális eltérés 0,2773 -0,6109 tisztított szezonális eltérés 0,2774 -0,0186 0,3520 -0,6108
Munkatábla a szezonális eltérések kiszámításához időszak y trend y-trend tisztított szezonális eltérés szezonálisan kiigazított trend 2005. 1. né. 4 3,87 0,13 0,28 4,15 2005. 2. né. 6 5,50 0,50 -0,02 5,48 2005. 3. né 8 7,13 0,87 0,35 7,48 2005. 4. né. 7 8,76 -1,76 -0,61 8,15 2006. 1. né. 10 10,39 -0,39 10,67 2006. 2. né. 12 12,02 12,00 2006. 3. né 14 13,65 14,00 2006. 4. né. 15 15,28 -0,28 14,67 2007. 1. né. 18 16,91 1,09 17,18 2007. 2. né. 18,54 -0,54 18,52 2007. 3. né 20 20,17 -0,17 20,52 2007. 4. né. 22 21,80 0,20 21,18
Munkatábla a szezonindexek kiszámításához év negyedév db trend y/trend tisztított szezonindex szezonálisan kiigazított trend 2011 I. 13 18,456 0,7044 0,8264 15 II. 10 19,737 0,5067 0,6100 12 III. 30 21,018 1,4274 1,5560 33 IV. 38 22,299 1,7041 1,2748 28 2012 21 23,580 0,8906 19 17 24,860 0,6838 42 26,141 1,6067 41 22 27,422 0,8023 35 2013 28,703 0,7316 24 29,984 0,5670 18 45 31,265 1,4393 49 32,546 1,2598 2014 25 33,827 0,7391 35,108 0,5127 47 36,389 1,2916 57 37,669 1,1150 48
Köszönöm a figyelmet!