Exponenciális szűrések Statisztika II. VEGTGAM22S
Simító eljárások (exponenciális szűrés) A simító eljárások a determinisztikus modellezésnél már jobban figyelembe veszik az idősor véletlen jellegét, belső összefüggéseit is. Ugyanakkor a „valódi” sztochasztikus modellezésnél egyszerűbb, áttekinthetőbb modelleket állítanak fel. A véletlen hatását simítással (kiátlagolással) igyekeznek kisebbíteni, ezáltal a determinisztikus jelleget emelik ki. Egyfajta „közbenső” pontosságú és komplexitású modell- családot alkotnak. Ez a modell-család onnan kapta a nevét, hogy az idősor t-edik elemét a múltbeli elemek exponenciálisan csökkenő súlyokkal vett lineáris kombinációjával becsüli.
Az exponenciális szűrési eljárás keretében több különböző paraméter kombináció beállítása mellett kiszámoljuk a EXPONENCIÁLIS SZŰRÉS négyzetes eltérést, és azt a paraméter kombinációt választjuk ki, amely mellett ez az eltérés a legkisebb. A képletben jelöli a modell becslését a t-edik időpillanatban.
azt Ez a paraméter azt jelzi, hogy a t időpillanathoz tartozó megfigyelés milyen mélységig függ az előző időpontbeli megfigyelésektől, azaz az idősor „emlékezetével” kapcsolatos. Ha = 1, akkor a legutolsó elem korrelálatlan az előző megfigyelésekkel, azaz az idősor emlékezetnélküli. Az = 0 esetén viszont az összes megelőző megfigyelés azonos erősséggel korrelál X t -vel. Akkor szerepel ez a paraméter, ha trenddel számolunk a modellben. Ha közel van 1 -hez, a trendfüggvényben az X t -közeli értékek nagyobb súllyal lesznek figyelembe véve, 0 -közeli érték esetén pedig mindegyik érték közel azonos súllyal szerepel a trendfüggvény kiszámításában. Simító eljárások (exponenciális szűrés)
Szezonalitási paraméter. 1 esetén a szezonalitást leíró függvény előállításában az X t -közeli értékek nagyobb súllyal lesznek figyelembe véve, 0 érték esetén pedig mindegyik érték közel azonos súllyal szerepel a szezonalitási függvény kiszámításában. A paraméter helyett használatos, amikor a trendfüggvény idővel lecseng. Ha 1 a trend lecsengése gyors, 0 esetén pedig lassú.
Az exponenciális szűrés lépései Először felállítjuk a dekompozíciós modellt: Ezután beállítjuk a modell-komponensek t=0 időponthoz tartozó becsléseit: Innen adódik a nulladik hibatag, amivel majd a következő lépésben fogunk korrigálni: A korrekciót valamennyi modell-komponensre elvégezzük:
Az exponenciális szűrés lépései A második hibatag a következő lépésben játszik majd szerepet a t=2 időpontbeli becslések korrigálásakor stb. A képletben szereplő korrekciós súlyfüggvényekparaméterei a legkisebb négyzetek módszerével úgy lesznek meghatározva, hogy a négyzetes eltérés a lehető legkisebb legyen!
Példa exponenciális szűrésre Az egyszeres simítás a legegyszerűbb modellekben az alábbi rekurzív összefüggésekkel adható meg. A leírásban (pl.)
Példa exponenciális szűrésre Folytatva az eljárást, mindegyik időpontra adunk becslést: A fenti utolsó összefüggést tömörebben is felírhatjuk: Ha most egy pillanatra feltesszük, hogy az idősornak negatív irányban végtelen a hosszúsága, akkor a fenti összefüggés az alábbi alakot veszi fel:, ahol Megmutatható, hogy: Az idősor t-edik eleme tehát a múltbeli elemek exponenciálisan csökkenő súlyokkal vett lineáris kombinációjával van megbecsülve! (Innen származik a módszer neve is.)
A következőkben ismertetjük az SPSS-ben az exponenciális szűrés (Exponential Smoothing: Custom Model) paranccsal megvalósítható illesztéseket. A leírásban megadjuk az illesztett modellt és a simítási eljárás rekurzív összefüggéseit is.
Nincs trend, nincs szezonális hatás (Trend Component: None, Seasonal Component: None) Modell: Becslés:
Nincs trend, additív szezonális hatás van (Trend Component: None, Seasonal Component: Additive) Modell: adott szezonális ismétlődések, p hosszú szakasz átlagok, i=1,…, k,
Becslés: Nincs trend, additív szezonális hatás van (Trend Component: None, Seasonal Component: Additive)
Nincs trend, multiplikatív szezonális hatás van (Trend Component: None, Seasonal Component: Multiplicative) Modell: adott szezonális ismétlődések, p hosszú szakasz átlagok, i=1,…, k,
Nincs trend, multiplikatív szezonális hatás van (Trend Component: None, Seasonal Component: Multiplicative) Becslés:
Lineáris trend, nincs szezonális hatás (Trend Component: Linear, Seasonal Component: None) Modell: Becslések:
Lineáris trend, additív szezonális hatás (Trend Component: Linear, Seasonal Component: Additive) Modell: Becslések: Stb.
Exponenciális trend, additív szezonális hatás (Trend Component: Exponential, Seasonal Component: Additive) Modell: Becslés: Stb.
Idővel gyengülő trend, nincs szezonális hatás (Trend Component: Damped, Seasonal Component: None) Modell: Becslés: Stb.
Idővel gyengülő trend, additív szezonális hatás (Trend Component: Damped, Seasonal Component: Additive) Modell: Becslés:
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése A Trends chapter 4.sav állományban egy cég számítógépes nyomtatóinak napi energia-felvételei vannak rögzítve:
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Az ábra megszemléléséből az alábbi következtetések vonhatók le: A soron nem érzékelhető trendhatás, az értékek véletlenszerűen szóródnak az átlagérték körül. Nem lehet kizárni a szezonális hatást, hiszen napi adatokról van szó. Elképzelhető, hogy 7, 30 vagy 365 hosszúságú ciklusok vannak a sorban, azaz számolni lehet heti, havi vagy esetleg éves ciklussal. Az idősornak van emlékezete olyan értelemben, hogy mindegyik érték közel van az őt közvetlenül megelőző értékekhez. Ezt a jelenséget a matematikában úgy lehet kifejezni, hogy pozitív autókorrelációt várunk.
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Hajtsunk végre exponenciális szűrést (simítást) a Analyze / Forecasting / Create Models Paranccsal! Először próbálkozzunk a Simple beállítással, amikor is sem trendet, sem szezonális hatást nem tételezünk fel. Dependent variable: amount, Method: Exponential Smoothing, Criteria: Model Type Nonseasonal: Simple. A Statistics és Plots füleknél a megadott összes lehetőség fakkját pipáljuk ki: , (OK).
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Az paraméterre (ebben a modellben ez az egyetlen paraméter) a becslés 0,802-re adódott. Ez azt jelenti, hogy az X t érték becsléséhez a hozzá közeli értékeket, tehát X t-1 X t-2 -őt kell a legnagyobb súllyal figyelembe venni a becslő sor előállításakor.
A hibatagok ACF és PACF értékeire egy grafikont is kapunk, amiről leolvasható, hogy az értékek a tűréshatáron belül esnek. Nyomtatók napi energia-felvételét tartalmazó idősor elemzése
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Az eredeti és a becsült idősorok együttes ábrája a konfidencia sávval együtt:
Ellenőrizzük le a maradéksort is! Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Látható, hogy sem trend, sem szezonális hatás nem érzékelhető, vagyis megszemlélés alapján fehérzajnak látszik. A normalitást ellenőrző P-P grafikon pontjai gyakorlatilag az átló mentén helyezkednek el,
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Alkalmazzuk előrejelzésre a modellünket! Az =0,802 beállítás mellett, a napokra kérjünk előrejelzést! Ehhez még egyszer le kell futtatni a modellt, de most a következő plusz beállításokat is tegyük meg: Save/Variables Predicted values, Options: First case after end of estimation period through a specified date, Date: observation 180. Ennek hatására keletkezik egy új változó (neve: Predicted_amount_Model_1), ami a modell előrelelzett értékeit tartalmazza, de az esetszám nem 149 lesz, hanem 180.
Rajzoltassuk ki az eredeti (amount) és az előre jelzett (Predicted_amount_Model_1) idősorokat a Analyze/Forecasting/Sequence Charts… paranccsal: Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Látható, hogy a jövőre vonatkozó előrejelzés egy konstans, hiszen a modellünkben sem trend, sem szezonális hatás nem szerepelt. Az alkalmazott modellben a becsült idősor lényegében az analizált idősor két nappal előre történő eltoltja lett. A maradéksor szórása elég jelentős (kb. kétharmada az eredeti sor szórásának), ami arra utal, hogy a becslés még nem magyarázza elég jól a jelenséget, azaz a predikció nem tűnik elég megbízhatónak.