Exponenciális szűrések Statisztika II. VEGTGAM22S.

Slides:



Advertisements
Hasonló előadás
Készítette: Kosztyán Zsolt Tibor
Advertisements

Lineáris regressziós MODELLEK
Kvantitatív módszerek
Kvantitatív Módszerek
Testek egyenes vonalú egyenletesen változó mozgása
Kvantitatív módszerek
Gazdasági informatika
MI 2003/ A következőkben más megközelítés: nem közvetlenül az eloszlásokból indulunk ki, hanem a diszkriminancia függvényeket keressük. Legegyszerűbb:
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Matematikai Statisztika VIK Doktori Iskola
Földrajzi összefüggések elemzése
Dijkstra algoritmus Irányított gráfban.
Függvénytranszformációk
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. X. Dr. Szalka Éva, Ph.D..
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Előadó: Prof. Dr. Besenyei Lajos
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója Takács György 4. előadás
III. előadás.
Lineáris korreláció és lineáris regresszió. A probléma felvetése y = 1,138x + 80,778r = 0,8962.
Matematika III. előadások MINB083, MILB083
Regresszióanalízis 10. gyakorlat.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Kvantitatív módszerek
Kvantitatív módszerek
STATISZTIKA II. 11. Előadás
Idősor komponensei Trend vagy alapirányzat: az idősor alakulásának fő irányát mutatja meg. Szezonális vagy idényszerű ingadozás: szabályos időszakonként.
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
A Boltzmann-egyenlet megoldása nem-egyensúlyi állapotban
Többváltozós adatelemzés
Többváltozós adatelemzés
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapsokaság (populáció)
Alapfogalmak.
Lineáris regresszió.
Két kvantitatív változó kapcsolatának vizsgálata
© Farkas György : Méréstechnika
Többszempontos ANOVA (I
Statisztikai alapfogalmak
A termelési függvény.
Petrovics Petra Doktorandusz
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Valószínűségszámítás II.
Többdimenziós valószínűségi eloszlások
Nagy Szilvia 7. Lineáris blokk-kódok
Szimuláció.
Struktúra predikció Struktúra lehet Felügyelt tanulási probléma
Előrejelzés Összeállította: Sójáné Dux Ágnes. Előrejelzés Az időbeli folyamatok elemzésének segítségével lehetőség nyílik a korábban láthatatlan trendek.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
Kvantitatív módszerek
Gazdaságstatisztika Idősorok elemzése.
Gazdaságstatisztika Konzultáció a korreláció- és regressziószámítás, idősorok elemzése témakörökből.
I. Előadás bgk. uni-obuda
III. előadás.
Trendelemzés előadó: Ketskeméty László
Alapfogalmak Matematikai Statisztika
A Box-Jenkins féle modellek
Készítette: Perecz Patrik
Gazdaságinformatikus MSc
Bunkóczi László, Dr.Pitlik László, Pető István, Szűcs Imre
A Box-Jenkins féle modellek
Acf, pacf, arima, arfima.
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Dr. Varga Beatrix egyetemi docens
Előadás másolata:

Exponenciális szűrések Statisztika II. VEGTGAM22S

Simító eljárások (exponenciális szűrés)  A simító eljárások a determinisztikus modellezésnél már jobban figyelembe veszik az idősor véletlen jellegét, belső összefüggéseit is.  Ugyanakkor a „valódi” sztochasztikus modellezésnél egyszerűbb, áttekinthetőbb modelleket állítanak fel. A véletlen hatását simítással (kiátlagolással) igyekeznek kisebbíteni, ezáltal a determinisztikus jelleget emelik ki.  Egyfajta „közbenső” pontosságú és komplexitású modell- családot alkotnak.  Ez a modell-család onnan kapta a nevét, hogy az idősor t-edik elemét a múltbeli elemek exponenciálisan csökkenő súlyokkal vett lineáris kombinációjával becsüli.

Az exponenciális szűrési eljárás keretében több különböző paraméter kombináció beállítása mellett kiszámoljuk a EXPONENCIÁLIS SZŰRÉS négyzetes eltérést, és azt a paraméter kombinációt választjuk ki, amely mellett ez az eltérés a legkisebb. A képletben jelöli a modell becslését a t-edik időpillanatban.

  azt Ez a paraméter azt jelzi, hogy a t időpillanathoz tartozó megfigyelés milyen mélységig függ az előző időpontbeli megfigyelésektől, azaz az idősor „emlékezetével” kapcsolatos. Ha  = 1, akkor a legutolsó elem korrelálatlan az előző megfigyelésekkel, azaz az idősor emlékezetnélküli. Az  = 0 esetén viszont az összes megelőző megfigyelés azonos erősséggel korrelál X t -vel. Akkor szerepel ez a paraméter, ha trenddel számolunk a modellben. Ha  közel van 1 -hez, a trendfüggvényben az X t -közeli értékek nagyobb súllyal lesznek figyelembe véve, 0 -közeli érték esetén pedig mindegyik érték közel azonos súllyal szerepel a trendfüggvény kiszámításában. Simító eljárások (exponenciális szűrés)

    Szezonalitási paraméter.   1 esetén a szezonalitást leíró függvény előállításában az X t -közeli értékek nagyobb súllyal lesznek figyelembe véve,   0 érték esetén pedig mindegyik érték közel azonos súllyal szerepel a szezonalitási függvény kiszámításában. A  paraméter helyett használatos, amikor a trendfüggvény idővel lecseng. Ha   1 a trend lecsengése gyors,   0 esetén pedig lassú.

Az exponenciális szűrés lépései Először felállítjuk a dekompozíciós modellt: Ezután beállítjuk a modell-komponensek t=0 időponthoz tartozó becsléseit: Innen adódik a nulladik hibatag, amivel majd a következő lépésben fogunk korrigálni: A korrekciót valamennyi modell-komponensre elvégezzük:

Az exponenciális szűrés lépései A második hibatag a következő lépésben játszik majd szerepet a t=2 időpontbeli becslések korrigálásakor stb. A képletben szereplő korrekciós súlyfüggvényekparaméterei a legkisebb négyzetek módszerével úgy lesznek meghatározva, hogy a négyzetes eltérés a lehető legkisebb legyen!

Példa exponenciális szűrésre Az egyszeres simítás a legegyszerűbb modellekben az alábbi rekurzív összefüggésekkel adható meg. A leírásban (pl.)

Példa exponenciális szűrésre Folytatva az eljárást, mindegyik időpontra adunk becslést: A fenti utolsó összefüggést tömörebben is felírhatjuk: Ha most egy pillanatra feltesszük, hogy az idősornak negatív irányban végtelen a hosszúsága, akkor a fenti összefüggés az alábbi alakot veszi fel:, ahol Megmutatható, hogy: Az idősor t-edik eleme tehát a múltbeli elemek exponenciálisan csökkenő súlyokkal vett lineáris kombinációjával van megbecsülve! (Innen származik a módszer neve is.)

A következőkben ismertetjük az SPSS-ben az exponenciális szűrés (Exponential Smoothing: Custom Model) paranccsal megvalósítható illesztéseket. A leírásban megadjuk az illesztett modellt és a simítási eljárás rekurzív összefüggéseit is.

Nincs trend, nincs szezonális hatás (Trend Component: None, Seasonal Component: None) Modell: Becslés:

Nincs trend, additív szezonális hatás van (Trend Component: None, Seasonal Component: Additive) Modell: adott szezonális ismétlődések, p hosszú szakasz átlagok, i=1,…, k,

Becslés: Nincs trend, additív szezonális hatás van (Trend Component: None, Seasonal Component: Additive)

Nincs trend, multiplikatív szezonális hatás van (Trend Component: None, Seasonal Component: Multiplicative) Modell: adott szezonális ismétlődések, p hosszú szakasz átlagok, i=1,…, k,

Nincs trend, multiplikatív szezonális hatás van (Trend Component: None, Seasonal Component: Multiplicative) Becslés:

Lineáris trend, nincs szezonális hatás (Trend Component: Linear, Seasonal Component: None) Modell: Becslések:

Lineáris trend, additív szezonális hatás (Trend Component: Linear, Seasonal Component: Additive) Modell: Becslések: Stb.

Exponenciális trend, additív szezonális hatás (Trend Component: Exponential, Seasonal Component: Additive) Modell: Becslés: Stb.

Idővel gyengülő trend, nincs szezonális hatás (Trend Component: Damped, Seasonal Component: None) Modell: Becslés: Stb.

Idővel gyengülő trend, additív szezonális hatás (Trend Component: Damped, Seasonal Component: Additive) Modell: Becslés:

Nyomtatók napi energia-felvételét tartalmazó idősor elemzése A Trends chapter 4.sav állományban egy cég számítógépes nyomtatóinak napi energia-felvételei vannak rögzítve:

Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Az ábra megszemléléséből az alábbi következtetések vonhatók le:  A soron nem érzékelhető trendhatás, az értékek véletlenszerűen szóródnak az átlagérték körül.  Nem lehet kizárni a szezonális hatást, hiszen napi adatokról van szó. Elképzelhető, hogy 7, 30 vagy 365 hosszúságú ciklusok vannak a sorban, azaz számolni lehet heti, havi vagy esetleg éves ciklussal.  Az idősornak van emlékezete olyan értelemben, hogy mindegyik érték közel van az őt közvetlenül megelőző értékekhez. Ezt a jelenséget a matematikában úgy lehet kifejezni, hogy pozitív autókorrelációt várunk.

Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Hajtsunk végre exponenciális szűrést (simítást) a Analyze / Forecasting / Create Models Paranccsal! Először próbálkozzunk a Simple beállítással, amikor is sem trendet, sem szezonális hatást nem tételezünk fel. Dependent variable: amount, Method: Exponential Smoothing, Criteria: Model Type Nonseasonal:  Simple. A Statistics és Plots füleknél a megadott összes lehetőség fakkját pipáljuk ki: , (OK).

Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Az  paraméterre (ebben a modellben ez az egyetlen paraméter) a becslés 0,802-re adódott. Ez azt jelenti, hogy az X t érték becsléséhez a hozzá közeli értékeket, tehát X t-1 X t-2 -őt kell a legnagyobb súllyal figyelembe venni a becslő sor előállításakor.

A hibatagok ACF és PACF értékeire egy grafikont is kapunk, amiről leolvasható, hogy az értékek a tűréshatáron belül esnek. Nyomtatók napi energia-felvételét tartalmazó idősor elemzése

Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Az eredeti és a becsült idősorok együttes ábrája a konfidencia sávval együtt:

Ellenőrizzük le a maradéksort is! Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Látható, hogy sem trend, sem szezonális hatás nem érzékelhető, vagyis megszemlélés alapján fehérzajnak látszik. A normalitást ellenőrző P-P grafikon pontjai gyakorlatilag az átló mentén helyezkednek el,

Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Alkalmazzuk előrejelzésre a modellünket! Az  =0,802 beállítás mellett, a napokra kérjünk előrejelzést! Ehhez még egyszer le kell futtatni a modellt, de most a következő plusz beállításokat is tegyük meg: Save/Variables  Predicted values, Options:  First case after end of estimation period through a specified date, Date: observation 180. Ennek hatására keletkezik egy új változó (neve: Predicted_amount_Model_1), ami a modell előrelelzett értékeit tartalmazza, de az esetszám nem 149 lesz, hanem 180.

Rajzoltassuk ki az eredeti (amount) és az előre jelzett (Predicted_amount_Model_1) idősorokat a Analyze/Forecasting/Sequence Charts… paranccsal: Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Látható, hogy a jövőre vonatkozó előrejelzés egy konstans, hiszen a modellünkben sem trend, sem szezonális hatás nem szerepelt. Az alkalmazott modellben a becsült idősor lényegében az analizált idősor két nappal előre történő eltoltja lett. A maradéksor szórása elég jelentős (kb. kétharmada az eredeti sor szórásának), ami arra utal, hogy a becslés még nem magyarázza elég jól a jelenséget, azaz a predikció nem tűnik elég megbízhatónak.