Alapfogalmak Matematikai Statisztika

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Kvantitatív módszerek
Az időjárás előrejelzése
Kvantitatív Módszerek
Előadó: Prof. Dr. Besenyei Lajos
Összetett kísérleti tervek és kiértékelésük
Kvantitatív módszerek
Robotika Helymeghatározás.
Híranyagok tömörítése
Mintavételi gyakoriság megválasztása
Exponenciális szűrések Statisztika II. VEGTGAM22S.
Matematikai Statisztika VIK Doktori Iskola
Földrajzi összefüggések elemzése
Lineáris és nemlineáris regressziók, logisztikus regresszió
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Statisztika II. X. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója Takács György 4. előadás
Adaptív jelfeldolgozás Rádiócsatorna kiegyenlítése
Gazdálkodási modul Gazdaságtudományi ismeretek I. Közgazdaságtan KÖRNYEZETGAZDÁLKODÁSI MÉRNÖKI MSc TERMÉSZETVÉDELMI MÉRNÖKI MSc.
Regresszióanalízis 10. gyakorlat.
Nem-paraméteres eljárások, több csoport összehasonlítása
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Kvantitatív módszerek
Kvantitatív módszerek
Kvantitatív módszerek
Budapesti Műszaki és Gazdaságtudományi Egyetem
Rendszerek sajátfüggvényei és azok tulajdonságai Folytonos (FT) rendszerekkel foglalkozunk,de az eredmények átvihetők diszkrét rendszerekre is. kt)kt)
Egytényezős variancia-analízis
STATISZTIKA II. 11. Előadás
Idősor komponensei Trend vagy alapirányzat: az idősor alakulásának fő irányát mutatja meg. Szezonális vagy idényszerű ingadozás: szabályos időszakonként.
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Idősorok elemzése Determinisztikus és sztochasztikus komponensek, előrejelzés autoregresszív modellel Forrás: Hidrológia II HEFOP oktatási segédanyag (
Modellek besorolása …származtatás alapján: 1.Determinisztikus fizika (más tudományág) alaptörvényeire, igazolt összefüggésere alapulfizika (más tudományág)
Többváltozós adatelemzés
Következtető statisztika 9.
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapfogalmak.
Lineáris regresszió.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Mintavételi hiba, hibaszámítás
Idősorok elemzése Dr. Varga Beatrix.
Kvantitatív módszerek
Előrejelzés Összeállította: Sójáné Dux Ágnes. Előrejelzés Az időbeli folyamatok elemzésének segítségével lehetőség nyílik a korábban láthatatlan trendek.
Félévközi követelmények HMV hőigények meghatározása Rendszerkialakítások Vízellátás, csatornázás, gázellátás Épületgépészeti és Gépészeti Eljárástechnika.
Manhertz Gábor; Raj Levente Tanársegéd; Tanszéki mérnök Budapesti Műszaki és Gazdaságtudományi Egyetem Mechatronika, Optika és Gépészeti Informatika Tanszék.
Kvantitatív módszerek
Gazdaságstatisztika Idősorok elemzése.
Adaptív jelfeldolgozás Rádiócsatorna kiegyenlítése
Előrejelzés.
Készült a HEFOP P /1.0 projekt keretében
Gazdaságstatisztika Konzultáció a korreláció- és regressziószámítás, idősorok elemzése témakörökből.
Trendelemzés előadó: Ketskeméty László
A Box-Jenkins féle modellek
Gazdaságinformatikus MSc
Valószínűségi változók együttes eloszlása
Valószínűségi törvények
Gazdaságinformatikus MSc
Többdimenziós normális eloszlás
Statisztika II. VEGTGAM22S
A Box-Jenkins féle modellek
Acf, pacf, arima, arfima.
Dr. Varga Beatrix egyetemi docens
Előadás másolata:

Alapfogalmak Matematikai Statisztika előadó: Ketskeméty László kela@cs.bme.hu Matematikai Statisztika Gazdaságinformatikus szak, MSc képzés Kötelezően választható tantárgy

A sztochasztikus folyamat 2018.11.11. Ketskeméty László: Statisztika II.

A sztochasztikus folyamat 2018.11.11. Ketskeméty László: Statisztika II.

Ketskeméty László: Statisztika II. Jellemzők 2018.11.11. Ketskeméty László: Statisztika II.

Ketskeméty László: Statisztika II. Jellemzők Parciális autokorrelációs függvény (PACF): 2018.11.11. Ketskeméty László: Statisztika II.

Ketskeméty László: Statisztika II. Jellemzők keresztkovariancia függvény (CVF) keresztkorrelációs függvény (CCF) 2018.11.11. Ketskeméty László: Statisztika II.

Ketskeméty László: Statisztika II. Xt és Yt autokorrelációs és keresztkorrelációs együtthatóinak szemléltetése t t+k t-k Xt Yt rXX(k) ccfXY(-k)= ccfYX(k) ccfXY(k) rYY(k) 2018.11.11. Ketskeméty László: Statisztika II.

Ketskeméty László: Statisztika II. Gyenge stacionaritás 2018.11.11. Ketskeméty László: Statisztika II.

Ketskeméty László: Statisztika II. Erős stacionaritás Az N-dimenziós eloszlások nem függenek a paraméter helyétől, hanem csak azok egymáshoz viszonyított helyzetétől. Az eloszlások a paraméterek eloszlásával szemben invariánsak. erős stacionaritás  gyenge stacionatritás 2018.11.11. Ketskeméty László: Statisztika II.

Néhány fontosabb sztochasztikus folyamat Ha a komponensek nemcsak korrelálatlanok, hanem függetlenek is, akkor független vagy tiszta fehér zajról beszélünk. Amennyiben a komponensek normális eloszlásúak is, akkor a fehér zaj Gaussi vagy normális is. 2018.11.11. Ketskeméty László: Statisztika II.

Néhány fontosabb sztochasztikus folyamat ARIMA(0,0,q)=MA(q) modellek: Gaussi tiszta fehérzaj folyamat, azaz teljesen független, normális eloszlású változók sorozata ahol A mozgóátlag a folyamat egy fehérzaj folyamat elemeinek lineáris kombinációjaként áll elő. Xt és Xt-1 q-1 változóban közös. Az MA(q) folyamat együtthatói a b0 ,b1 ,…,bq . 2018.11.11. Ketskeméty László: Statisztika II.

Néhány fontosabb sztochasztikus folyamat Autoregresszív folyamatok ARIMA(p,0,0)=AR(p) Az autoregresszív folyamat a megelőző p megfigyelt érték lineáris kombinációja és egy független et hiba összegeként regresszálódik. Az AR(p) folyamat együtthatói az a1 ,…,ap ,  . 2018.11.11. Ketskeméty László: Statisztika II.

Néhány fontosabb sztochasztikus folyamat Általános autoregresszív és mozgóátlag folyamatok, ARIMA(p,0,q)=ARMA(p,q) Integrált autoregresszív és mozgóátlag folyamatok, ARIMA(p,d,q) modellek: A d-edik deriváltsor ARMA(p,q) sor első deriváltsor második deriváltsor Stb. 2018.11.11. Ketskeméty László: Statisztika II.

Ketskeméty László: Statisztika II. A legáltalánosabb esetben még szezonalitás is van, ekkor a jelölés: ARIMA(p,d,q)(P,D,Q) Az általános formulában P a szezonális autoregresszió rendje, Q a szezonális mozgóátlag rendje, D pedig a szezonális differenciálás foka, amelyek mind az s hosszúságú szezonalitás egész számú többszöröseiként értendők. Pl. Egy s hosszúságú szezonalitást tartalmazó idősor szezonális differenciálásának a definíciója: dYt = Yt – Yt-s A deriválás célja itt is az, hogy az idősort stacionerré tegyük: az eredeti idősor derivált sora így lesz ARMA típusú. 2018.11.11. Ketskeméty László: Statisztika II.

Ketskeméty László: Statisztika II. AR(4) MA(4) ARMA(4,4) AR(6) ARIMA(6,1,0) ARIMA(2,1,0) 2018.11.11. Ketskeméty László: Statisztika II.

Néhány fontosabb sztochasztikus folyamat Markov-folyamat 2018.11.11. Ketskeméty László: Statisztika II.

Néhány fontosabb sztochasztikus folyamat Harmonikus folyamat 2018.11.11. Ketskeméty László: Statisztika II.

Néhány fontosabb sztochasztikus folyamat Gauss-folyamat 2018.11.11. Ketskeméty László: Statisztika II.

Az idősorok alkalmazásai Előrejelzés, predikció vagy extrapoláció Célunk, hogy a múltbeli lefolyás alapján a folyamat jövőbeli lefolyását szabályozott pontossággal megbecsüljük. 2018.11.11. Ketskeméty László: Statisztika II.

Az idősorok alkalmazásai Adatpótlás, interpoláció Ilyenkor az a feladat, hogy az idősor adott időléptékű realizációja alapján „köztes” időpontokban becsüljük meg a lehetséges értékeket. Például egy hiányzó hőmérsékleti adatot egy idősorban, vagy napi adatsorban a „délelőtti” (félnapi) adatokat. 2018.11.11. Ketskeméty László: Statisztika II.

Az idősorok alkalmazásai Folyamatszabályozás Ilyenkor a vizsgált idősor egy most éppen zajló gyártási folyamat adatait tartalmazza. Célunk, hogy kontrolláljuk a folyamatot, ellenőrizzük, hogy minden szabályosan történik, vagy be kell-e avatkoznunk. 2018.11.11. Ketskeméty László: Statisztika II.

Ketskeméty László: Statisztika II. Az idősorok modelljei Determinisztikus modellek Simító eljárások, exponenciális szűrések Spektrálfelbontás Box-Jenkins modellezés 2018.11.11. Ketskeméty László: Statisztika II.

Az idősorok modelljei I. Dekompozíciós vagy determinisztikus modellek MULTIPLIKATÍV MODELL A ciklikus hatás ADDITÍV MODELL A trendfüggvény A szezonális hatás A zaj (hibatag) 2018.11.11. Ketskeméty László: Statisztika II.

Dekompozíciós (determinisztikus) modellek I. X1, X2, …, Xt, …, XN Az idősor adatok Xt = Tt + St + Ct + Zt t = 1, 2, …, N (additív modell) A hosszútávú tendenciát kifejező, a teljes időtartományon megmutatkozó hatás Tt A trendfüggvény St Rövidebb ismétlődő periódusokban jelentkező hatás A szezonális hatás Hosszabb, szabálytalanul ismétlődő ciklikus hatás Ct A ciklikus hatás Zt A zaj A mérési hibatag: fehér zaj (0 várhatóértékű, kis szórású) 2018.11.11. Ketskeméty László: Statisztika II.

Dekompozíciós (determinisztikus) modellek I. X1, X2, …, Xt, …, XN Az idősor adatok Xt = Tt * St *Ct * Zt t = 1, 2, …, N (multiplikatív modell) A hosszútávú tendenciát kifejező, a teljes időtartományon megmutatkozó hatás Tt A trendfüggvény St Rövidebb ismétlődő periódusokban jelentkező hatás A szezonális hatás Hosszabb, szabálytalanul ismétlődő ciklikus hatás Ct A ciklikus hatás Zt A zaj A mérési hibatag: fehér zaj (1 várhatóértékű, kis szórású) 2018.11.11. Ketskeméty László: Statisztika II.

Az idősorok modelljei II. Simító eljárások (exponenciális szűrés) A simító eljárások a sztochasztikus modellezésnél egyszerűbb, áttekinthetőbb modelleket állítanak fel. A determinisztikus modellezésnél jobban figyelembe veszik az idősor véletlen jellegét, belső összefüggéseit. Ugyanakkor a „valódi” sztochasztikus modellezésnél egyszerűbb, áttekinthetőbb modelleket állítanak fel. Egyfajta „közbenső” pontosságú és komplexitású modell-családot alkotnak. Ez a modell-család onnan kapta a nevét, hogy az idősor t-edik elemét a múltbeli elemek exponenciálisan csökkenő súlyokkal vett lineáris kombinációjával becsüli. 2018.11.11. Ketskeméty László: Statisztika II.

Az idősorok modelljei III. Sztochasztikus modellek (ARIMA-modellek ) A legárnyaltabb, legösszetettebb elemzés a Box és Jenkins által kidolgozott ARIMA-modellekben lehetséges. Az ARIMA-modellek feltételeznek az idősor adatai között meglévő, valamilyen belső sztochasztikus koherenciát, ami tartósan megvan, kimutatható, és feltehetőleg a jövőbeni lefolyás során is jelen lesz. 2018.11.11. Ketskeméty László: Statisztika II.

Az idősorok modelljei III. Sztochasztikus modellek (ARIMA-modellek ) A legárnyaltabb, legösszetettebb elemzés a Box és Jenkins által kidolgozott ARIMA modellekben lehetséges. Az ARIMA modellek az idősor adatai között valamilyen meglévő, belső sztochasztikus koherenciát feltételeznek, ami tartósan megvan, kimutatható, és feltehetőleg a jövőbeni lefolyás során is jelen lesz. Ha ezt a belső koherenciát sikerül azonosítani, az ennek alapján felállított ARIMA modell igen pontos előrejelzéseket képes adni. 2018.11.11. Ketskeméty László: Statisztika II.

Az idősorok modelljei III. Sztochasztikus modellek (ARIMA-modellek ) Az ARIMA modellek lényege, hogy az időben lejátszódó folyamatokat saját korábbi értékeik, valamint a véletlen hatások (zajok) függvényeként írják le, meghatározó szerepet biztosítva ezzel a véletlen és a tehetetlenség folyamatalkotó szerepének. Elsősorban a folyamatokban meglévő rövidtávú ingadozások leírására és előrejelzésére alkalmasak. Mivel az egyes időpontokra gyakran csak egy-egy megfigyelés - a megfigyelt idősor - áll rendelkezésre, a változókra nézve korlátozó feltételezéseket kell bevezetni. Ilyen feltételezés a stacioneritás: E(Xt), Var(Xt) és Cov(Xt, Xt-k) időbeli állandósága (a folyamat csak akkor stabil, ha „időinvariáns”). 2018.11.11. Ketskeméty László: Statisztika II.

Az idősorok modelljei III. Sztochasztikus modellek (ARIMA-modellek ) Az ARIMA betűszó egy rövidítés: ARIMA = AutoRegressive Integrated Moving Averages Az AR (AutoRegressive) modell szerint az Xt idősor t időpontbeli értékét a múltbeli idősor értékek súlyozott összege (lineáris kombinációja) és egy korrelálatlan hibatag összege adja meg. Az MA (Moving Averages) modell szerint az Xt idősor t időpontbeli értéke a múltbeli fehérzaj értékek súlyozott összegeként (lineáris kombinációjaként) állítható elő. Az I (Integrated) modellt akkor alkalmazzuk, ha az Xt idősor nem stacioner, de véges számú deriválással azzá tehető. Tipikusan ez a helyzet, ha az idősor kumulatív hatásokat tükröz. Pl. a raktárkészletet nem határozzák meg egyetlen időszak beszerzései és eladásai, ezek csupán a raktárkészlet változásait határozzák meg. 2018.11.11. Ketskeméty László: Statisztika II.

Alkalmazási területek Közgazdaságtan Természettudományok Meteorológia Orvostudomány Szociológia Pszichológia Biztosítás Ipar, gépgyártás 2018.11.11. Ketskeméty László: Statisztika II.

Alkalmazási területek Idősorelemzések gyakorlati alkalmazásai: meteorológiai adatok (pl. napi átlaghőmérsékletek, csapadékmennyiségek, napsütéses órák száma, UV sugárzás intenzitása, etc.), gazdasági adatok (pl. éves GDP, adósságállomány, acélgyártás, búzatermelés, napi tőzsdeindexek, etc.), mezőgazdasági adatok (pl. éves búzatermelés, bortermelés, megművelt földterület, etc.), egészségügyi adatok (pl. bizonyos új megbetegedések napi száma, új AIDS fertőzöttek évi száma, etc.), munkapszichológiai adatok (pl. munkahelyi emberi hibák, balesetek napi száma, éves fluktuáció, etc.), biológiai jelek, mintázatok (pl. EKG, EEG, EMG, PET, fMRI, etc.), etc. mérési adatok elemzése, feldolgozása. 2018.11.11. Ketskeméty László: Statisztika II.