STATISZTIKA II. 12. Előadás

Slides:



Advertisements
Hasonló előadás
Készítette: Kosztyán Zsolt Tibor
Advertisements

Készítette: Kosztyán Zsolt Tibor
I. előadás.
Kvantitatív Módszerek
2006. február 17. Valószínűségszámítás és statisztika II. Telefonos feladat Egy kalapban van két korong, az egyiknek mindkét oldala piros, a másiknak.
Előadó: Prof. Dr. Besenyei Lajos
Statisztika I. VI. Dr. Szalka Éva, Ph.D..
Gazdaságelemzési és Statisztikai Tanszék
Gazdasági informatika
MI 2003/ A következőkben más megközelítés: nem közvetlenül az eloszlásokból indulunk ki, hanem a diszkriminancia függvényeket keressük. Legegyszerűbb:
Műveletek logaritmussal
Gazdaságelemzési és Statisztikai Tanszék
Számítógépes algebrai problémák a geodéziában
Regresszió számítás Mérnöki létesítmények ellenőrzése, terveknek megfelelése Geodéziai mérések – pontok helyzete, pontszerű információ Lineáris regresszió.
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Földrajzi összefüggések elemzése
Gazdaságelemzési és Statisztikai Tanszék
Gazdaságelemzési és Statisztikai Tanszék
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. X. Dr. Szalka Éva, Ph.D..
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
A középérték mérőszámai
KÖZMŰ INFORMATIKA NUMERIKUS MÓDSZEREK I.
Regresszióanalízis 10. gyakorlat.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Dinamikai rendszerek kaotikus viselkedése
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
STATISZTIKA II. 11. Előadás
STATISZTIKA II. 3. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
STATISZTIKA II. 7. Előadás
Exponenciális egyenletek
Idősor elemzés.
Idősor komponensei Trend vagy alapirányzat: az idősor alakulásának fő irányát mutatja meg. Szezonális vagy idényszerű ingadozás: szabályos időszakonként.
Statisztika.
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapsokaság (populáció)
Lineáris regresszió.
Adatleírás.
Két kvantitatív változó kapcsolatának vizsgálata
Gépészmérnöki kar BSc Levelező képzés szeptember-október
I. előadás.
Számtani és mértani közép
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Valószínűségszámítás II.
Többdimenziós valószínűségi eloszlások
Hibaszámítás Gräff József 2014 MechatrSzim.
Előrejelzés Összeállította: Sójáné Dux Ágnes. Előrejelzés Az időbeli folyamatok elemzésének segítségével lehetőség nyílik a korábban láthatatlan trendek.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
Leíró statisztika gyakorló feladatok október 15.
Haladó Pénzügyek Vezetés szervezés MSC I. évfolyam I
Gazdaságstatisztika Konzultáció a korreláció- és regressziószámítás, idősorok elemzése témakörökből.
I. Előadás bgk. uni-obuda
Dr. Varga Beatrix egyetemi docens
Trendelemzés előadó: Ketskeméty László
Haladó Pénzügyek Vezetés szervezés MSC I. évfolyam I
Adatfeldolgozási ismeretek műszeres analitikus technikusok számára
Rangsoroláson és pontozáson alapuló komplex mutatók
Dr. Varga Beatrix egyetemi docens
Előadás másolata:

STATISZTIKA II. 12. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék

Exponenciális trend számítása A társadalmi-gazdasági jelenségek esetén gyakoriak a lineáristól eltérő alaptendenciát tartalmazó idősorok. Ezek leggyakrabban lehetnek: exponenciális, logisztikus, polinomiális típusúak. Kiemelkedő jelentőségű az exponenciális trend, mivel az azonos ütemben történő növekedés (csökkenés) gyakori a társadalmi-gazdasági idősorok esetén. Pl. A gazdasági növekedés makromutatóinak egy része, a demográfiában a népesség nagyságának alakulása, inflációs időkben a folyóáras mutatók (behatárolt időintervallumban).

Exponenciális trend számítása Alapmodellünk a következő: Ahol a véletlen tényező 1 körül ingadozik. Az exponenciális trend paramétereit is a legkisebb négyzetek módszerével becsüljük. Számítógép nélküli számításoknál egyszerű transzformációt alkalmaztak. Mindkét oldal logaritmusát véve kapható, ahonnan az helyettesítéseket elvégezve a egyenlet adódik, amely lényegében megegyezik a lineáris trendegyenlettel.

Exponenciális trend számítása Ezért a paraméterek becslései ugyanúgy számíthatók, mint lineáris esetben. ismeretében a logaritmus-transzformációt visszafelé alkalmazva kaphatók meg értékei: A számítógépes programcsomagok az eredeti adatok legkisebb négyzetes becslését is könnyen megadják. De a két becslés egymástól eltérő eredményt ad, és bár az eredeti (nem transzformált) alakra végzett becslés a pontosabb, mégis kényelmi okokból gyakran használjuk a linearizált alakon alapuló becslést, ami nem okoz számottevő torzítást.

Illesszünk exponenciális trendet a magyarországi pamutszövet-termelés idősorára linearizálással (Excelben) és nemlineáris legkisebb négyzetek becslésével (SPSS-ben)!

Exponenciális trend számítása A két különböző becsléssel az alábbi, egymástól eltérő eredményeket kaptuk: Linearizált becslés: Nemlineáris becslés: A függvények paraméterei eltérnek egymástól, de az illesztett trendértékek közel állnak egymáshoz. A fontosabb paraméterek kétféle becslése egymáshoz közeli érték.

Exponenciális trend számítása A paraméter a t=0 időpontban/időszakban adja meg eredeti mértékegységben a trendfüggvény értékét, míg a a trend szerinti növekedési ütemet adja meg eredeti mértékegységtől függetlenül, többnyire %-os formában. Ezt az állítást igazolja, ha a becsült trendegyenletben t helyére t+1-et írva két egymást követő trendérték hányadosát képezzük: A paraméter tehát tartalmilag hasonló az mutatóhoz, de számításához a teljes idősort felhasználjuk, ezért jobban mutatja az átlagos tendenciát és kevésbé érzékeny az idősor elején és végén álló értékekre.

A magyarországi pamutszövet-termelés idősora és exponenciális trendje Millió m2 évek sorszáma

növekvő – csökkenő ütemű trend esetén használjuk A paraméter értékének és az exponenciális trend alakjának összefüggése növekvő – csökkenő ütemű trend esetén használjuk A paraméter értéke adja meg az exponenciális trendfüggvény alakját:

Alkalmazottak havi bruttó keresetének alakulása Magyarországon 1980 és 2005 között Jellemezzük az idősort exponenciális trenddel, becsüljük, értelmezzük a paramétereit, és készítsünk előrejelzést 2001-re és 2006-ra!

Alkalmazottak havi bruttó keresetének alakulása Magyarországon 1980 és 2005 között ezer Ft évek sorszáma

Exponenciális trend számítása A becslések elvégzéséhez az adatokat logaritmáljuk, a t változót 1980-ban 1-gyel indítjuk. A számításokat a linearizált forma alapján számítógépen több módon is elvégeztük : normál egyenletek, adatelemzés/regresszió, trendvonal beszúrása (eredeti adatokra).

Exponenciális trend becslése a normálegyenletek megoldásával

Az alkalmazottak havi bruttó keresetének exponenciális trendje

Exponenciális trend számítása A kerekített eredmények: Így a becsült trendegyenlet: A 2,52 paraméter azt jelenti, hogy t=0-nál, azaz 1979-ben az átlagkereset trend szerinti értéke 2,52 ezer Ft lett volna, míg a jelentése az, hogy a trend szerint a nominális átlagkeresetek évi átlagában több mint 1,18-szorosukra, azaz 18 %-kal nőttek a vizsgált időszakban.

Exponenciális trend számítása A trend bármely becsült értékét megkaphatjuk, ha a becsült trendegyenletbe a megfelelő t értékeket behelyettesítjük. Így pl. 2001-ben t=22 és a becsült trendérték: Ez esetben a véletlen hatást vagy a vagy az e2001=103,6 – 97,02 =6,58 ezer Ft maradékkal jellemezhetjük. Az illeszkedés pontosságát az mutatóval jellemezzük, melynek négyzetgyöke (7,36 ezer Ft) azt mutatja, hogy a vizsgált időszakban a trendérték körül mekkora volt a véletlen eltérések átlaga. Reziduális variancia

Exponenciális trend számítása Előrejelzés esetén szintén a becsült trendegyenletbe kell helyettesíteni a megfelelő t értéket. Mivel 2006-ra t=27, így az előrejelzés Azt, hogy ez a tendencia, amire az előrejelzésünket építjük, folytatódhat-e a további években, alapos szakmai elemzésnek kell alávetni!!!!!!!

Egyéb nemlineáris trendek A lineáris és exponenciális függvény mellett más típusú függvények is használhatók trendfüggvényként. A gyakorlatban kiemelkedő jelentősége van azoknak a függvényeknek, amelyek telítődési folyamatokat írnak le. A valóságban az exponenciális növekedés gyakran korlátokba ütközik, lelassul, és elveszti exponenciális jellegét. A rövid távon exponenciális jelleget mutató folyamatok ezért hosszabb távon gyakran ún. S görbe alakú korlátos növekedési folyamattá válnak. Valamely folyamat kezdetben (amikor még messze van természetes korlátjától) gyorsuló módon, exponenciális függvény szerint nő, majd ahogy közelít a korláthoz (telítettségi szinthez), úgy lassul le a növekedés.

Egyéb nemlineáris trendek Ilyen tendenciát követ sok szaporodási folyamat, bizonyos fertőző betegségeken átesettek száma egy járványban (H1N1), a háztartások tulajdonában lévő tartós fogyasztási cikkek állománya, bizonyos divatok elterjedése stb. A közgazdaságtanban egy sor folyamat esetében bizonyos szint felett a csökkenő hozadék jelentkezik. Ebben az esetben a legelterjedtebb a logisztikus függvény alkalmazása, de használják még az ún. Gompertz- valamint a Johnston-görbéket is.(Ezek összetett exponenciális függvények, több paraméterrel, amelyek becslése elég nehéz feladat.)

Egyéb nemlineáris trendek A logisztikus függvény egyenlete a következő: ahol k az ún. telítődési paraméter, a egy helyzetparaméter, b pedig alakparaméter. A három paraméter megfelelő rugalmasságot biztosít a függvénynek, hiszen igen sok különböző alakú folyamat leírására alkalmasak. Egyedül a k-nak van jól megragadható tárgyi értelme: ez azt a felső korlátot jelenti, amelyhez aszimptotikusan tart a függvény. A másik két paraméter közvetlenül nehezen értelmezhető: az a paraméter a vízszintes tengelyen való eltolást vezérli, b pedig azt mutatja meg, hogy mennyire meredek a görbe. Maga a függvény lassú növekedés után egyre gyorsuló ütemben nő, majd elérve az inflexiós pontot konkáv szakaszba megy át, és monoton növekvően ugyan, de egyre lassuló ütemben tart a felső korláthoz.

Példa logisztikus trendre A mobiltelefon elterjedése napjainkban: lassú kezdés után az állomány egyre gyorsuló ütemben kezdett felfutni, majd az utóbbi években, amikor a telítettség jelei mutatkoztak, az előfizetések száma egyre csökkenő ütemben nőtt. Ez a jelenség logisztikus függvénnyel jól leírható, de a függvény paramétereinek becslése nem egyszerű. Az eljárásnál a felsőkorlátot kívülről adtuk meg (10 000 ezer fő, ami nagyjából a lakosság száma), majd transzformációkkal lineáris trendszámításra vezettük vissza a feladatot a következő módon (a maradéktagot elhagyva): Ha ismerjük a k-t, a bal oldal az adatokból kiszámítható, és már csak egy lineáris trend ln a és b paramétereit kell meghatározni

Mobiltelefonok előfizetőinek száma Magyarországon 1990-2005 években Ezer fő Évek sorszáma

Mobiltelefonok előfizetőinek száma A CD. 5_07 feladata

Logisztikus trend számítása

Polinomiális trend számítása Nem kapcsolható semmilyen társadalmi-gazdasági folyamathoz, de sok nemlineáris folyamat időbeli lefutásának közelítő leírására alkalmas. A t időváltozó p-ed fokú polinomja: és a maradékváltozó továbbra is 0 körül ingadozik. Az ismeretlen paraméterek becslésére most is a legkisebb négyzetek módszerét használjuk, de ez most egy p+1 egyenletből álló lineáris egyenletrendszer megoldását igényli, ami számítógéppel könnyen elvégezhető.

Polinomiális trend számítása A függvény paraméterei közvetlenül nem értelmezhetők. Az előrejelzés erősen függ a p megválasztásától – önkényes elem jelentősége!!!! A polinomok tulajdonsága, hogy p+1 pont (megfigyelés) egyértelműen meghatároz egy p-edfokú polinomot, ha p-t elég nagyra választjuk, akkor a véletlent reprezentáló et változót akár teljesen el is tüntethetjük. A p növelésével monoton csökkenthető a reziduális variancia – alkalmazás veszélye!!!!

Polinomiális trend számítása A polinomiális trend alkalmazásának szabályai: Fokozott figyelemmel elemezzük a megfigyeléseken kívüli információkat, szakmai ismereteket, amelyek alapján a függvény alakját, főbb jellemzőit előre valószínűsíthetjük (pl. lehetnek-e fordulópontok a folyamatban, indokolt-e az egymást követő növekvő, ill. csökkenő szakaszokat tartós tendenciának tekinteni). Ne használjunk túl magas fokszámú polinomot!!! (p=2 vagy p=3) Az előrejelzéseknél vizsgáljuk, hogy reális lehet-e azok iránya, nagysága. Ne hasonlítsunk össze különböző fokszámhoz tartozó reziduális varianciákat, mert az félrevezető!!!!

Polinomiális trend számítása Az eltérő fokszámú polinomok illeszkedését a szabadságfokkal korrigált reziduális varianciával hasonlíthatjuk össze: Ahol ez a mutató a legkisebb értéket adja, ott (olyan p fokszám mellett) az illeszkedés a legjobbnak tekinthető. De vegyük figyelembe a polinomok alkalmazásának szabályait!!!!!

A trendfüggvények illesztésénél mindig figyelembe kell venni: A trendfüggvény önmagában semmit sem magyaráz. A magyarázatot a trendfüggvényen kívül, a szakmai ismeretekben kell keresni, így a trendfüggvény megválasztásában is elsősorban a szakmai ismeretekre kell támaszkodni.

Egyszerű mozgó átlagok Az analitikus trendszámítás mellett a leggyakrabban alkalmazott simító és szűrő eljárás a mozgó átlagolás. Lényege, hogy az idősor elemeinek környezetében lévő elemek átlagával közelítjük a megfelelő elemeket. A legegyszerűbb esetben, ha csak a t-edik elemet megelőző és követő értékeket vesszük figyelembe, akkor a mozgóátlagolású trend az formulából adódik. Ez esetben 3 tagból számítunk átlagot minden lehetséges t-re (t=2,3,…,n-1), így 3 tagú mozgó átlagról beszélünk.

Egyszerű mozgó átlagok A mozgó átlagokból mindig kevesebb van, mint a megfigyelt adatokból, mivel az idősor elejére és végére nem lehet a számításokat elvégezni. Háromtagú mozgó átlagok számítása:

Egyszerű mozgó átlagok Általában nem 3, hanem m tagból számítanak mozgó átlagot. Ha m páratlan, akkor felírható m=2k+1 alakban, és ekkor a mozgó átlagolású trend számításának általános képlete: ahol kell hogy fennálljon. A megfigyelt értékek egyszerű számtani átlagát számítjuk ki. (A példában m=3 és k=1 volt.) Az idősor elején és végén lévő egyaránt k számú időszakra nem tudunk mozgó átlagot készíteni. Így a rövidülés mértéke 2k=m–1.

Egyszerű mozgó átlagok Ha m páros, akkor m=2k, és ekkor egyszerű számtani átlag segítségével nem tudjuk azt biztosítani, hogy yt-k előtt és után azonos számú tag szerepeljen az átlagolásban. Speciális súlyozott számtani átlagot használunk mozgó átlagolásra. Az alkalmazandó formula: Ebben az esetben fenn kell állnia a egyenlőtlenségeknek, így a „rövidülés” ez esetben 2k=m. A mozgóátlagolású trendet az első és az utolsó k elemre nem tudjuk kiszámítani.

Egyszerű mozgó átlagok Ez a két formula a lehető legegyszerűbb mozgó átlagolású trendet határozza meg. A mozgó átlagolás lényege a kisimításban van: az átlagszámítással csökkentjük a véletlen tag szerepét, ugyanakkor a t mozgatásával biztosítjuk az alaptendencia megmaradását. m növelésével egyre csökken a véletlen szerepe, ugyanakkor egyre rövidebb lesz a trend, így a tendencia felismerése is egyre nehezebb lesz.

A kukorica termésmennyisége - mozgó átlagolás

A kukorica termésmennyisége - mozgó átlagolás ezer tonna 1994 mélypont évek sorszáma

További simító eljárások és szűrők A szimmetrikus mozgó átlag az egyes megfigyelésekhez azonos súlyokat rendel és középre van igazítva. Súlyok azonosak legyenek-e??? középső súly nagyobb - kiemeli a mindenkori értéket a középső súly kicsi - a simítás erősebb Nem szimmetrikus mozgó átlagok: csak a folyó és a késleltetett értékeket használják fel (jövőbeli értéket nem). Szimmetrikus súlyrendszert nem lehet használni, de a jelenhez közelálló értékeket nagyobb, a távoli múlt megfigyeléseit kisebb súllyal használják fel a simítás során.

További simító eljárások és szűrők Nem szimmetrikus mozgó átlagok folytatás A legegyszerűbb súlyrendszer a lineárisan csökkenő, azaz a folyóérték kapja a legnagyobb súlyt, az egy időszakkal késleltetett kisebbet, a két időszakkal későbbi ugyanennyivel kisebbet, stb. A súlyok összegének 1-et kell adnia!!!! Háromtagú mozgó átlag esetén a következő lineárisan csökkenő súlyrendszer adódik: Ez a mozgó átlagolás simít és tovább viszi az idősor tendenciáit is. Mekkora legyen a mozgó átlag tagszáma (m)?

További simító eljárások és szűrők Itt is a nagyobb tagszám jobban simít, de a simított sor az elején rövidül le, azaz csak a múltbeli megfigyelésekhez nem tudunk simított értéket rendelni. Ez az előnye a szimmetrikus súlyozáshoz képest. A gyakorlatban nem a lineáris súlyozás terjedt el, hanem az amikor a súlyok exponenciálisan, azaz azonos ütemben csökkennek. Ekkor az eddig bemutatott háromtagú mozgó átlagolás a következő: ahol 0<α<1 az ún. simító konstans.

Exponenciális simítás súlyai α=0,5 esetén Látható, hogy a súlyok exponenciálisan csökkenek és az összegük 1. Az ábra az α=0,5 és 4 késleltetés esetét mutatja be. Súly 0,5 Késleltetés (időszak) 1 2 3 4

Exponenciális simítás Ha α-nak kis értéket adunk, akkor a simítás erős lesz, ha nagyot (1-hez közelit), akkor gyenge lesz a simítás. Így tudjuk szabályozni, vezérelni a konstanssal a simítás mértékét. Az exponenciális simítás népszerűségének oka az, hogy a simított érték a folyó megfigyelés és a megelőző időszak simított értékének súlyozott átlaga!!! Ennek levezetése végtelen tag felhasználása esetén: A nevezőben egy végtelen mértani sor van, melynek összege

Exponenciális simítás azaz Ha a t időpont helyett most t+1-re írjuk fel a formulát, azt kapjuk, hogy A súlyok: a simító konstans, ill. annak komplementere. Jól látható, hogy ha a simító konstans nagy (közel 1), akkor a simítás közel az eredeti sort adja vissza, ha viszont kicsi, akkor erősen simít. Ez a formula egy egyszerű módosítással előrejelzésre is alkalmas – ezért is olyan népszerű.

A HUF/EUR árfolyam - exponenciális simítás α =0,5

α =0,5

A HUF/EUR árfolyam - exponenciális simítás α =0,1

α =0,1

A HUF/EUR árfolyam - exponenciális simítás α =0,9

α =0,9