Üzleti tervezés statisztikai alapjai 2.hét Üzleti tervezés statisztikai alapjai
Idősorok elemzése Az idősorok elemzésének egyszerűbb eszközei: Számtani átlag Kronologikus átlag Dinamikus viszonyszám Átlagos abszolút eltérés Átlagos relatív eltérés
Idősorok grafikus ábrázolása Grafikus ábrázolás: Az idősorok alaptendenciáinak tömör, áttekintő jellemzése. Fő típusai: Állapotidősorok: az időbeli ismérv értékei egy-egy időponthoz tartoznak ezért célszerű ábrázolásuk egy-egy pont. Az állapotidősor javasolt ábrája a pontdiagram. Tartamidősorok: a vízszintes tengelyen elvben intervallumok szerepelnek, a jelenséget pedig célszerű ezen intervallumok fölé rajzolt oszlopokkal (téglalapokkal) bemutatni.
Az idősorok komponenseinek elkülönítése A jelenségek fejlődése, alakulása, és így az azoknak megfelelő idősor számos tényező együttes hatásának az eredménye. Az egy-egy jelenség változását befolyásoló sok-sok tényezőről mélyebb, részletesebb információnk általában nincs. Az idősorelemzés megközelítési módjai: determinisztikus sztochasztikus idősorelemzés. A valószínűség-számítás szemszögéből nézve az idősorok adatai az időben véletlenszerűen lejátszódó, vagyis sztochasztikus folyamatok empirikus adatai.
Az idősorok összetevői A statisztikai elemzés szempontjából négy komponenst különböztetünk meg:: alapirányzat vagy trend, periodikus ingadozás, ciklus, véletlen ingadozás.
Alapirányzat vagy trend Jele: Jellemzői: az idősorban tartósan érvényesülő tendencia a fejlődés legfontosabb komponense. több tényező együttes hatásának a következménye, alapvetően társadalmi-gazdasági törvényszerűségek határozzák meg.
Periodikus ingadozás Jele: sj Jellemzői: Az idősorokban rendszeresen ismétlődő hullámzás. Leggyakoribb típusai: az idényszerű vagy szezonális ingadozások Az idényhatás állandó periódushosszúságú hullámzás, ritmikus ingadozás; általában olyan idősorokban állapíthatjuk meg jelenlétét, amelynek adatai egy évnél rövidebb időszakra (hónap, negyedév) vonatkoznak. Vannak olyan periodikus hullámzások is, amelyeknél a periódus rövidebb, mint egy év.
Ciklus Jele: c Jellemzői: Olyan periodikus ingadozás az idősorban, amely kevésbé szabályos, jelenlétét csak hosszabb idősorok alapján lehet felfedni és tanulmányozni. Az ingadozások periódusának hosszúságát egyrészt természeti okok is befolyásolhatják Fő típusai az ún. gazdasági (konjunktúra) ciklusok.
Véletlen ingadozás Jele: vij Jellemzői: Ezt az összetevőt valószínűségi változónak tekintjük. Véletlennek igen sok, egyenként nem jelentős, egymás hatását elősegítő vagy keresztező végső eredményét tekintjük. A véletlen hatás eredménye, hogy az idősorok adatai a trendből, illetve a periodikus komponensből adódó görbe körül sztochasztikusan ingadoznak.
Idősorok elemzésének feladatai A fejlődés alapirányzatát megismerése, miközben eltekintünk a többi összetevőitől. Az idősort tehát mintegy ki akarjuk simítani: a szezonális, a ciklikus és a véletlen ingadozást "el akarjuk tüntetni", hogy a trendvonalat tisztán lássuk. A mozgó átlagolás és a regressziós módszerekből származtatható analitikus kiegyenlítéssel számszerűsíteni az idősorban rejlő tendenciákat. Az idényszerű hullámzás jellemzőinek mérése, amelynek során természetesen ki kell küszöbölni az idősorban érvényesülő trendhatást és a véletlen ingadozást, valamint - amennyiben a vizsgált idősorban előfordul - a gazdasági ciklus hatását. A konjunktúrahullám (gazdasági ciklus) kimutatása (a többi hatás kiszűrésével). A véletlen hatások kezelése.
Additív és multiplikatív komponensek A gyakorlati idősorok esetében nem mindig jelenik meg minden komponens egyszerre. A komponensek közötti összefüggés lehet: Additív Multiplikatív Ha az idősor periodicitására is tekintettel vagyunk, akkor az idősor komponenseinek additív kapcsolódását tükröző alapképlet: ahol yij, az i-edik periódus (pl. év) j-edik szakaszának (pl. hónap) empirikus adata; az alapirányzat; sj, a szezonális ingadozást (bármely i-edik periódus j-edik szakaszában) fejezi ki; c, a szabálytalan hosszabb távú ingadozásokat leíró ciklikus komponens (konjunktúraciklus; vij, a véletlen komponensnek egy megvalósult értéke, amelyekről többnyire csak azt feltételezik, hogy 0, illetve 1 körül ingadoznak, azaz a várható értékük 0, illetve 1.
Additív és multiplikatív komponensek A jelenségek széles körében feltételezhetjük az összetevők kapcsolódásának multiplikatív módját, amely esetében a komponensadatok szorzata egyenlő a tapasztalati adattal: ahol yij, az i-edik periódus (pl. év) j-edik szakaszának (pl. hónap) empirikus adata; az alapirányzat; sj, a szezonális ingadozást (bármely i-edik periódus j-edik szakaszában) fejezi ki; c, a szabálytalan hosszabb távú ingadozásokat leíró ciklikus komponens (konjunktúraciklus; vij, a véletlen komponensnek egy megvalósult értéke, amelyekről többnyire csak azt feltételezik, hogy 0, illetve 1 körül ingadoznak, azaz a várható értékük 0, illetve 1.
Az idősorok elemzésének bonyolultabb eszközei
Trendszámítás Idősoron egymást követő, azonos tartalmú megfigyelések sorozatát értjük, és y1, y2, …, yt, …,yn módon jelöljük. A trendszámítás feladata az idősor fő komponensének, az alapirányzatnak a kimutatása. Az idősor kiegyenlítése, kisimítása a célunk úgy, hogy a periodikus ingadozás és a véletlen ingadozás hatását kiküszöböljük. Az idősorok kiegyenlítése többféle módszerrel történhet, közülük a mozgóátlagolással és az analitikus trendszámítás módszerét ismertetjük.
Trendszámítás mozgó átlagolással A mozgó átlagolás alapgondolata az, hogy a trendet az eredeti sor dinamikus átlagaként állítjuk elő. A számítás menete a következő: Kiszámítjuk az idősor első „k” adatának egyszerű számtani átlagát. Ez az első trendérték, amelyet az érintett időszak közepéhez - vagyis a (k+1) 1/2-edik időszakhoz - rendelünk. Ezután elhagyjuk az első adatot, és ehelyett vesszük a következő (k+1)-ediket. Ismét átlagot számítva nyerjük a következő mozgó átlagot, vagyis trendértéket, amelyet a megfelelő időszakhoz rendelünk. Így haladunk, amíg az utolsó adatot is felhasználjuk. Az eredményül kapott trendértékek sorozata a kiegyenlített idősor.
Háromtagú mozgó átlagok számítása
Háromtagú mozgó átlagok számítása Páratlan k tagszám esetén az yt (t = 1, 2, ..., n) idősorból számított k tagú mozgó átlagok sorozata a t = j+1-edik időszaktól a t = n-j-edik időszakig tart, ahol j = (k-1)/2. A t-edik időszakhoz rendelt mozgó átlag:
Páros tagszámú mozgóátlag számítása Páros tagszám esetén az az időszak, amelyet a mozgó átlag jellemez, mindig két, eredetileg megadott időszak közé esik, így pl 12 tagú átlagnál a 6. és 7. időszak közé. Ezen a helyzeten egy újabb művelet, az ún. középre igazítás, vagy centírozás beiktatásával segítünk. A középre igazítás úgy történik, hogy a kiszámított mozgó átlagokat páronként rendre átlagoljuk, vagyis újabb, ezúttal kéttagú mozgó átlagok sorozatát számítjuk ki. Ezek a trendértékek már a megadott időszakra vonatkoznak.
Mintapélda páratlan tagszámú mozgó átlag alkalmazásához Valutaországba érkező turisták számának alakulása, ezer fő (2004-2007) Év Szezon Létszám yt 2004 előszezon 100 főszezon 110 utószezon 120 2005 140 162 2006 2007 130 132 150
Mintapélda megoldása Valutaországba érkező turisták jellemzés mozgóátlagolás felhasználásával, ezer fő (2004-2007) Év Szezon Létszám yt 3 tagú mozgóátlag Mellékszámítás 2004 előszezon 100 - főszezon 110 utószezon 120 123,33 2005 140 140,67 162 147,33 134 2006 126,67 130 2007 127,33 132 137,33 150
Mintapélda páratlan tagszámú mozgó átlag alkalmazásához A Hold Kft. által értékesített gázolaj mennyisége 2004 és 2006 között negyedéves bontásban. (ezer liter) Év Negyedév Értékesített mennyiség yt 2004 I. 500 II. 520 III. 540 IV. 530 2005 560 590 600 2006 610 620 650 700
Értékesített mennyiség Mintapélda megoldása A Hold Kft. által értékesített gázolaj mennyiségének vizsgálata mozgóátlagolás felhasználásával 2004 és 2006 között negyedéves bontásban. (ezer liter) Év Negyedév Értékesített mennyiség yt 4 tagú átlag 4 tagú mozgóátlag 2004 I. 500 - II. 520 522,5 III. 540 527,5 532,5. IV. 530 537,5 542,5 2005 548,75 555. 560 563,75 572,5 590 581,25 600 597,5 605 2006 610 612,5 620 632,5 645 650 700
Mozgó átlagolás jellemzői A kapott mozgóátlag, mint trend megmutatja az idősor alapirányzatát, miközben eltekintünk a többi komponenstől. A véletlen hatás kiküszöbölését (pontosabban: csökkentését) az átlagolás művelete révén érjük el. A véletlen kikapcsolása annál tökéletesebb, minél nagyobb tagszámú mozgó átlagokat számítunk. A periodikus ingadozás hatását a mozgó átlag tagszámának megfelelő kijelölésével küszöbölhetjük ki. Szezonális ingadozásnál ügyeljünk arra, hogy minden egyes mozgó átlag átfogjon egy (vagy több) teljes idényciklust. A mozgó átlag tagszámát úgy választhatjuk meg, hogy egy-egy ciklushoz tartozó adatok számával egyenlő vagy annak egész számú többszöröse legyen.
Analitikus trendszámítás Ha a vizsgált jelenség tartós irányzatát az idő függvényében valamilyen regressziós függvénnyel határozzuk meg, analitikus trendszámításról beszélünk. Az analitikus trendszámítás a leggyakrabban alkalmazott szűrő és simító eljárás. Az analitikus trendszámítás esetén mindenekelőtt két kérdést kell tisztázni: Milyen típusú függvénnyel akarjuk leírni az idősort? Hogyan mérjük az illeszkedést, és mikor tekintünk egy illeszkedést jónak?
Lineáris trend Ha olyan jelenség időbeni változását vizsgáljuk, amelynél azt tapasztaljuk, hogy az időegységenként bekövetkezett változás, növekedés vagy csökkenés abszolút értelemben közel állandó, a változás egyenletes, az alapirányzat értékeit lineáris trenddel határozzuk meg. Lineáris trendfüggvény:
A paraméterek meghatározása Ha az idősor trendje lineáris, akkor az abszolút "növekmények" 1 illetve b1 körül ingadoznak, így egy adott idősorra nézve a lineáris trend számítását akkor tekinthetjük indokoltnak, ha a tapasztalati idősor dt különbözetei véletlenszerűen ingadoznak egy átlagos érték körül, időben sem növekvő, sem csökkenő tendenciát nem mutatnak. normálegyenletek segítségével történik.
A paraméterek meghatározása Ha a t értékeket a t=0 követelménynek eleget tevő módon választjuk meg, akkor amiből mindkét paraméter becslésére közvetlen képlet adódik:
A paraméterek értelmezése A b0 paraméter az alapirányzat értéke a t=0-val jelölt időpontban. Ha t=1, 2, …, n, akkor a vizsgálatba bevont időpontot megelőző időpont trend szerinti értéke. Ha ∑t=0 és páratlan az időpontok száma: a középső időpont alapirányzata, és egyben a vizsgált idősor adatainak számtani átlaga. Ha ∑t=0 és páros az időpontok száma, nincs 0-val jelölt időpont, a b0 paraméter az idősor adatainak számtani átlaga. A b1 paraméter az időegységenkénti átlagos abszolút változás mértéke, előjelétől függően növekedést vagy csökkenést jelez a vizsgálatba bevont időtartam alatt. Ha ∑t=0 és az időpontok száma páros, akkor 2b1 az időegységenkénti átlagos abszolút változás mértéke. Jelentését tekintve a lineáris trendfüggvény b1 paraméter megegyezik az időbeli változás átlagos mértékével, azaz a mutatószámmal.
Mintafeladat Kis Kft. által előállított izzó mennyisége 2005-2007 között negyedéves bontásban, ezer db Év Negyedév Termelt mennyiség 2005 I 4 II 6 III 8 IV 7 2006 10 12 14 15 2007 18 20 22
Mintafeladat megoldása Év 2005 2006 2007 Összesen Negyedév I II III IV - yt 4 6 8 7 10 12 14 15 18 20 22 154 t 1 2 3 4 5 6 7 8 9 10 11 12 78 t2 1 4 9 16 25 36 49 64 81 100 121 144 650 ty 4 12 24 28 50 72 98 120 162 180 220 264 1234 ŷt 3,874 5,503 7,132 8,761 10,390 12,019 13,648 15,277 16,906 18,535 20,164 21,793 154,002 (y-ŷ)2 0,016 0,247 0,753 3,101 0,152 0,000 0,124 0,077 1,197 0,286 0,027 0,043 6,023
Mintafeladat megoldása Év Negyedév yt t t2 ty ŷt (y-ŷ)2 Összesen - 154 78 650 1234 154,002 6,023 Normálegyenletek a t=1, 2,…, n számítással: 154=12b0+78b1 1234=78b0+650b1 Az egyenletrendszer megoldásával kapott paraméterek: b0=2,245 b1=1,629 Trendegyenlet: ŷ=2,245+1,629*t
Relatív reziduális szórás Megmutatja, hogy a lineáris trenddel becsült érték a valós értéktől átlagosan mennyivel tér el. A mutató által eldönthető, hogy a vizsgált idősor milyen trendfüggvénnyel írható le a legjobban. Jele: Ve
Relatív reziduális szórás kiszámítása a mintapélda alapján Reziduális szórásnégyzet meghatározása Az a függvény illeszkedik jobban, ahol ez a szórásnégyzet kisebb. Relatív szórás mutatószáma: Tehát a Kis Kft. által előállított izzó mennyiségének lineáris trenddel becsült értéke a valós értéktől átlagosan 5,5%-kal tér el.
Exponenciális trend Ha a vizsgált jelenség egyik időszakról a másik időszakra megközelítőleg mindig ugyanannyiszorosára, azonos százalékkal nő vagy csökken, azaz az időegységenkénti relatív változás ingadozik egy állandó körül, a tartós irányzatot exponenciális trenddel fejezzük ki. Az exponenciális trendfüggvény általános alakja:
Exponenciális trend Az exponenciális függvény pozitív β0 esetén logaritmikus transzformációval lineáris alakra hozható, a paraméterek meghatározása visszavezethető a lineáris függvényre (a logaritmus alapja tetszőleges lehet): A t=1,2,…, n időpontban mért y1,…,yn adatokból a legkisebb négyzetek módszerével meghatározhatjuk (új jelölések bevezetésével) az exponenciális trendfüggvényt. Itt az „a” β0, a „b” pedig a β1 értékének egy realizálódott idősor alapján történt becslése
Exponenciális trend Ha a időszakokat folyamatosan sorszámozzuk, akkor a paraméterek kiszámítását lehetővé tevő normálegyenletek:
Paraméterek meghatározása Ha t=0, akkor a következő közvetlen képletek adódnak.
Paraméterek értelmezése A b0 paraméter a jelenség alapirányzat szerinti értéke a t=0-val jelölt időpontban. Ha ∑t=0, és nincs 0-val jelölt időpont, a b0 paraméter az idősor adatainak mértani átlaga. A b1 paraméter az időegységenkénti átlagos relatív változás mutatószáma. Jelzi, hogy a vizsgált időszak alatt a jelenség értéke időegységenként átlagosan hányszorosára, hány %-ra (100b1) vagy hány %-kal (100b1-100, ha növekedés, 100-100b1, ha csökkenés) változott.
Mintafeladat Év Negyedév Hitelt felvevők száma 2005 I 80 II 90 III 130 Nagy Bank Nyrt.-től hitelt felvevők száma 2005-2007 között negyedéves bontásban, ezer fő Év Negyedév Hitelt felvevők száma 2005 I 80 II 90 III 130 IV 155 2006 180 230 280 340 2007 400 650 700 820
Mintafeladat megoldása Munkatábla Év 2005 2006 2007 Összesen Negyedév I II III IV - yt 80 90 130 155 180 230 280 340 400 650 700 820 4055 t 1 2 3 4 5 6 7 8 9 10 11 12 78 t2 1 4 9 16 25 36 49 64 81 100 121 144 650 logy 1,903 1,954 2,114 2,190 2,255 2,362 2,447 2,531 2,602 2,813 2,845 2,914 28,931 t*logyy 1,903 3,908 6,342 8,761 11,276 14,170 17,130 20,252 23,419 28,129 31,296 34,966 201,553 ŷt 77,976 96,900 120,418 149,644 185,962 231,095 287,182 356,881 443,496 551,132 684,892 851,116 4036,694 (y-ŷ)2 4,098 47,615 91,812 28,691 35,547 1,199 51,580 284,966 1891,897 9774,801 228,244 968,180 13408,630
Eredmények értelmezése Normálegyenletek a t=1, 2,…, n számítással: 28,931=12b0+78b1 201,553=78b0+650b1 Az egyenletrendszer megoldásával kapott paraméterek: Trendegyenlet: ŷ=62,747*1,2427t „a” paraméter: 2004. IV. negyedévében az alapirányzat szerinti létszám 62,747 ezer fő volt. A „b” paraméter értéke 1,2427, azaz a Nagy Bank Nyrt.-től hitelt felvevők létszáma 2005-2007 között negyedévenként átlagosan 1,2427-szeresére, azaz 24,27%-kal növekedett.
Köszönöm a figyelmet