Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
GVAM BSc szak STATISZTIKA II előadás sorozat
Készítette Dr. Kardos Zoltánné
2
ADATSZERZÉSI MÓDOK 1. Adatfelvétel Teljes körű Részleges
Reprezentatív Egyéb részleges Véletlen minta Nem véletlen minta 2. Adminisztratív adatforrás (nem statisztikai célú adatgyűjtésekből származó adatállomány) 3. Kísérletek
3
Statisztikai következtetések
Mintaértékelések Becslések Hipotézisvizsgálat feltételezések ellenőrzése 1. Pontbecslés 2. Intervallumbecslés A sokasági jellemző közelítő értékének meghatározása.
4
Mintaértékelés alapfogalmai
. Mintaértékelés alapfogalmai Alapsokaság (sokaság, populáció), amelyet mintából végzett következtetés alapján ismerünk meg. - Létező alapsokaság (mintavétel) - Hipotetikus alapsokaság (kísérletek képviselik a mintát) Elemszám (ha véges) N Elemei: X1, X2, …….XN Statisztikai paraméterek: átlag: μ ( ) szórás: σ, arány: P stb.
5
. 2. Mintasokaság (minta), a sokaság része, amelyből következtetünk
- Elemszám: n kiválasztási arány: f = n/N - Elemek: x1, x2, …….xn - Statisztikai becsült értékek: átlag szórás: s, arány: p stb. A minta eredete: a) mintavétel, b) kísérlet Elvárás: véletlen jelleg, reprezentálja az alapsokaságot, (egyforma esély a kiválasztásnál).
6
. Becslés gyakorlati alkalmazási esetei: termésbecslés,
minőség-ellenőrzés gazdaság szervezeti egységeinek megfigyelése (5-49 főt foglalkoztatók) egyéni gazdaságok (mezőgazdaság) megfigyelése, háztartások megfigyelése, közvélemény-kutatás
7
. Gyakorlati mintavételi módok:
1. Véletlen mintavétel: (alapsokaságról nyilvántartás) a) egyszerű véletlen szúrópróba, sorsolás, számítógépes véletlenszám-generáló program b) rétegezett c) lépcsőzetes egy-, két-, többlépcsős 2. Nem-véletlen mintavétel: koncentrált, kvóta szerinti, hólabdaszerű stb.
8
A mintaértékelés jellemzői
a) Mintaméret b) Véletlen (mintavételi) hiba: a becsült mintaérték és a sokasági paraméter eltérése (pontosság a standard hibával mérve) c) Valószínűség: megbízhatóság, biztonság (konfidencia szint) kiegészítője a tévedés valószínűsége (hiba- vagy szignifikancia szint, kifejezés: elméleti eloszlásfüggvényekkel
9
. I. Becslés (reprezentatív megfigyelés) Lényege:
előny → gyors, olcsó információszerzés hátrány → pontatlanság, valószínűség A becslés két formája: Pontbecslés: n elemű minta becsült értékével Intervallumbecslés: értékközzel, amely tetszőlegesen nagy valószínűséggel tartalmazza a sokasági paramétert (pl. átlagot) .
10
h1 I I I h2 Megbízhatósági értékköz (konfidencia intervallum) Δ Δ
. Megbízhatósági értékköz (konfidencia intervallum) Δ Δ h1 I I I h2 minta becsült értéke h1 : alsó valószínű határ h2 : felső valószínű határ Δ: hibahatár, maximális eltérés adott biztonsággal.
11
Sokasági átlag intervallumbecslése
. Sokasági átlag intervallumbecslése valószínűségi (megbízhatósági) szint megadása n elemű mintavétel minta átlagának és szórásának számítása: s standard hiba számítása: vagy eloszlás függvényérték megállapítása (z vagy t), hibahatár számítása: Δ (abszolút) és VΔ (relatív) konfidencia intervallum határainak megadása Nevezetes eloszlások: standard normális eloszlás z Student-féle t-eloszlás t
12
. Standard hiba: Hibahatár: (abszolút) z és t eloszlásfüggvény értékek
(relatív) Konfidencia határok:
13
Standard normális eloszlás
(x) tábla vagy z-tábla (z) tábla 1,96 0,9500 (x) = átlag +"x" alá esés (z) = az átlag "z" valószínűsége környezetébe esés valószínűsége
14
.
15
További (esetleges) becslési feladatok
Adott hibahatárhoz (konfidencia határokhoz) tartozó biztonság megállapítása Adott pontosságú és biztonságú becsléshez szükséges minta elemszám meghatározása
16
Összefoglalva: becslés 3 esete:
Adott: az n és a biztonság Φ(z) vagy Φ(t) keresett: a pontosság (Δ, illetve h1 és h2) (ez a leggyakoribb) 2. Adott: az n és a pontosság keresett: a biztonság 3. Adott: a biztonság és a pontosság keresett: az n
17
1. Mintapélda: Átlagbecslés
Mintapéldák 1. Mintapélda: Átlagbecslés 55 ezer vállalkozó közül kiválasztott 102 tagú egyszerű véletlen minta alapján becsülni kívánjuk „X” termék önköltségét 95 %-os biztonsággal. Feladat: Sokasági átlag konfidencia intervallumának meghatározása adott biztonsággal (Feltételek: ismeretlen sokasági eloszlás és szórás, nagy n → z–eloszlás)
18
Az adatfelvételt követő számítási eredmények:
A szükséges további számítások:
19
Teljes megfigyelés esetén az 55 ezer adat tényleges (sokasági) átlaga 95 %-os biztonsággal 1786 és 2014 Ft/db értékek közé esne. A tényleges önköltség jelzett határokon kívül esésének valószínűsége összesen 5 %.
20
. az ahhoz tartozó biztonsági szint megállapítása.
Rögzített (pontosabb) konfidencia határokhoz tartozó biztonság meghatározása Kérdés: Milyen biztonsággal tudnánk 5 %-os relatív hibahatárt megadni? Feladat: z érték és az az ahhoz tartozó biztonsági szint megállapítása. A keresett biztonság: 1 - 2[1 - (z) ] = 1 – 2(1 – 0,9484) = 0,897 → 89,7 %
21
Kérdés: hány vállalkozót (n) kellene megfigyelni
Rögzített konfidencia határokhoz és adott biztonsághoz tartozó minta-elemszám Kérdés: hány vállalkozót (n) kellene megfigyelni ös konfidencia intervallumú és 95 %-os biztonságú becsléshez? Adott feltételekhez 147 elemű mintára lenne szükség.
22
2. Mintapélda (kis elemszám)
Egy Kft. konzervüzemében egy 8 ezer dobozos őszibarack konzerv tételből vett 25 elemű véletlen mintán ellenőrzik az átlagos töltősúlyt (tömeget) 95 % -os biztonsággal. Feltételek: ismeretlen sokasági eloszlás és szórás, kis elemszám t (Student) eloszlás! A mintába került 25 doboz mérési eredményei: mintaátlag : gr/doboz, mintaszórás: „
23
A szükséges számítások az átlagbecsléshez
24
II. Hipotézis vizsgálatok (szignifikancia vizsgálatok, statisztikai próbák)
Hipotézis: alapsokaság paramétereire, vagy eloszlására tett feltevés Mintát (mintákat) alkalmazunk a feltevés ellenőrzésére (tesztelésére) Hipotézisek megfogalmazása: Nullhipotézis: H0 és ellen(alternatív) hipotézis H1
25
ezt teszteljük → Hipotézis formái Null (H0) statisztikai próba alapján
döntés: elfogadjuk vagy elvetjük Alternatív(H1) → ezzel szemben erről közvetve döntünk
26
Hipotézisek megfogalmazása
Nullhipotézis felállítása: a hipotetikus adat (vagy eloszlás) és a tényleges adat (vagy eloszlás) között nincs eltérés. Pl. átlagra: → Alternatív hipotézis: a nullhipotézistől eltérő hipotézis matematikai megfogalmazása (egyoldali) Ezek közül azt választjuk, ami a hipotézisnek megfelel
27
A vizsgálat eszköze a próbafüggvény
A próbafüggvény tulajdonságai: valószínűségi változó a véletlen minta elemeinek függvénye, értéke mintáról-mintára ingadozik, valószínűségi eloszlása bizonyos feltételek mellett ismert (feltételezve a H0 helyességét). Pl: Ha: X normális eloszlású változó, σ ismert, ha Ho helyes, akkor a próbafüggvény z változó N(0,1) esetén
28
A statisztikai próbák elnevezése a függvénytípus alapján: z-próba,
. A statisztikai próbák elnevezése a függvénytípus alapján: z-próba, t-próba, F-próba stb. vagy kidolgozóik neve alapján: Wells-próba, Bartlett-próba stb.
29
A hipotézisvizsgálat (próba) menete
Megfogalmazzuk a Ho-t és a H1-et. Általában rögzítjük az szignifikancia szintet (tévedés valószínűsége) is. Eldöntjük a próbafüggvény típusát, azaz, hogy milyen próbát végzünk. 3. Kiszámítjuk az adott minta (minták) alapján a próbafüggvény aktuális értékét (próbastatisztika) adott formulák alapján. 4. Döntünk a hipotézisről (tesztelést végzünk): elfogadjuk a Ho-t, vagy visszautasítjuk, és a H1 mellett döntünk.
30
. Próbafüggvény két értelmezése:
- elméleti → véletlen változó, (táblázatok) empirikus → mintá(k)ból számolt, aktuális érték (próbastatisztika) Fontos sajátosság! Az aktuális próbafüggvény Ho helyessége mellett: nagy valószínűséggel (1 - ) az elfogadási tartományba (E), kis valószínűséggel () a kritikus tartományba (K)eső értéket vesz fel.
31
Pl. z próbafüggvény eloszlása
E és K tartomány lehetséges 3 esete Az E és K tartományt a kritikus érték választja el, Ca: alsó kritikus érték Cf : felső kritikus érték A kritikus értéket a szignifikancia szint alapján lehet meghatározni (táblázatok, számítógépes programok) Elfogadási (E) tartomány: fehér Kritikus (K) tartomány: fekete ca cf ca cf
32
Döntés a hipotézisről Ha a próbastatisztika értéke az E tartományba esik Ho-t elfogadjuk → a tapasztalati adatok α szignifikancia szinten szinten nem mondanak ellent a Ho-nak, ha a K tartományba esik, a Ho-t elvetjük és a H1-et fogadjuk el. Azt hogy melyik tartományba esik, az elméleti és az aktuális próbafüggvény összevetésével állapítjuk meg. Ez a döntés alapja!
33
ha z z H0 elfogadása mellett döntünk,
Döntés: a számított és az elméleti próbafüggvény értékének összevetésével,a z- próba példáján: ha z z H0 elfogadása mellett döntünk, ha z z H1-et fogadjuk el. Döntés a p érték (aktuális próbafüggvény értékhez tartozó szignifikancia szint) alapján: ha: p ≤ α → Ho-t elvetjük, ha: p > α → H1-t fogadjuk el. H1 elfogadásakor szignifikáns (statisztikailag jelentős) eltérést állapítunk meg. .
34
Paraméteres próbák Átlagok próbái általános feltétel: a sokasági
normális eloszlás a ) Egymintás átlagpróba Egy minta által képviselt alapsokaság átlaga ( μ vagy) megegyezik-e egy megadott értékkel ( μ0 vagy Alkalmazható próbák: z-próba: → σ ismert, vagy a minta nagy (n > 30) t-próba: → σ nem ismert és a minta kicsi
35
. b ) Kétmintás átlagpróba
- Két minta által képviselt alapsokaság átlaga megegyezik-e? - Származhatott-e a két minta adott átlagú alapsokaságból? Alkalmazható próbák: z-próba → σ –k azonosak, ismertek, vagy a minták kellően nagyok, t-próba → σ –k azonosak, de nem ismertek és a minta kicsi Welch-próba → σ –k nem azonosak, nem ismertek és a minta kicsi
36
. c ) Három- és többmintás átlagpróba
Feltétel: szórások azonossága, minták függetlensége H0 - A minták által képviselt alapsokasági átlagok megegyeznek-e? - Származhattak-e a minták adott átlagú alapsokaságból? Alkalmazható próba: Variancia-analízis → F-próba
37
. 2. Szórások próbái általános feltétel: a sokaság normális eloszlású
és a minták függetlenek Sajátosság: nem közvetlenül a szórásokat, hanem a varianciákat hasonlítjuk össze. a ) Egymintás szóráspróba H0 - Egy minta által képviselt alapsokaság szórása (σ) megegyezik-e egy adott értékkel (σ0) - Származhatott-e egy minta adott szórású alapsokaságból? Alkalmazható próba: Khi-négyzet ( ) próba
38
b) Kétmintás szóráspróba H0 - Két minta által képviselt alapsokaság
. b) Kétmintás szóráspróba H0 - Két minta által képviselt alapsokaság szórása megegyezik-e, - homogenitásuk azonos-e? - az átlagok összehasonlításánál melyik próbát alkalmazzuk ? Alkalmazandó próba: F-próba (Fisher-próba) Egyéb alkalmazás: Variancia-analízis
39
. c ) Három- és többmintás szóráspróba
H0 - A minták által képviselt alapsokasági szórások megegyeznek-e? Alkalmazandó próba: Bartlett-próba (van más is!) Nem-paraméteres próbák 1. Illeszkedésvizsgálat → H0 - Egy sokasági eloszlás tekinthető-e normális (stb.) eloszlásúnak? - Két sokasági eloszlás azonos-e: 2. Függetlenségvizsgálat H0 - Egy sokaság két ismérve független-e? -próba
40
Gyakorlati mintapéldák
1. Átlagokra tett feltevések vizsgálata Sokasági átlagra tett hipotézis ellenőrzése (egymintás átlagpróba) Példa: Egy termék gyártására vonatkozó szabvány: a kiszerelés tömege 1 kg ( ), szórása 0,09 kg (σ0) 0,09 kg. A szabványellenőrzés mintája: n=75 db. (Szignifikancia szint: = 0,05) Feltevésünk: H0 : = 1kg H1 : 1 kg A minta átlagában a kiszerelés tömege 0,985 kg (a szórás 0,1 kg).
41
. Ismert sokasági szórás, nagy minta: z - próba
Az aktuális z- próbafüggvény érték: Tesztelés: (z) táblában 1-0,05 –nél z-érték = 1,65 reláció: 1,65) kritikus) |1,5| aktuális H0 kerül elfogadásra
42
(z) táblában z=1,65-nél (z)= 0,9332 p = 1- 0,9332 = 0,0668
. b) az aktuális 1,5 próbafüggvény-érték szignifikancia szintje (p-érték) alapján: (z) táblában z=1,65-nél (z)= 0,9332 p = 1- 0,9332 = 0,0668 = 0,05 0,0668 Döntés H0 -ra ugyanaz, elfogadva. Legkisebb szignifikancia szint, amelyen H0 már éppen elvethető 6,68 %
43
Szignifikáns differencia (SzD) Mekkora az a különbség, ami még
. Kiegészítő mutató: Szignifikáns differencia (SzD) Mekkora az a különbség, ami még véletlennek tekinthető ? (maximális hiba) SzD = z/2 = 1,96 0,01 = 0,0196 > 0,015 Ha SzD > → H0 elfogadása
44
. b) Két sokasági átlagra tett feltevés vizsgálata: (két mintás) t-próba példa: „A” és „B”terméket hasonlítunk össze a minőség szempontjából. Azt vizsgáljuk, hogy különböző minőségű termékekről van-e szó. A hipotézisek: A hipotézis ellenőrzésére mindkét termékből 6-6 tagú mintavételre került sor :
45
tα/2 (SzF10) = 2,23 < 3,28 → Ho elutasítása, H1 elfog.
„A” termék átlaga: 2,06 gr N/100gr szórása: 0,135 „B” termék átlaga: 1,86 gr N/100gr szórása: 0,063 Próbafüggvény: Szabadságfok: n1+n2 - 2= = 10 tα/2 (SzF10) = 2,23 < 3,28 → Ho elutasítása, H1 elfog. Szignifikáns → differencia Ekkora eltérés még véletlennek tekinthető
46
Szórásnégyzetek próbái
1. Feltevés sokasági szórásnégyzetre (szórásra) példa: Az átlag tesztelésének példájában szereplő termék szórásának szabványa 0,09 kg, ezzel szemben a mintaszórás 0,1 kg-ot tett ki ( 5 %). Hipotézisek: Az alkalmazandó próba: 2 -próba A próbafüggvény: Elmélet próbafüggvény érték: = 90,5 (SzF = 74) 2 Döntés: El kell vetnünk a H0 –t, a szórás nagyobb a megengedettnél.
47
. Két sokasági szórásnégyzetre (szórásra) vonatkozó feltevés
példa: A két átlag összehasonlításának példájában (lásd korábban) feltételeztük a szórás-azonosságot. Ellenőrizzük le e feltételezést, 5 %! . Hipotézis: Alkalmazandó: F- próba (Fisher) SzF(számláló) n – 1 = 6 – 1 = 5 SzF (nevező) n – 1 = 6 – 1 = 5 F0,05 = 5,05 Döntés: 3,29 5,05 H0 elfogadása szórások azonosak
48
Összefüggés-vizsgálat
Regresszió és korrelációszámítás
49
Ismérvek közötti összefüggések
Lehetséges esetek: Kapcsolat hiánya Függvényszerű kapcsolat (determinisztikus) Sztochasztikus kapcsolat (tendenciaszerű, valószínű érvényű) - asszociáció → minőségi ismérvek - rangkorrelációs kapcsolat, sorrendi (ordinális) skálán mért ismérvek, - vegyes kapcsolat, minőségi és mennyiségi ismérvek, - korreláció, mennyiségi ismérvek (kettő és több)
50
Mennyiségi ismérvek (2) kapcsolatának lehetséges esetei
Kapcsolat hiánya Függvényszerű kapcsolat Sztochasztikus kapcsolatok
51
. Korreláció: mennyiségi ismérvek közötti
sztochasztikus (tendenciaszerű) kapcsolat. Példák: : 1. egy főre jutó egy főre jutó jövedelem fogyasztás 2. adott típushoz tartozó használt gépkocsik életkora → eladási ára 3. felhasznált növényi termék műtrágya hozama Összefüggés típusok: ok-okozati összefüggés (műtrágya - hozam) kölcsönhatás (ár – kereslet) hamis <látens> korreláció (testsúly – érdemjegy) . → →
52
Ismérvek = változók Jelölés és elnevezés:
. Ismérvek = változók Jelölés és elnevezés: x változó tényező-, vagy magyarázóváltozó, y változó eredményváltozó Kapcsolatvizsgálat Regresszióanalízis Korrelációszámítás a kapcsolatban lévő a kapcsolat szorosságát tendenciát függvénnyel intenzitását jellemzi, + írja le determináció vizsgálat
53
Regresszószámítás: Modellezés analitikus függvényekkel
Elméleti sztochasztikus modell: Y = ε → regresszió ε → véletlen(ek) hatása = f(X) vagy = f(X1, X2,…Xp) kétváltozós többváltozós f : függvény típus lineáris nemlineáris exponenciális, hatványkitevős, hiperbolikus, parabolikus, stb.
55
.
56
Az összefüggés-vizsgálat regresszió- és korrelációszámítással
Lépések: Célkitűzés: y és x változók megválasztása (szakmai és statisztikai szempontok), az alkalmazási cél megfogalmazása. 2. Adatbázis megteremtése → saját (primer) megfigyelések, vagy szekunder statisztika. 3. A regressziós függvény típusának megválasztása (specifikáció). Az optimális modell függvény meg-találásának szempontjai: legszorosabb illeszkedés, célkitűzésnek legjobb megfelelés, szakirodalmi ajánlások. Előzetes és utólagos specifikáció.
57
a) Függvény paraméterek becslése,
. 4. Regressziószámítás a) Függvény paraméterek becslése, b) Regressziós értékek meghatározása, illeszkedésvizsgálat, c) a modell tesztelése, konfidencia-intervallumok számítása, d) ábrázolás, következtetések. 5. Korrelációszámítás a) korrelációs mérőszám(ok) számítása, b) determináció-vizsgálat, c) következtetések.
58
Kétváltozós regresszió-analízis és korrelációszámítás
Lineáris regresszió Regressziós függvény becslése→paraméterek számítása Legszorosabb illeszkedés (legkisebb négyzetek elve) Megoldás: a változók átlageltérései (dx, dy) alapján végzett transzformációval → minimum Megoldás: normálegyenletek: Levezetett képletek:
59
. illesztés standard hibája: σe vagy Se
Regressziós becslések (értékek) számítása Regressziós egyenletbe x-ek behelyettesítésével -ek számítása Illeszkedésvizsgálat illesztés standard hibája: σe vagy Se (reziduumok) illesztés relatív hibája: Hipotézisellenőrzések, konfidencia-intervallum számítások: a becslés és hipotézisellenőrzés témában tanult eljárások szerint
60
Értelmezés: Regressziós együtthatók: bo: X = 0 esetén Y mekkora értéket vesz fel átlagosan ha az X= 0 szerepel az X értékek között) b1: x adott értékének egy egységnyi változására átlagosan milyen mértékű változással reagál y (a vizsgált y tartományban). A változók kölcsönhatása esetén: x egységnyi változása átlagosan mekkora y változással jár együtt. Regressziós értékek: ek adott x értékhez mekkora y érték valószínűsíthető (a vizsgált x tartományban)
61
0 és │1│közötti mérőszámok – 0,4 laza, 0,4 – 0,7 közepes
. Korrelációszámítás: 0 és │1│közötti mérőszámok – 0,4 laza, ,4 – 0,7 közepes 0,7 – 0,9 szoros ,9 – igen szoros kapcsolat Korrelációs együttható: Számítás alapja a változók átlagtól való eltérései: Determinációs együttható: Korrelációs index (hányados) Tesztelés t-próbával
62
. Linearizálhatók: a) Exponenciális: log y =log b0 +x ∙log b1
Nemlineáris regressziós modellek Linearizálhatók: a) Exponenciális: log y =log b0 +x ∙log b1 lineáris a kapcsolat x és log y között Értelmezés: 100 b1 → x egy egységnyi változására jutó y %-os változása ( mint Vdin.) b) Hatványkitevős: log y =log b0 + b1 ∙log x lineáris a kapcsolat log x és log y között Értelmezés: b1 → x egy %-os változására jutó y %-os változása (elaszticitás). Hiperbolikus: lineáris a kapcsolat 1/x és y között Értelmezés: y b0 felé tart x nagymértékű növekedésével
63
. Paraméterek számítása normálegyenletekből:
Másodfokú parabolikus regresszió Paraméterek számítása normálegyenletekből: Paramétereket nem értelmezzük Szélsőérték számítás: x0 = - b1 / 2b2 yo → x0 behelyettesítésével Korrelációszámítás: Korrelációs hányados
64
. Mintapélda Tíz gazdasági egység alábbi megfigyelései alapján
vizsgáljuk egy termelési folyamatban az anyagköltség (x) és a termelési érték (y) közötti összefüggést (a változók mértékegysége E Ft/ha) Válto- zók m e g f i g y e l é s e k 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. x 34 38 44 48 56 62 70 76 82 90 y 66 80 104 125 100 126 110 135 130
65
. 1. közelítés: Lineáris regresszió
a) Regressziós függvény paramétereinek becslése
66
. b) Regressziós becslések (értékek) számítása Illeszkedésvizsgálat
67
- (Varianciaanalízis) - Paraméterek → standard hibák
. c) Hipotézisellenőrzések, konfidencia-intervallum - (Varianciaanalízis) - Paraméterek → standard hibák tesztelések, konfidencia-intervallumok b1 paraméter b1 konfidencia-intervalluma: b1 = t/2 sb = 2,31 0,225 = 0,52 h1 = 1,014 – 0,52 = 0,494 h2 = 1, ,52 = 1,534
68
Korrelációs együttható:
. Korrelációszámítás: Korrelációs együttható: Szoros pozitív kapcsolat Determináció: Az anyagköltség 71,7 %-ban magyarázza a termelési érték alakulását, a véletlennek 28,3 %-os a hatása.
69
Az anyagköltség és a termelési érték kapcsolatot modellező különböző regressziós modellek ábrái
.
70
Idősorok elemzése Idősorok összetevői
71
Idősorok egyszerűbb elemzési módszerei
Tapasztalati idősor: Időismérv: t1, t2, …ti,… tn Megfigyelt érték: y1, y2, …yi,…yn Állapot-idősor és tartam-idősor Egyszerűbb módszerek: Viszonyszámok → Vd (bázis és lánc) Ábrázolás → grafikonok, oszlopdiagramok poláris diagram Átlagok Indexek → Összhatás indexkör és értékindex-kör
72
Idősor átlaga Változások átlaga Tartamidősor Állapotidősor
. Idősor átlaga Tartamidősor Állapotidősor Változások átlaga Abszolút (mérték) Relatív (ütem)
73
. 2010-re vonatkozó: 1. negyedévi átlagos létszám: Mintapélda:
Egy cég adatai: 2010-re vonatkozó: 1. negyedévi átlagos létszám: Negyed-év Létszám fő* Árbevétel M Ft 2010 I. 32 260 II. 36 320 III. 38 350 IV. 41 390 2011 I. 40 425 2. Negyedévi átlagos árbevétel * Negyedév elején
74
1. Abszolút (mérték): Mintapélda: Egy cég adatai:
Árbevétel átlagos negyedévi változása 2010-ben: 1. Abszolút (mérték): Negyed-év Árbevétel M Ft 2010 I. 260 II. 320 III. 350 IV. 390 2011 I. 425 2. Relatív (ütem): * Negyedév elején
75
Idősorok összetevőinek vizsgálata
Idősor komponensek Alapirányzat vagy trend Y Szezonális (idényszerű) hullámzás S Ciklikus hullámzás C Véletlen hatás (ingadozás) V Idősor modellek 1. Y = Y, V éves adatokból álló idősor 2.Y = S, V trendmentes, idényekből álló idősor 3.Y = Y, S, V idényekből álló, nem stagnáló idősor 4. Y = Y, S, V, C hosszú, idényekből álló idősor Periodikus ingadozás
76
. Idősor modellek Additív Multiplikatív 1. Y = Y + V Y = Y ∙ V
Y = S + V Y = S ∙ V Y = Y + S + V Y = Y ∙ S ∙ V 4. Y = Y + S + C + V Y = Y ∙ S ∙ C ∙ V . Pl. 3. modell: Additív Multiplikativ azonos kilengés növekvő kilengés (csökkenő) Az összetevők vizsgálata: felbontjuk komponenseire, elkülönítjük az összetevők egyedi hatását.
77
- páratlan tagszám: pl. k=3 y1 = (y1+y2+y3)/3, y2 = y2+y3+y4)/3, stb.
Trendszámítás Cél: a fő tendencia kimutatása, az idősor kisimítása Két módszer: a) mozgóátlagolás b) analitikus trendszámítás Mozgóátlagolás Láncolatosan tovahaladó k tagszámú átlagolás - páratlan tagszám: pl. k=3 y1 = (y1+y2+y3)/3, y2 = y2+y3+y4)/3, stb. - páratlan tagszám: pl. k=4 öttagú kronológikus átlag (lásd mintapélda) Előny: gyors kisimítás Hátrány: lerövidülés, nincs számszerű információ, csak ábra
78
. Mozgó átlagok számításának sémája k=3
79
Egy gazdálkodó szervezet árbevételének adatai
k megválasztása: ne legyen se túl kicsi, se túl nagy, szezonalitás esetén k=idények száma, vagy többszöröse.
80
Árbevétel és mozgóátlagolású trendjének alakulása 2006-2010
. Árbevétel és mozgóátlagolású trendjének alakulása
81
. Analitikus trendszámítás Legjobb kisimítás, az idősor alapirányzatát
valamilyen ismert függvénnyel fejezzük ki (alaptendencia matematikai modellje; (lásd regresszió-elemzés) Alkalmazás: Múltbeli tendencia megismerése (információk: paraméterek, trendértékek) Előrejelzés → trendextrapoláció
82
Az analitikus trendszámítás feladatai:
. Az analitikus trendszámítás feladatai: 1. A megfelelő trendfüggvény kiválasztása; specifikáció. Választható trendfüggvények: a) lineáris b) exponenciális, c) hiperbolikus, d) parabolák, e) logisztikus függvény. legszorosabb illeszkedés elve: 2. A választott trendfüggvény meghatározása (paraméterek becslése legkisebb négyzetek elvén) 3. Trendértékek kiszámítása 4. Trendfüggvény-illeszkedés mérése Se, Vse 5. Következtetések levonása → minimum
83
. Lineáris trendszámítás b) t = 1, 2, . n (számítógépes programok) →
normálegyenletek Paraméterek számításához → Megoldás: kódolt t értékekkel a) t = 0 feltétel Kódolás páratlan és páros tagszámú idősornál: b) t = 1, 2, . n (számítógépes programok)
84
Paraméterek számítása
. Paraméterek számítása a) t = 0 Σt=0 → t = 1, 2, . N Négy közvetlen normálegyenletbe való Behelyettesítésével az egyenletek megoldása
85
. Példa: Egy cég dolgozói létszámának alakulása:
Trendegyenlet meghatározása Trendegyenlet:
86
. t = 1, 2, . n kódolással a trendegyenlet:
Trendértékek számítása: (első és utolsó) = 281,4 + (25,1 -3) = 206,2 (206 fő) vagy 181,1 + (25,1 1) = 206 = 281,1 + (25,1 3) = 356,8 (357 fő) Illeszkedésvizsgálat: Értelmezés: bo : évi átlaglétszám 281 fő ( t = 0) 2003 évi becsült létszám 181 fő (t = 1, 2, .n) b1: évente átlagosan 25 fővel nőtt a létszám Páros tagú idősor esetén 2b1-et értelmezünk
87
. Exponenciális trend: a szomszédos relatív változások
megközelítően állandóak Modell: Linearizálás: logaritmus transzformációval Megoldás a lineáris közelítés szerint Értelmezés: 100∙b1 → változás átlagos üteme %-ban (páros tagú idősornál b1 négyzetét értelmezzük) Hiperbolikus trend: modell: Információ: Y hosszú távon b0 felé tart Parabolikus trend: a változás irányában törés: növekedés és csökkenés → konkáv par. Csökkenés és növekedés → konvex par. Információ: szélsőérték → a törés mikor volt ?
88
. Logisztikus trend → hosszú idősoroknál.
Három jellegzetes szakasz: 1. lassú növekedés 2. gyors felfutás, 3. csökkenő mértékű növekedéssel közeledés a telítődési szinthez (termékek életgörbéje) . k a trend maximális értéke, azaz a telítődési szint Modell: A mobil-előfizetők számának alakulása )
89
Szezonalitás elemzése
Szezonális hullámzás jellemzője: zömmel rövid táv (éves periódus), azonos hullámhossz, rendszeres ismétlődés, azonos idényekben azonos irányú kilengések Szezonális ingadozás mérése szezonális eltérések Szej (additív idősor) b) szezonindexek Szij (multiplikatív idősor) j: az idények száma
90
Mérés trendmentes idősorokban
1. Az idősor azonos idényeinek adatait átlagoljuk → véletlen kiküszöbölése. 2. Kiszámítjuk az idősor (fő)átlagát 3. Az idényátlagokat a főátlaghoz viszonyítjuk. - Additív idősor (Y=S+V) : kivonás → Szej (j=1,2,.j): eltérések mértéke (több, vagy kevesebb) az idényátlagtól - Multiplikatív idősor: (Y=S ∙ V) osztás → Szij ∙ 100 : százalékos eltérések az szezonátlagtól
91
. Példa: Egy cég munkavállalói létszáma, fő Sze1: 24 - 35 = -11
Szezonális eltérések: fő Sze1: = -11 Sze2: = - 1 Sze3: = 17 Sze4: = - 5 Σ = 0 Szezonindexek, % Szi1: 24 : 35 = 0, ,6 % Szi2: 34 : 35 = 0, ,1 % Szi3: 52 : 35 = 1, ,6 % Szi4: 30 : 35 = 0, ,7 % Σ = 4
92
Mérés trendet tartalmazó idősorban
1. Trendérték meghatározása (mozgóátlagolással, vagy trendfüggvények segítségével). Trendkiszűrés az idősor modell átrendezésével - Additív modell: jobboldalon már csak S és V hatások - Multiplikatív modell: Véletlen hatás leválasztása a trendmentes adatok idényenkénti egyszerű számtani átlagolásával: - Additív modell → szezonális eltérések - Multiplikatív modell → szezonindexek Értelmezés: a trendértéktől való abszolút (Szej) és %-os (Szij) eltérések a j idényben
93
Szezonalitás mérése Egy cég árbevétel adatai:
. Szezonalitás mérése Egy cég árbevétel adatai:
94
Szezonindexek: % Szi1 = (1,045+1,031+1,026) : 3 = 1,034 103,4 %
. Szezonális eltérések: M Ft Sze1 = (6, ,5) : = 5,4 Sze2 =(– 1,8 – 6,5 – 3,5) : 3 = – 3,9 Sze3 = (– 12 – 9,5 – 5,5) : 3 = – 9,0 Sze4 = (4, ,4) : 3 = 6,7 Szezonindexek: % Szi1 = (1,045+1,031+1,026) : 3 = 1,034 103,4 % Szi2 = (0,988+0,961+0,980) : 3 = 0,976 97,6 % Szi3 = (0,915+0,940+0,967) : 3 = 0,941 94,1 % Szi4 = (1,032+1,050+1,043) : 3 = 1,042 104,2 %
95
A szezonális mérőszámok felhasználása
. A szezonális mérőszámok felhasználása A mérőszámok információinak figyelembe vétele a gyakorlatban (pl. éves tervek idényekre bontása, előrejelzések készítése) Szezonhatás kiszűrése az idősorokból, azaz szezonálisan kiigazított idősorok képzése Árbevétel mintapélda szezonális kiigazítása Y/Szij
96
Ciklikus komponens vizsgálata
Kétféle lehetőség a C becslésére: Analitikus trendértékekkel mentesített (Y/Y) idősoron végzett mozgóátlagolással. Mozgóátlagolású trend és az analitikus trend különbségével (hányadosával). A mozgóátlagolás a V hatását szűri ki. Az így kapott értékek ábrája ad információt a ciklikus hatásról (ciklushossz, ciklus-szakaszok, csúcs- és mélypontok)
97
. Előrejelzés: idősorból végzett becslés
Ex ant: a megfigyelési időszakon kívülre Leggyakrabban használt módszerek: Idősor komponensek (trend stb.) alapján Simító eljárások, Komplex modellek (sztochasztikus eljárások) Szakértői becslések Idősor komponensek alapján - Trend-extrapoláció: pl. a t+1 időszakra: Lineáris trend: - Szezonalitás figyelembe vétele: Additív m Multipl. m. . .
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.