Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

GVAM BSc szak STATISZTIKA II előadás sorozat Készítette Dr. Kardos Zoltánné.

Hasonló előadás


Az előadások a következő témára: "GVAM BSc szak STATISZTIKA II előadás sorozat Készítette Dr. Kardos Zoltánné."— Előadás másolata:

1 GVAM BSc szak STATISZTIKA II előadás sorozat Készítette Dr. Kardos Zoltánné

2 ADATSZERZÉSI MÓDOK 1. Adatfelvétel Teljes körű Részleges Reprezentatív Egyéb részleges Véletlen minta Nem véletlen minta 2. Adminisztratív adatforrás (nem statisztikai célú adatgyűjtésekből származó adatállomány) 3. Kísérletek

3 Statisztikai következtetések Mintaértékelések Becslések Hipotézisvizsgálat feltételezések ellenőrzése 1. Pontbecslés 2. Intervallumbecslés A sokasági jellemző közelítő értékének meghatározása.

4 . Mintaértékelés alapfogalmai 1.Alapsokaság (sokaság, populáció), amelyet mintából végzett következtetés alapján ismerünk meg. - Létező alapsokaság (mintavétel) - Hipotetikus alapsokaság (kísérletek képviselik a mintát) Elemszám (ha véges) N Elemei: X 1, X 2, …….X N Statisztikai paraméterek: átlag: μ ( ) szórás: σ, arány: P stb.

5 . 2. Mintasokaság (minta), a sokaság része, amelyből következtetünk - Elemszám: n kiválasztási arány: f = n/N - Elemek: x 1, x 2, …….x n - Statisztikai becsült értékek: átlag szórás: s, arány: p stb. A minta eredete: a) mintavétel, b) kísérlet Elvárás: véletlen jelleg, reprezentálja az alapsokaságot, (egyforma esély a kiválasztásnál).

6 . Becslés gyakorlati alkalmazási esetei: termésbecslés, minőség-ellenőrzés gazdaság szervezeti egységeinek megfigyelése (5-49 főt foglalkoztatók) egyéni gazdaságok (mezőgazdaság) megfigyelése, háztartások megfigyelése, közvélemény-kutatás

7 . Gyakorlati mintavételi módok: 1. Véletlen mintavétel: (alapsokaságról nyilvántartás) a) egyszerű véletlen szúrópróba, sorsolás, számítógépes véletlenszám-generáló program b) rétegezett c) lépcsőzetes egy-, két-, többlépcsős 2. Nem-véletlen mintavétel: koncentrált, kvóta szerinti, hólabdaszerű stb.

8 A mintaértékelés jellemzői a) Mintaméret b) Véletlen (mintavételi) hiba: a becsült mintaérték és a sokasági paraméter eltérése (pontosság a standard hibával mérve) c) Valószínűség: megbízhatóság, biztonság (konfidencia szint) kiegészítője a tévedés valószínűsége (hiba- vagy szignifikancia szint, kifejezés: elméleti eloszlásfüggvényekkel

9 . I. Becslés (reprezentatív megfigyelés) Lényege: előny → gyors, olcsó információszerzés hátrány → pontatlanság, valószínűség A becslés két formája: Pontbecslés: n elemű minta becsült értékével Intervallumbecslés: értékközzel, amely tetszőlegesen nagy valószínűséggel tartalmazza a sokasági paramétert (pl. átlagot)

10 . Megbízhatósági értékköz (konfidencia intervallum) Δ Δ h 1 I I I h 2 minta becsült értéke h 1 : alsó valószínű határ h 2 : felső valószínű határ Δ: hibahatár, maximális eltérés adott biztonsággal.

11 . Sokasági átlag intervallumbecslése valószínűségi (megbízhatósági) szint megadása n elemű mintavétel minta átlagának és szórásának számítása: s standard hiba számítása: vagy eloszlás függvényérték megállapítása (z vagy t), hibahatár számítása: Δ (abszolút) és V Δ (relatív) konfidencia intervallum határainak megadása Nevezetes eloszlások: standard normális eloszlás z Student-féle t-eloszlás t

12 . Standard hiba: Hibahatár: (abszolút) z és t eloszlásfüggvény értékek (relatív) Konfidencia határok :

13 Standard normális eloszlás  (x) = átlag +"x" alá esés  (z) = az átlag "z" valószínűsége környezetébe esés valószínűsége  (x) tábla vagy z-tábla  (z) tábla 1,960,9500

14 .

15 További (esetleges) becslési feladatok Adott hibahatárhoz (konfidencia határokhoz) tartozó biztonság megállapítása Adott pontosságú és biztonságú becsléshez szükséges minta elemszám meghatározása

16 Összefoglalva: becslés 3 esete: 1.Adott: az n és a biztonság Φ(z) vagy Φ(t) keresett: a pontosság (Δ, illetve h 1 és h 2 ) (ez a leggyakoribb) 2. Adott: az n és a pontosság keresett: a biztonság 3. Adott: a biztonság és a pontosság keresett: az n

17 Mintapéldák 1. Mintapélda: Átlagbecslés 55 ezer vállalkozó közül kiválasztott 102 tagú egyszerű véletlen minta alapján becsülni kívánjuk „X” termék önköltségét 95 %-os biztonsággal. Feladat: Sokasági átlag konfidencia intervallumának meghatározása adott biztonsággal (Feltételek: ismeretlen sokasági eloszlás és szórás, nagy n → z–eloszlás)

18 Az adatfelvételt követő számítási eredmények: A szükséges további számítások:

19 Teljes megfigyelés esetén az 55 ezer adat tényleges (sokasági) átlaga 95 %-os biztonsággal 1786 és 2014 Ft/db értékek közé esne. A tényleges önköltség jelzett határokon kívül esésének valószínűsége összesen 5 %.

20 . Rögzített (pontosabb) konfidencia határokhoz tartozó biztonság meghatározása Kérdés: Milyen biztonsággal tudnánk 5 %-os relatív hibahatárt megadni? Feladat : z érték és az az ahhoz tartozó biztonsági szint megállapítása. A keresett biztonság: 1 - 2[1 -  (z) ] = 1 – 2(1 – 0,9484) = 0,897 → 89,7 %

21 Rögzített konfidencia határokhoz és adott biztonsághoz tartozó minta-elemszám Kérdés: hány vállalkozót (n) kellene megfigyelni ös konfidencia intervallumú és 95 %-os biztonságú becsléshez? Adott feltételekhez 147 elemű mintára lenne szükség.

22 2. Mintapélda (kis elemszám) Egy Kft. konzervüzemében egy 8 ezer dobozos őszibarack konzerv tételből vett 25 elemű véletlen mintán ellenőrzik az átlagos töltősúlyt (tömeget) 95 % -os biztonsággal. Feltételek: ismeretlen sokasági eloszlás és szórás, kis elemszám  t (Student) eloszlás! A mintába került 25 doboz mérési eredményei: mintaátlag : 495 gr/doboz, mintaszórás: 28 „

23 A szükséges számítások az átlagbecsléshez

24 II. Hipotézis vizsgálatok (szignifikancia vizsgálatok, statisztikai próbák) Hipotézis: alapsokaság paramétereire, vagy eloszlására tett feltevés Mintát (mintákat) alkalmazunk a feltevés ellenőrzésére (tesztelésére) Hipotézisek megfogalmazása: Nullhipotézis: H 0 és ellen(alternatív) hipotézis H 1

25 Hipotézis formái Null (H0) ezt teszteljük → statisztikai próba alapján döntés: elfogadjuk vagy elvetjük Alternatív(H1) → ezzel szemben erről közvetve döntünk

26 Hipotézisek megfogalmazása Nullhipotézis felállítása: a hipotetikus adat (vagy eloszlás) és a tényleges adat (vagy eloszlás) között nincs eltérés. Pl. átlagra: → Alternatív hipotézis: a nullhipotézistől eltérő hipotézis matematikai megfogalmazása (egyoldali) Ezek közül azt választjuk, ami a hipotézisnek megfelel

27 A vizsgálat eszköze a próbafüggvény A próbafüggvény tulajdonságai: valószínűségi változó a véletlen minta elemeinek függvénye, értéke mintáról-mintára ingadozik, valószínűségi eloszlása bizonyos feltételek mellett ismert (feltételezve a H0 helyességét). Pl: Ha: X normális eloszlású változó, σ ismert, ha Ho helyes, akkor a próbafüggvény z változó N(0,1) esetén

28 . A statisztikai próbák elnevezése a függvénytípus alapján: z-próba, t-próba, F-próba stb. vagy kidolgozóik neve alapján: Wells-próba, Bartlett-próba stb.

29 A hipotézisvizsgálat (próba) menete 1.Megfogalmazzuk a Ho-t és a H1-et. Általában rögzítjük az  szignifikancia szintet (tévedés valószínűsége) is. 2.Eldöntjük a próbafüggvény típusát, azaz, hogy milyen próbát végzünk. 3. Kiszámítjuk az adott minta (minták) alapján a próbafüggvény aktuális értékét (próbastatisztika) adott formulák alapján. 4. Döntünk a hipotézisről (tesztelést végzünk): elfogadjuk a Ho-t, vagy visszautasítjuk, és a H 1 mellett döntünk.

30 . Próbafüggvény két értelmezése: - elméleti → véletlen változó, (táblázatok) -empirikus → mintá(k)ból számolt, aktuális érték (próbastatisztika) Fontos sajátosság! Az aktuális próbafüggvény Ho helyessége mellett: nagy valószínűséggel (1 -  ) az elfogadási tartományba (E), kis valószínűséggel (  ) a kritikus tartományba (K)eső értéket vesz fel.

31 . Pl. z próbafüggvény eloszlása E és K tartomány lehetséges 3 esete Az E és K tartományt a kritikus érték választja el, Ca: alsó kritikus érték Cf : felső kritikus érték A kritikus értéket a szignifikancia szint alapján lehet meghatározni (táblázatok, számítógépes programok) caca cfcf cfcf caca Elfogadási (E) tartomány: fehér Kritikus (K) tartomány: fekete

32 Döntés a hipotézisről Ha a próbastatisztika értéke az E tartományba esik Ho-t elfogadjuk → a tapasztalati adatok α szignifikancia szinten szinten nem mondanak ellent a Ho-nak, ha a K tartományba esik, a Ho-t elvetjük és a H1-et fogadjuk el. Azt hogy melyik tartományba esik, az elméleti és az aktuális próbafüggvény összevetésével állapítjuk meg. Ez a döntés alapja!

33 . Döntés: a számított és az elméleti próbafüggvény értékének összevetésével,a z- próba példáján: ha z  z   H 0 elfogadása mellett döntünk, ha z  z   H 1 -et fogadjuk el. Döntés a p érték (aktuális próbafüggvény értékhez tartozó szignifikancia szint) alapján: ha: p ≤ α → Ho-t elvetjük, ha: p > α → H 1 -t fogadjuk el. H 1 elfogadásakor szignifikáns (statisztikailag jelentős) eltérést állapítunk meg.

34 Paraméteres próbák Átlagok próbái általános feltétel: a sokasági normális eloszlás a ) Egymintás átlagpróba Egy minta által képviselt alapsokaság átlaga ( μ vagy) megegyezik-e egy megadott értékkel ( μ 0 vagy Alkalmazható próbák: z-próba: → σ ismert, vagy a minta nagy (n > 30) t-próba: → σ nem ismert és a minta kicsi

35 . b ) Kétmintás átlagpróba - Két minta által képviselt alapsokaság átlaga megegyezik-e? - Származhatott-e a két minta adott átlagú alapsokaságból? Alkalmazható próbák: z-próba → σ –k azonosak, ismertek, vagy a minták kellően nagyok, t-próba → σ –k azonosak, de nem ismertek és a minta kicsi Welch-próba → σ –k nem azonosak, nem ismertek és a minta kicsi

36 . c ) Három- és többmintás átlagpróba Feltétel: szórások azonossága, minták függetlensége H 0 - A minták által képviselt alapsokasági átlagok megegyeznek-e? - Származhattak-e a minták adott átlagú alapsokaságból? Alkalmazható próba: Variancia-analízis → F-próba

37 . 2. Szórások próbái általános feltétel: a sokaság normális eloszlású és a minták függetlenek Sajátosság: nem közvetlenül a szórásokat, hanem a varianciákat hasonlítjuk össze. a ) Egymintás szóráspróba H 0 - Egy minta által képviselt alapsokaság szórása (σ) megegyezik-e egy adott értékkel (σ 0 ) - Származhatott-e egy minta adott szórású alapsokaságból? Alkalmazható próba: Khi-négyzet ( ) próba

38 . b) Kétmintás szóráspróba H 0 - Két minta által képviselt alapsokaság szórása megegyezik-e, - homogenitásuk azonos-e? - az átlagok összehasonlításánál melyik próbát alkalmazzuk ? Alkalmazandó próba: F-próba (Fisher-próba) Egyéb alkalmazás: Variancia-analízis

39 . c ) Három- és többmintás szóráspróba H 0 - A minták által képviselt alapsokasági szórások megegyeznek-e? Alkalmazandó próba: Bartlett-próba (van más is!) Nem-paraméteres próbák 1. Illeszkedésvizsgálat → H 0 - Egy sokasági eloszlás tekinthető-e normális (stb.) eloszlásúnak? - Két sokasági eloszlás azonos-e: 2. Függetlenségvizsgálat H 0 - Egy sokaság két ismérve független-e? -próba

40 Gyakorlati mintapéldák 1. Átlagokra tett feltevések vizsgálata a)Sokasági átlagra tett hipotézis ellenőrzése (egymintás átlagpróba) Példa: Egy termék gyártására vonatkozó szabvány: a kiszerelés tömege 1 kg ( ), szórása 0,09 kg ( σ 0 ) 0,09 kg. A szabványellenőrzés mintája: n=75 db. (Szignifikancia szint:  = 0,05) Feltevésünk: H 0 : = 1kg H 1 :  1 kg A minta átlagában a kiszerelés tömege 0,985 kg (a szórás 0,1 kg).

41 . Ismert sokasági szórás, nagy minta: z - próba Az aktuális z- próbafüggvény érték: Tesztelés: a)  (z) táblában  1-0,05 –nél z-érték = 1,65 reláció: 1,65) kritikus)  |1,5| aktuális H0 kerül elfogadásra

42 . b) az aktuális 1,5 próbafüggvény-érték szignifikancia szintje (p-érték) alapján:  (z) táblában z=1,65-nél  (z)= 0,9332 p = 1- 0,9332 = 0,0668  = 0,05  0,0668 Döntés H 0 -ra ugyanaz, elfogadva. Legkisebb szignifikancia szint, amelyen H 0 már éppen elvethető 6,68 %

43 . Kiegészítő mutató: Szignifikáns differencia (SzD  ) Mekkora az a különbség, ami még véletlennek tekinthető ? (maximális hiba) SzD  = z  /2  = 1,96  0,01 = 0,0196 > 0,015 Ha SzD  > → H 0 elfogadása

44 . b) Két sokasági átlagra tett feltevés vizsgálata: (két mintás) t-próba példa: „A” és „B”terméket hasonlítunk össze a minőség szempontjából. Azt vizsgáljuk, hogy különböző minőségű termékekről van-e szó. A hipotézisek: A hipotézis ellenőrzésére mindkét termékből 6-6 tagú mintavételre került sor :

45 . „A” termék átlaga: 2,06 gr N/100gr szórása: 0,135 „B” termék átlaga: 1,86 gr N/100gr szórása: 0,063 Próbafüggvény: Szabadságfok: n1+n2 - 2= = 10 t α/2 (SzF10) = 2,23 < 3,28 → Ho elutasítása, H 1 elfog. Ekkora eltérés még véletlennek tekinthető Szignifikáns → differencia

46 Szórásnégyzetek próbái 1. Feltevés sokasági szórásnégyzetre (szórásra) példa: Az átlag tesztelésének példájában szereplő termék szórásának szabványa 0,09 kg, ezzel szemben a mintaszórás 0,1 kg-ot tett ki (  5 %). Hipotézisek: Az alkalmazandó próba:  2 -próba A próbafüggvény : Elmélet próbafüggvény érték: = 90,5 (SzF = 74)  2  Döntés: El kell vetnünk a H 0 –t, a szórás nagyobb a megengedettnél.

47 . Két sokasági szórásnégyzetre (szórásra) vonatkozó feltevés példa: A két átlag összehasonlításának példájában (lásd korábban) feltételeztük a szórás-azonosságot. Ellenőrizzük le e feltételezést,  5 %! Hipotézis: Alkalmazandó: F- próba (Fisher) SzF(számláló) n – 1 = 6 – 1 = 5 SzF (nevező) n – 1 = 6 – 1 = 5 F 0,05 = 5,05 Döntés: 3,29  5,05  H 0 elfogadása szórások azonosak

48 Összefüggés-vizsgálat Regresszió és korrelációszámítás

49 Ismérvek közötti összefüggések Lehetséges esetek: 1.Kapcsolat hiánya 2.Függvényszerű kapcsolat (determinisztikus) 3.Sztochasztikus kapcsolat (tendenciaszerű, valószínű érvényű) - asszociáció → minőségi ismérvek - rangkorrelációs kapcsolat, sorrendi (ordinális) skálán mért ismérvek, - vegyes kapcsolat, minőségi és mennyiségi ismérvek, - korreláció, mennyiségi ismérvek (kettő és több)

50 Mennyiségi ismérvek (2) kapcsolatának lehetséges esetei Kapcsolat hiánya Függvényszerű kapcsolat Sztochasztikus kapcsolatok

51 . Korreláció: mennyiségi ismérvek közötti sztochasztikus (tendenciaszerű) kapcsolat. Példák: : 1. egy főre jutó egy főre jutó jövedelem fogyasztás 2. adott típushoz tartozó használt gépkocsik életkora → eladási ára 3. felhasznált növényi termék műtrágya hozama Összefüggés típusok: a)ok-okozati összefüggés (műtrágya - hozam) b)kölcsönhatás (ár – kereslet) c)hamis korreláció (testsúly – érdemjegy) → →

52 . Ismérvek = változók Jelölés és elnevezés: x változó  tényező-, vagy magyarázóváltozó, y változó  eredményváltozó Kapcsolatvizsgálat Regresszióanalízis Korrelációszámítás a kapcsolatban lévő a kapcsolat szorosságát tendenciát függvénnyel intenzitását jellemzi, + írja le determináció vizsgálat

53 Regresszószámítás: Modellezés analitikus függvényekkel Elméleti sztochasztikus modell: Y = + ε → regresszió ε → véletlen(ek) hatása = f(X) vagy = f(X 1, X 2,…X p ) kétváltozós többváltozós f : függvény típus lineáris nemlineáris exponenciális, hatványkitevős, hiperbolikus, parabolikus, stb.

54

55 .

56 Az összefüggés-vizsgálat regresszió- és korrelációszámítással Lépések: 1.Célkitűzés: y és x változók megválasztása (szakmai és statisztikai szempontok), az alkalmazási cél megfogalmazása. 2. Adatbázis megteremtése → saját (primer) megfigyelések, vagy szekunder statisztika. 3. A regressziós függvény típusának megválasztása (specifikáció). Az optimális modell függvény meg- találásának szempontjai: legszorosabb i lleszkedés, célkitűzésnek legjobb megfelelés, szakirodalmi ajánlások. Előzetes és utólagos specifikáció.

57 . 4. Regressziószámítás a) Függvény paraméterek becslése, b) Regressziós értékek meghatározása, illeszkedésvizsgálat, c) a modell tesztelése, konfidencia-intervallumok számítása, d) ábrázolás, következtetések. 5. Korrelációszámítás a) korrelációs mérőszám(ok) számítása, b) determináció-vizsgálat, c) következtetések.

58 Kétváltozós regresszió-analízis és korrelációszámítás Lineáris regresszió Regressziós függvény becslése→ paraméterek számítása Legszorosabb illeszkedés (legkisebb négyzetek elve) Megoldás: a változók átlageltérései (d x, d y ) alapján végzett transzformációval Megoldás: normálegyenletek: → minimum Levezetett képletek:

59 . Regressziós becslések (értékek) számítása Regressziós egyenletbe x-ek behelyettesítésével -ek számítása Illeszkedésvizsgálat illesztés standard hibája: σ e vagy S e Hipotézisellenőrzések, konfidencia-intervallum számítások: a becslés és hipotézisellenőrzés témában tanult eljárások szerint illesztés relatív hibája: (reziduumok)

60 Értelmezés: Regressziós együtthatók: bo: X = 0 esetén Y mekkora értéket vesz fel átlagosan ha az X= 0 szerepel az X értékek között) b 1 : x adott értékének egy egységnyi változására átlagosan milyen mértékű változással reagál y (a vizsgált y tartományban). A változók kölcsönhatása esetén: x egységnyi változása átlagosan mekkora y változással jár együtt. Regressziós értékek: -ek adott x értékhez mekkora y érték valószínűsíthető (a vizsgált x tartományban)

61 . Korrelációszámítás: 0 és │1│közötti mérőszámok – 0,4 laza, 0,4 – 0,7 közepes 0,7 – 0,9 szoros 0,9 – igen szoros kapcsolat Korrelációs együttható: Számítás alapja a változók átlagtól való eltérései: Determinációs együttható: Korrelációs index (hányados) Tesztelés t-próbával

62 . Nemlineáris regressziós modellek Linearizálhatók: a) Exponenciális: log y =log b 0 +x ∙log b 1 lineáris a kapcsolat x és log y között Értelmezés: 100 b 1 → x egy egységnyi változására jutó y %-os változása ( mint Vdin.) b) Hatványkitevős: log y =log b 0 + b 1 ∙log x lineáris a kapcsolat log x és log y között Értelmezés: b 1 → x egy %-os változására jutó y %-os változása (elaszticitás). Hiperbolikus: lineáris a kapcsolat 1/x és y között Értelmezés: y b 0 felé tart x nagymértékű növekedésével

63 . Másodfokú parabolikus regresszió Paraméterek számítása normálegyenletekből: Paramétereket nem értelmezzük Szélsőérték számítás: x 0 = - b 1 / 2b 2 y o → x 0 behelyettesítésével Korrelációszámítás: Korrelációs hányados

64 . Mintapélda Tíz gazdasági egység alábbi megfigyelései alapján vizsgáljuk egy termelési folyamatban az anyagköltség (x) és a termelési érték (y) közötti összefüggést (a változók mértékegysége E Ft/ha) Válto- zók m e g f i g y e l é s e k x y

65 . 1. közelítés: Lineáris regresszió a) Regressziós függvény paramétereinek becslése

66 . b) Regressziós becslések (értékek) számítása Illeszkedésvizsgálat

67 . c) Hipotézisellenőrzések, konfidencia-intervallum - ( Varianciaanalízis) - Paraméterek → standard hibák tesztelések, konfidencia-intervallumok b 1 paraméter b 1 konfidencia-intervalluma:  b 1 = t  /2  sb = 2,31  0,225 = 0,52 h 1 = 1,014 – 0,52 = 0,494 h 2 = 1, ,52 = 1,534

68 . Korrelációszámítás: Korrelációs együttható: Szoros pozitív kapcsolat Determináció: Az anyagköltség 71,7 %-ban magyarázza a termelési érték alakulását, a véletlennek 28,3 %-os a hatása.

69 . Az anyagköltség és a termelési érték kapcsolatot modellező különböző regressziós modellek ábrái

70 Idősorok elemzése Idősorok összetevői

71 Idősorok egyszerűbb elemzési módszerei Tapasztalati idősor: Időismérv: t 1, t 2, …t i,… t n Megfigyelt érték: y 1, y 2, …y i,…y n Állapot-idősor és tartam-idősor Egyszerűbb módszerek: Viszonyszámok → V d (bázis és lánc) Ábrázolás → grafikonok, oszlopdiagramok poláris diagram Átlagok Indexek → Összhatás indexkör és értékindex-kör

72 . Idősor átlaga Tartamidősor Állapotidősor Változások átlaga Abszolút (mérték) Relatív (ütem)

73 re vonatkozó: 1. negyedévi átlagos létszám: Negyed- év Létszám fő* Árbevétel M Ft 2010 I II III IV I Mintapélda: Egy cég adatai: * Negyedév elején 2. Negyedévi átlagos árbevétel

74 . 1. Abszolút (mérték): Negyed- év Árbevétel M Ft 2010 I.260 II.320 III.350 IV I.425 Mintapélda: Egy cég adatai: * Negyedév elején 2. Relatív (ütem): Árbevétel átlagos negyedévi változása 2010-ben:

75 Idősorok összetevőinek vizsgálata Idősor komponensek Alapirányzat vagy trend Y Szezonális (idényszerű) hullámzás S Ciklikus hullámzás C Véletlen hatás (ingadozás) V Idősor modellek 1. Y = Y, V éves adatokból álló idősor 2.Y = S, V trendmentes, idényekből álló idősor 3.Y = Y, S, V i dényekből álló, nem stagnáló idősor 4. Y = Y, S, V, C hosszú, idényekből álló idősor Periodikus ingadozás

76 . Idősor modellek Additív Multiplikatív 1. Y = Y + V Y = Y ∙ V 2. Y = S + V Y = S ∙ V 3. Y = Y + S + V Y = Y ∙ S ∙ V 4. Y = Y + S + C + V Y = Y ∙ S ∙ C ∙ V Az összetevők vizsgálata: felbontjuk komponenseire, elkülönítjük az összetevők egyedi hatását. Additív Multiplikativ azonos kilengés növekvő kilengés (csökkenő) Pl. 3. modell :

77 Trendszámítás Cél: a fő tendencia kimutatása, az idősor kisimítása Két módszer: a) mozgóátlagolás b) analitikus trendszámítás Mozgóátlagolás Láncolatosan tovahaladó k tagszámú átlagolás - páratlan tagszám: pl. k=3 y 1 = (y 1 +y 2 +y 3 )/ 3, y 2 = y 2 +y 3 +y 4 )/ 3, stb. - páratlan tagszám: pl. k=4 öttagú kronológikus átlag (lásd mintapélda) Előny: gyors kisimítás Hátrány: lerövidülés, nincs számszerű információ, csak ábra

78 . Mozgó átlagok számításának sémája k=3

79 Egy gazdálkodó szervezet árbevételének adatai k megválasztása: ne legyen se túl kicsi, se túl nagy, szezonalitás esetén k=idények száma, vagy többszöröse.

80 . Árbevétel és mozgóátlagolású trendjének alakulása

81 . Analitikus trendszámítás Legjobb kisimítás, az idősor alapirányzatát valamilyen ismert függvénnyel fejezzük ki (alaptendencia matematikai modellje; (lásd regresszió-elemzés) Alkalmazás: Múltbeli tendencia megismerése (információk: paraméterek, trendértékek) Előrejelzés → trendextrapoláció

82 . Az analitikus trendszámítás feladatai: 1. A megfelelő trendfüggvény kiválasztása; specifikáció. Választható trendfüggvények: a) lineáris b) exponenciális, c) hiperbolikus, d) parabolák, e) logisztikus függvény. legszorosabb illeszkedés elve: 2. A választott trendfüggvény meghatározása (paraméterek becslése legkisebb négyzetek elvén ) 3. Trendértékek kiszámítása 4. Trendfüggvény-illeszkedés mérése Se, Vse 5. Következtetések levonása → minimum

83 . Lineáris trendszámítás Paraméterek számításához → normálegyenletek Megoldás: kódolt t értékekkel a)  t = 0 feltétel Kódolás páratlan és páros tagszámú idősornál: b) t = 1, 2,. n (számítógépes programok)

84 . Σt=0 → Paraméterek számítása b)t = 1, 2,. N Négy  közvetlen normálegyenletbe való Behelyettesítésével az egyenletek megoldása a)  t = 0

85 . Példa: Egy cég dolgozói létszámának alakulása: Trendegyenlet meghatározása Trendegyenlet:

86 . t = 1, 2,. n kódolással a trendegyenlet: Trendértékek számítása: (első és utolsó) = 281,4 + (25,1  -3) = 206,2 (206 fő) vagy 181,1 + (25,1  1) = 206 = 281,1 + (25,1  3) = 356,8 (357 fő) Illeszkedésvizsgálat: Értelmezés: b o : évi átlaglétszám 281 fő (  t = 0) 2003 évi becsült létszám 181 fő ( t = 1, 2,.n) b 1 : évente átlagosan 25 fővel nőtt a létszám Páros tagú idősor esetén 2b 1 -et értelmezünk

87 . Exponenciális trend: a szomszédos relatív változások megközelítően állandóak Modell: Linearizálás: logaritmus transzformációval Megoldás a lineáris közelítés szerint Értelmezés: 100∙b 1 → változás átlagos üteme %-ban (páros tagú idősornál b 1 négyzetét értelmezzük) Hiperbolikus trend: modell: Információ: Y hosszú távon b 0 felé tart Parabolikus trend: a változás irányában törés: növekedés és csökkenés → konkáv par. Csökkenés és növekedés → konvex par. Információ: szélsőérték → a törés mikor volt ?

88 . Logisztikus trend → hosszú idősoroknál. Három jellegzetes szakasz: 1. lassú növekedés 2. gyors felfutás, 3. csökkenő mértékű növekedéssel közeledés a telítődési szinthez (termékek életgörbéje) k a trend maximális értéke, azaz a telítődési szint Modell: A mobil-előfizetők számának alakulása )

89 Szezonalitás elemzése Szezonális hullámzás jellemzője: zömmel rövid táv (éves periódus), azonos hullámhossz, rendszeres ismétlődés, azonos idényekben azonos irányú kilengések Szezonális ingadozás mérése a)szezonális eltérések Sze j (additív idősor) b) szezonindexek Szi j (multiplikatív idősor) j: az idények száma

90 Mérés trendmentes idősorokban 1. Az idősor azonos idényeinek adatait átlagoljuk → véletlen kiküszöbölése. 2. Kiszámítjuk az idősor (fő)átlagát 3. Az idényátlagokat a főátlaghoz viszonyítjuk. - Additív idősor (Y=S+V) : kivonás → Sze j ( j=1,2,.j): eltérések mértéke (több, vagy kevesebb) az idényátlagtól - Multiplikatív idősor: (Y=S ∙ V) osztás → Szi j ∙ 100 : százalékos eltérések az szezonátlagtól

91 . Példa: Egy cég munkavállalói létszáma, fő Szezonális eltérések: fő Sze 1: = -11 Sze 2: = - 1 Sze 3: = 17 Sze 4: = - 5 Σ = 0 Szezonindexek, % Szi 1 : 24 : 35 = 0,686 68,6 % Szi 2 : 34 : 35 = 0,971 97,1 % Szi 3 : 52 : 35 = 1, ,6 % Szi 4 : 30 : 35 = 0,857 85,7 % Σ = 4

92 Mérés trendet tartalmazó idősorban 1. Trendérték meghatározása (mozgóátlagolással, vagy trendfüggvények segítségével). 2Trendkiszűrés az idősor modell átrendezésével - Additív modell: jobboldalon már csak S és V hatások - Multiplikatív modell: 3Véletlen hatás leválasztása a trendmentes adatok idényenkénti egyszerű számtani átlagolásával: - Additív modell → szezonális eltérések - Multiplikatív modell → szezonindexek Értelmezés: a trendértéktől való abszolút (Sze j ) és %-os (Szi j ) eltérések a j idényben

93 . Szezonalitás mérése Egy cég árbevétel adatai:

94 . Szezonális eltérések: M Ft Sze 1 = (6, ,5) : 3 = 5,4 Sze 2 =(– 1,8 – 6,5 – 3,5) : 3 = – 3,9 Sze 3 = (– 12 – 9,5 – 5,5) : 3 = – 9,0 Sze 4 = (4, ,4) : 3 = 6,7 Szezonindexek: % Szi 1 = (1,045+1,031+1,026) : 3 = 1,034  103,4 % Szi 2 = (0,988+0,961+0,980) : 3 = 0,976  97,6 % Szi 3 = (0,915+0,940+0,967) : 3 = 0,941  94,1 % Szi 4 = (1,032+1,050+1,043) : 3 = 1,042  104,2 %

95 . A szezonális mérőszámok felhasználása A mérőszámok információinak figyelembe vétele a gyakorlatban (pl. éves tervek idényekre bontása, előrejelzések készítése) Szezonhatás kiszűrése az idősorokból, azaz szezonálisan kiigazított idősorok képzése Árbevétel mintapélda szezonális kiigazítása Y/Szij

96 Ciklikus komponens vizsgálata Kétféle lehetőség a C becslésére: Analitikus trendértékekkel mentesített (Y/Y) idősoron végzett mozgóátlagolással. Mozgóátlagolású trend és az analitikus trend különbségével (hányadosával). A mozgóátlagolás a V hatását szűri ki. Az így kapott értékek ábrája ad információt a ciklikus hatásról (ciklushossz, ciklus- szakaszok, csúcs- és mélypontok)

97 . Előrejelzés: idősorból végzett becslés Ex ant: a megfigyelési időszakon kívülre Leggyakrabban használt módszerek: Idősor komponensek (trend stb.) alapján Simító eljárások, Komplex modellek (sztochasztikus eljárások) Szakértői becslések Idősor komponensek alapján - Trend-extrapoláció: pl. a t+1 időszakra: Lineáris trend: - Szezonalitás figyelembe vétele: Additív m. Multipl. m..


Letölteni ppt "GVAM BSc szak STATISZTIKA II előadás sorozat Készítette Dr. Kardos Zoltánné."

Hasonló előadás


Google Hirdetések