GVAM BSc szak STATISZTIKA II előadás sorozat

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Hipotézis-ellenőrzés (Statisztikai próbák)
I. előadás.
II. előadás.
BECSLÉS A sokasági átlag becslése
Kvantitatív Módszerek
Kvantitatív módszerek
Gazdasági informatika
Matematikai Statisztika VIK Doktori Iskola
Mérési pontosság (hőmérő)
Gazdaságelemzési és Statisztikai Tanszék
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Statisztika II. X. Dr. Szalka Éva, Ph.D..
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Regresszióanalízis 10. gyakorlat.
Agrár BSc szakok Statisztikai következtetések
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Kvantitatív módszerek
Nemparaméteres próbák Statisztika II., 5. alkalom.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
STATISZTIKA II. 6. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Idősor komponensei Trend vagy alapirányzat: az idősor alakulásának fő irányát mutatja meg. Szezonális vagy idényszerű ingadozás: szabályos időszakonként.
Matematikai statisztika Készítették: Miskoltzy Judit Sántha Szabina Szabó Brigitta Tóth Szabolcs Török Tamás Marketing Msc I. évf., I. félév, levelező.
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 18. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Következtető statisztika 9.
Hipotézis-ellenőrzés (Folytatás)
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapsokaság (populáció)
Lineáris regresszió.
t A kétoldalú statisztikai próba alapfogalmai
Két kvantitatív változó kapcsolatának vizsgálata
Paleobiológiai módszerek és modellek 4. hét
I. előadás.
A kombinációs táblák (sztochasztikus kapcsolatok) elemzése
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
A számítógépes elemzés alapjai
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
II. előadás.
Becsléselmélet - Konzultáció
Gazdaságstatisztika konzultáció
Gazdaságstatisztika Konzultáció a korreláció- és regressziószámítás, idősorok elemzése témakörökből.
I. Előadás bgk. uni-obuda
III. zárthelyi dolgozat konzultáció
Hipotézisvizsgálatok Paraméteres próbák
Sztochasztikus kapcsolatok I. Asszociáció
Dr. Varga Beatrix egyetemi docens
Trendelemzés előadó: Ketskeméty László
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Dr. Varga Beatrix egyetemi docens
1.3. Hipotézisvizsgálat, statisztikai próbák
Előadás másolata:

GVAM BSc szak STATISZTIKA II előadás sorozat Készítette Dr. Kardos Zoltánné

ADATSZERZÉSI MÓDOK 1. Adatfelvétel Teljes körű Részleges Reprezentatív Egyéb részleges Véletlen minta Nem véletlen minta 2. Adminisztratív adatforrás (nem statisztikai célú adatgyűjtésekből származó adatállomány) 3. Kísérletek

Statisztikai következtetések Mintaértékelések Becslések Hipotézisvizsgálat feltételezések ellenőrzése 1. Pontbecslés 2. Intervallumbecslés A sokasági jellemző közelítő értékének meghatározása.

Mintaértékelés alapfogalmai . Mintaértékelés alapfogalmai Alapsokaság (sokaság, populáció), amelyet mintából végzett következtetés alapján ismerünk meg. - Létező alapsokaság (mintavétel) - Hipotetikus alapsokaság (kísérletek képviselik a mintát) Elemszám (ha véges) N Elemei: X1, X2, …….XN Statisztikai paraméterek: átlag: μ ( ) szórás: σ, arány: P stb.

. 2. Mintasokaság (minta), a sokaság része, amelyből következtetünk - Elemszám: n kiválasztási arány: f = n/N - Elemek: x1, x2, …….xn - Statisztikai becsült értékek: átlag szórás: s, arány: p stb. A minta eredete: a) mintavétel, b) kísérlet Elvárás: véletlen jelleg, reprezentálja az alapsokaságot, (egyforma esély a kiválasztásnál).

. Becslés gyakorlati alkalmazási esetei: termésbecslés, minőség-ellenőrzés gazdaság szervezeti egységeinek megfigyelése (5-49 főt foglalkoztatók) egyéni gazdaságok (mezőgazdaság) megfigyelése, háztartások megfigyelése, közvélemény-kutatás

. Gyakorlati mintavételi módok: 1. Véletlen mintavétel: (alapsokaságról nyilvántartás) a) egyszerű véletlen szúrópróba, sorsolás, számítógépes véletlenszám-generáló program b) rétegezett c) lépcsőzetes egy-, két-, többlépcsős 2. Nem-véletlen mintavétel: koncentrált, kvóta szerinti, hólabdaszerű stb.

A mintaértékelés jellemzői a) Mintaméret b) Véletlen (mintavételi) hiba: a becsült mintaérték és a sokasági paraméter eltérése (pontosság a standard hibával mérve) c) Valószínűség: megbízhatóság, biztonság (konfidencia szint) kiegészítője a tévedés valószínűsége (hiba- vagy szignifikancia szint, kifejezés: elméleti eloszlásfüggvényekkel

. I. Becslés (reprezentatív megfigyelés) Lényege: előny → gyors, olcsó információszerzés hátrány → pontatlanság, valószínűség A becslés két formája: Pontbecslés: n elemű minta becsült értékével Intervallumbecslés: értékközzel, amely tetszőlegesen nagy valószínűséggel tartalmazza a sokasági paramétert (pl. átlagot) .

h1 I I I h2 Megbízhatósági értékköz (konfidencia intervallum) Δ Δ . Megbízhatósági értékköz (konfidencia intervallum) Δ Δ h1 I I I h2 minta becsült értéke h1 : alsó valószínű határ h2 : felső valószínű határ Δ: hibahatár, maximális eltérés adott biztonsággal.

Sokasági átlag intervallumbecslése . Sokasági átlag intervallumbecslése valószínűségi (megbízhatósági) szint megadása n elemű mintavétel minta átlagának és szórásának számítása: s standard hiba számítása: vagy eloszlás függvényérték megállapítása (z vagy t), hibahatár számítása: Δ (abszolút) és VΔ (relatív) konfidencia intervallum határainak megadása Nevezetes eloszlások: standard normális eloszlás z Student-féle t-eloszlás t

. Standard hiba: Hibahatár: (abszolút) z és t eloszlásfüggvény értékek (relatív) Konfidencia határok:

Standard normális eloszlás (x) tábla vagy z-tábla (z) tábla 1,96 0,9500 (x) = átlag +"x" alá esés (z) = az átlag "z" valószínűsége környezetébe esés valószínűsége

.

További (esetleges) becslési feladatok Adott hibahatárhoz (konfidencia határokhoz) tartozó biztonság megállapítása Adott pontosságú és biztonságú becsléshez szükséges minta elemszám meghatározása

Összefoglalva: becslés 3 esete: Adott: az n és a biztonság Φ(z) vagy Φ(t) keresett: a pontosság (Δ, illetve h1 és h2) (ez a leggyakoribb) 2. Adott: az n és a pontosság keresett: a biztonság 3. Adott: a biztonság és a pontosság keresett: az n

1. Mintapélda: Átlagbecslés Mintapéldák 1. Mintapélda: Átlagbecslés 55 ezer vállalkozó közül kiválasztott 102 tagú egyszerű véletlen minta alapján becsülni kívánjuk „X” termék önköltségét 95 %-os biztonsággal. Feladat: Sokasági átlag konfidencia intervallumának meghatározása adott biztonsággal (Feltételek: ismeretlen sokasági eloszlás és szórás, nagy n → z–eloszlás)

Az adatfelvételt követő számítási eredmények: A szükséges további számítások:

Teljes megfigyelés esetén az 55 ezer adat tényleges (sokasági) átlaga 95 %-os biztonsággal 1786 és 2014 Ft/db értékek közé esne. A tényleges önköltség jelzett határokon kívül esésének valószínűsége összesen 5 %.

. az ahhoz tartozó biztonsági szint megállapítása. Rögzített (pontosabb) konfidencia határokhoz tartozó biztonság meghatározása Kérdés: Milyen biztonsággal tudnánk 5 %-os relatív hibahatárt megadni? Feladat: z érték és az az ahhoz tartozó biztonsági szint megállapítása. A keresett biztonság: 1 - 2[1 - (z) ] = 1 – 2(1 – 0,9484) = 0,897 → 89,7 %

Kérdés: hány vállalkozót (n) kellene megfigyelni Rögzített konfidencia határokhoz és adott biztonsághoz tartozó minta-elemszám Kérdés: hány vállalkozót (n) kellene megfigyelni 1805 -1995-ös konfidencia intervallumú és 95 %-os biztonságú becsléshez? Adott feltételekhez 147 elemű mintára lenne szükség.

2. Mintapélda (kis elemszám) Egy Kft. konzervüzemében egy 8 ezer dobozos őszibarack konzerv tételből vett 25 elemű véletlen mintán ellenőrzik az átlagos töltősúlyt (tömeget) 95 % -os biztonsággal. Feltételek: ismeretlen sokasági eloszlás és szórás, kis elemszám  t (Student) eloszlás! A mintába került 25 doboz mérési eredményei: mintaátlag : 495 gr/doboz, mintaszórás: 28 „

A szükséges számítások az átlagbecsléshez

II. Hipotézis vizsgálatok (szignifikancia vizsgálatok, statisztikai próbák) Hipotézis: alapsokaság paramétereire, vagy eloszlására tett feltevés Mintát (mintákat) alkalmazunk a feltevés ellenőrzésére (tesztelésére) Hipotézisek megfogalmazása: Nullhipotézis: H0 és ellen(alternatív) hipotézis H1

ezt teszteljük → Hipotézis formái Null (H0) statisztikai próba alapján döntés: elfogadjuk vagy elvetjük Alternatív(H1) → ezzel szemben erről közvetve döntünk

Hipotézisek megfogalmazása Nullhipotézis felállítása: a hipotetikus adat (vagy eloszlás) és a tényleges adat (vagy eloszlás) között nincs eltérés. Pl. átlagra: → Alternatív hipotézis: a nullhipotézistől eltérő hipotézis matematikai megfogalmazása (egyoldali) Ezek közül azt választjuk, ami a hipotézisnek megfelel

A vizsgálat eszköze a próbafüggvény A próbafüggvény tulajdonságai: valószínűségi változó a véletlen minta elemeinek függvénye, értéke mintáról-mintára ingadozik, valószínűségi eloszlása bizonyos feltételek mellett ismert (feltételezve a H0 helyességét). Pl: Ha: X normális eloszlású változó, σ ismert, ha Ho helyes, akkor a próbafüggvény z változó N(0,1) esetén

A statisztikai próbák elnevezése a függvénytípus alapján: z-próba, . A statisztikai próbák elnevezése a függvénytípus alapján: z-próba, t-próba, F-próba stb. vagy kidolgozóik neve alapján: Wells-próba, Bartlett-próba stb.

A hipotézisvizsgálat (próba) menete Megfogalmazzuk a Ho-t és a H1-et. Általában rögzítjük az  szignifikancia szintet (tévedés valószínűsége) is. Eldöntjük a próbafüggvény típusát, azaz, hogy milyen próbát végzünk. 3. Kiszámítjuk az adott minta (minták) alapján a próbafüggvény aktuális értékét (próbastatisztika) adott formulák alapján. 4. Döntünk a hipotézisről (tesztelést végzünk): elfogadjuk a Ho-t, vagy visszautasítjuk, és a H1 mellett döntünk.

. Próbafüggvény két értelmezése: - elméleti → véletlen változó, (táblázatok) empirikus → mintá(k)ból számolt, aktuális érték (próbastatisztika) Fontos sajátosság! Az aktuális próbafüggvény Ho helyessége mellett: nagy valószínűséggel (1 - ) az elfogadási tartományba (E), kis valószínűséggel () a kritikus tartományba (K)eső értéket vesz fel.

Pl. z próbafüggvény eloszlása E és K tartomány lehetséges 3 esete Az E és K tartományt a kritikus érték választja el, Ca: alsó kritikus érték Cf : felső kritikus érték A kritikus értéket a szignifikancia szint alapján lehet meghatározni (táblázatok, számítógépes programok) Elfogadási (E) tartomány: fehér Kritikus (K) tartomány: fekete ca cf ca cf

Döntés a hipotézisről Ha a próbastatisztika értéke az E tartományba esik Ho-t elfogadjuk → a tapasztalati adatok α szignifikancia szinten szinten nem mondanak ellent a Ho-nak, ha a K tartományba esik, a Ho-t elvetjük és a H1-et fogadjuk el. Azt hogy melyik tartományba esik, az elméleti és az aktuális próbafüggvény összevetésével állapítjuk meg. Ez a döntés alapja!

ha z  z   H0 elfogadása mellett döntünk, Döntés: a számított és az elméleti próbafüggvény értékének összevetésével,a z- próba példáján: ha z  z   H0 elfogadása mellett döntünk, ha z  z   H1-et fogadjuk el. Döntés a p érték (aktuális próbafüggvény értékhez tartozó szignifikancia szint) alapján: ha: p ≤ α → Ho-t elvetjük, ha: p > α → H1-t fogadjuk el. H1 elfogadásakor szignifikáns (statisztikailag jelentős) eltérést állapítunk meg. .

Paraméteres próbák Átlagok próbái általános feltétel: a sokasági normális eloszlás a ) Egymintás átlagpróba Egy minta által képviselt alapsokaság átlaga ( μ vagy) megegyezik-e egy megadott értékkel ( μ0 vagy Alkalmazható próbák: z-próba: → σ ismert, vagy a minta nagy (n > 30) t-próba: → σ nem ismert és a minta kicsi

. b ) Kétmintás átlagpróba - Két minta által képviselt alapsokaság átlaga megegyezik-e? - Származhatott-e a két minta adott átlagú alapsokaságból? Alkalmazható próbák: z-próba → σ –k azonosak, ismertek, vagy a minták kellően nagyok, t-próba → σ –k azonosak, de nem ismertek és a minta kicsi Welch-próba → σ –k nem azonosak, nem ismertek és a minta kicsi

. c ) Három- és többmintás átlagpróba Feltétel: szórások azonossága, minták függetlensége H0 - A minták által képviselt alapsokasági átlagok megegyeznek-e? - Származhattak-e a minták adott átlagú alapsokaságból? Alkalmazható próba: Variancia-analízis → F-próba

. 2. Szórások próbái általános feltétel: a sokaság normális eloszlású és a minták függetlenek Sajátosság: nem közvetlenül a szórásokat, hanem a varianciákat hasonlítjuk össze. a ) Egymintás szóráspróba H0 - Egy minta által képviselt alapsokaság szórása (σ) megegyezik-e egy adott értékkel (σ0) - Származhatott-e egy minta adott szórású alapsokaságból? Alkalmazható próba: Khi-négyzet ( ) próba

b) Kétmintás szóráspróba H0 - Két minta által képviselt alapsokaság . b) Kétmintás szóráspróba H0 - Két minta által képviselt alapsokaság szórása megegyezik-e, - homogenitásuk azonos-e? - az átlagok összehasonlításánál melyik próbát alkalmazzuk ? Alkalmazandó próba: F-próba (Fisher-próba) Egyéb alkalmazás: Variancia-analízis

. c ) Három- és többmintás szóráspróba H0 - A minták által képviselt alapsokasági szórások megegyeznek-e? Alkalmazandó próba: Bartlett-próba (van más is!) Nem-paraméteres próbák 1. Illeszkedésvizsgálat → H0 - Egy sokasági eloszlás tekinthető-e normális (stb.) eloszlásúnak? - Két sokasági eloszlás azonos-e: 2. Függetlenségvizsgálat H0 - Egy sokaság két ismérve független-e? -próba

Gyakorlati mintapéldák 1. Átlagokra tett feltevések vizsgálata Sokasági átlagra tett hipotézis ellenőrzése (egymintás átlagpróba) Példa: Egy termék gyártására vonatkozó szabvány: a kiszerelés tömege 1 kg ( ), szórása 0,09 kg (σ0) 0,09 kg. A szabványellenőrzés mintája: n=75 db. (Szignifikancia szint:  = 0,05) Feltevésünk: H0 : = 1kg H1 :  1 kg A minta átlagában a kiszerelés tömege 0,985 kg (a szórás 0,1 kg).

. Ismert sokasági szórás, nagy minta: z - próba Az aktuális z- próbafüggvény érték: Tesztelés: (z) táblában 1-0,05 –nél z-érték = 1,65 reláció: 1,65) kritikus)  |1,5| aktuális H0 kerül elfogadásra

(z) táblában z=1,65-nél (z)= 0,9332 p = 1- 0,9332 = 0,0668 . b) az aktuális 1,5 próbafüggvény-érték szignifikancia szintje (p-érték) alapján: (z) táblában z=1,65-nél (z)= 0,9332 p = 1- 0,9332 = 0,0668  = 0,05  0,0668 Döntés H0 -ra ugyanaz, elfogadva. Legkisebb szignifikancia szint, amelyen H0 már éppen elvethető 6,68 %

Szignifikáns differencia (SzD) Mekkora az a különbség, ami még . Kiegészítő mutató: Szignifikáns differencia (SzD) Mekkora az a különbség, ami még véletlennek tekinthető ? (maximális hiba) SzD = z/2  = 1,96  0,01 = 0,0196 > 0,015 Ha SzD > → H0 elfogadása

. b) Két sokasági átlagra tett feltevés vizsgálata: (két mintás) t-próba példa: „A” és „B”terméket hasonlítunk össze a minőség szempontjából. Azt vizsgáljuk, hogy különböző minőségű termékekről van-e szó. A hipotézisek: A hipotézis ellenőrzésére mindkét termékből 6-6 tagú mintavételre került sor :

tα/2 (SzF10) = 2,23 < 3,28 → Ho elutasítása, H1 elfog. „A” termék átlaga: 2,06 gr N/100gr szórása: 0,135 „B” termék átlaga: 1,86 gr N/100gr szórása: 0,063 Próbafüggvény: Szabadságfok: n1+n2 - 2= 6 + 6 - 2 = 10 tα/2 (SzF10) = 2,23 < 3,28 → Ho elutasítása, H1 elfog. Szignifikáns → differencia Ekkora eltérés még véletlennek tekinthető

Szórásnégyzetek próbái 1. Feltevés sokasági szórásnégyzetre (szórásra) példa: Az átlag tesztelésének példájában szereplő termék szórásának szabványa 0,09 kg, ezzel szemben a mintaszórás 0,1 kg-ot tett ki (  5 %). Hipotézisek: Az alkalmazandó próba: 2 -próba A próbafüggvény: Elmélet próbafüggvény érték: = 90,5 (SzF = 74) 2  Döntés: El kell vetnünk a H0 –t, a szórás nagyobb a megengedettnél.

. Két sokasági szórásnégyzetre (szórásra) vonatkozó feltevés példa: A két átlag összehasonlításának példájában (lásd korábban) feltételeztük a szórás-azonosságot. Ellenőrizzük le e feltételezést,  5 %! . Hipotézis: Alkalmazandó: F- próba (Fisher) SzF(számláló) n – 1 = 6 – 1 = 5 SzF (nevező) n – 1 = 6 – 1 = 5 F0,05 = 5,05 Döntés: 3,29  5,05  H0 elfogadása szórások azonosak

Összefüggés-vizsgálat Regresszió és korrelációszámítás

Ismérvek közötti összefüggések Lehetséges esetek: Kapcsolat hiánya Függvényszerű kapcsolat (determinisztikus) Sztochasztikus kapcsolat (tendenciaszerű, valószínű érvényű) - asszociáció → minőségi ismérvek - rangkorrelációs kapcsolat, sorrendi (ordinális) skálán mért ismérvek, - vegyes kapcsolat, minőségi és mennyiségi ismérvek, - korreláció, mennyiségi ismérvek (kettő és több)

Mennyiségi ismérvek (2) kapcsolatának lehetséges esetei Kapcsolat hiánya Függvényszerű kapcsolat Sztochasztikus kapcsolatok

. Korreláció: mennyiségi ismérvek közötti sztochasztikus (tendenciaszerű) kapcsolat. Példák: : 1. egy főre jutó egy főre jutó jövedelem fogyasztás 2. adott típushoz tartozó használt gépkocsik életkora → eladási ára 3. felhasznált növényi termék műtrágya hozama Összefüggés típusok: ok-okozati összefüggés (műtrágya - hozam) kölcsönhatás (ár – kereslet) hamis <látens> korreláció (testsúly – érdemjegy) . → →

Ismérvek = változók Jelölés és elnevezés: . Ismérvek = változók Jelölés és elnevezés: x változó  tényező-, vagy magyarázóváltozó, y változó  eredményváltozó Kapcsolatvizsgálat Regresszióanalízis Korrelációszámítás a kapcsolatban lévő a kapcsolat szorosságát tendenciát függvénnyel intenzitását jellemzi, + írja le determináció vizsgálat

Regresszószámítás: Modellezés analitikus függvényekkel Elméleti sztochasztikus modell: Y = + ε → regresszió ε → véletlen(ek) hatása = f(X) vagy = f(X1, X2,…Xp) kétváltozós többváltozós f : függvény típus lineáris nemlineáris exponenciális, hatványkitevős, hiperbolikus, parabolikus, stb.

.

Az összefüggés-vizsgálat regresszió- és korrelációszámítással Lépések: Célkitűzés: y és x változók megválasztása (szakmai és statisztikai szempontok), az alkalmazási cél megfogalmazása. 2. Adatbázis megteremtése → saját (primer) megfigyelések, vagy szekunder statisztika. 3. A regressziós függvény típusának megválasztása (specifikáció). Az optimális modell függvény meg-találásának szempontjai: legszorosabb illeszkedés, célkitűzésnek legjobb megfelelés, szakirodalmi ajánlások. Előzetes és utólagos specifikáció.

a) Függvény paraméterek becslése, . 4. Regressziószámítás a) Függvény paraméterek becslése, b) Regressziós értékek meghatározása, illeszkedésvizsgálat, c) a modell tesztelése, konfidencia-intervallumok számítása, d) ábrázolás, következtetések. 5. Korrelációszámítás a) korrelációs mérőszám(ok) számítása, b) determináció-vizsgálat, c) következtetések.

Kétváltozós regresszió-analízis és korrelációszámítás Lineáris regresszió Regressziós függvény becslése→paraméterek számítása Legszorosabb illeszkedés (legkisebb négyzetek elve) Megoldás: a változók átlageltérései (dx, dy) alapján végzett transzformációval → minimum Megoldás: normálegyenletek: Levezetett képletek:

. illesztés standard hibája: σe vagy Se Regressziós becslések (értékek) számítása Regressziós egyenletbe x-ek behelyettesítésével -ek számítása Illeszkedésvizsgálat illesztés standard hibája: σe vagy Se (reziduumok) illesztés relatív hibája: Hipotézisellenőrzések, konfidencia-intervallum számítások: a becslés és hipotézisellenőrzés témában tanult eljárások szerint

Értelmezés: Regressziós együtthatók: bo: X = 0 esetén Y mekkora értéket vesz fel átlagosan ha az X= 0 szerepel az X értékek között) b1: x adott értékének egy egységnyi változására átlagosan milyen mértékű változással reagál y (a vizsgált y tartományban). A változók kölcsönhatása esetén: x egységnyi változása átlagosan mekkora y változással jár együtt. Regressziós értékek: -ek adott x értékhez mekkora y érték valószínűsíthető (a vizsgált x tartományban)

0 és │1│közötti mérőszámok – 0,4 laza, 0,4 – 0,7 közepes . Korrelációszámítás: 0 és │1│közötti mérőszámok – 0,4 laza, 0,4 – 0,7 közepes 0,7 – 0,9 szoros 0,9 – igen szoros kapcsolat Korrelációs együttható: Számítás alapja a változók átlagtól való eltérései: Determinációs együttható: Korrelációs index (hányados) Tesztelés t-próbával

. Linearizálhatók: a) Exponenciális: log y =log b0 +x ∙log b1 Nemlineáris regressziós modellek Linearizálhatók: a) Exponenciális: log y =log b0 +x ∙log b1 lineáris a kapcsolat x és log y között Értelmezés: 100 b1 → x egy egységnyi változására jutó y %-os változása ( mint Vdin.) b) Hatványkitevős: log y =log b0 + b1 ∙log x lineáris a kapcsolat log x és log y között Értelmezés: b1 → x egy %-os változására jutó y %-os változása (elaszticitás). Hiperbolikus: lineáris a kapcsolat 1/x és y között Értelmezés: y b0 felé tart x nagymértékű növekedésével

. Paraméterek számítása normálegyenletekből: Másodfokú parabolikus regresszió Paraméterek számítása normálegyenletekből: Paramétereket nem értelmezzük Szélsőérték számítás: x0 = - b1 / 2b2 yo → x0 behelyettesítésével Korrelációszámítás: Korrelációs hányados

. Mintapélda Tíz gazdasági egység alábbi megfigyelései alapján vizsgáljuk egy termelési folyamatban az anyagköltség (x) és a termelési érték (y) közötti összefüggést (a változók mértékegysége E Ft/ha) Válto- zók m e g f i g y e l é s e k 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. x 34 38 44 48 56 62 70 76 82 90 y 66 80 104 125 100 126 110 135 130

. 1. közelítés: Lineáris regresszió a) Regressziós függvény paramétereinek becslése

. b) Regressziós becslések (értékek) számítása Illeszkedésvizsgálat

- (Varianciaanalízis) - Paraméterek → standard hibák . c) Hipotézisellenőrzések, konfidencia-intervallum - (Varianciaanalízis) - Paraméterek → standard hibák tesztelések, konfidencia-intervallumok b1 paraméter b1 konfidencia-intervalluma: b1 = t/2  sb = 2,31  0,225 = 0,52 h1 = 1,014 – 0,52 = 0,494 h2 = 1,014 + 0,52 = 1,534

Korrelációs együttható: . Korrelációszámítás: Korrelációs együttható: Szoros pozitív kapcsolat Determináció: Az anyagköltség 71,7 %-ban magyarázza a termelési érték alakulását, a véletlennek 28,3 %-os a hatása.

Az anyagköltség és a termelési érték kapcsolatot modellező különböző regressziós modellek ábrái .

Idősorok elemzése Idősorok összetevői

Idősorok egyszerűbb elemzési módszerei Tapasztalati idősor: Időismérv: t1, t2, …ti,… tn Megfigyelt érték: y1, y2, …yi,…yn Állapot-idősor és tartam-idősor Egyszerűbb módszerek: Viszonyszámok → Vd (bázis és lánc) Ábrázolás → grafikonok, oszlopdiagramok poláris diagram Átlagok Indexek → Összhatás indexkör és értékindex-kör

Idősor átlaga Változások átlaga Tartamidősor Állapotidősor . Idősor átlaga Tartamidősor Állapotidősor Változások átlaga Abszolút (mérték) Relatív (ütem)

. 2010-re vonatkozó: 1. negyedévi átlagos létszám: Mintapélda: Egy cég adatai: 2010-re vonatkozó: 1. negyedévi átlagos létszám: Negyed-év Létszám fő* Árbevétel M Ft 2010 I. 32 260 II. 36 320 III. 38 350 IV. 41 390 2011 I. 40 425 2. Negyedévi átlagos árbevétel * Negyedév elején

1. Abszolút (mérték): Mintapélda: Egy cég adatai: Árbevétel átlagos negyedévi változása 2010-ben: 1. Abszolút (mérték): Negyed-év Árbevétel M Ft 2010 I. 260 II. 320 III. 350 IV. 390 2011 I. 425 2. Relatív (ütem): * Negyedév elején

Idősorok összetevőinek vizsgálata Idősor komponensek Alapirányzat vagy trend Y Szezonális (idényszerű) hullámzás S Ciklikus hullámzás C Véletlen hatás (ingadozás) V Idősor modellek 1. Y = Y, V éves adatokból álló idősor 2.Y = S, V trendmentes, idényekből álló idősor 3.Y = Y, S, V idényekből álló, nem stagnáló idősor 4. Y = Y, S, V, C hosszú, idényekből álló idősor Periodikus ingadozás

. Idősor modellek Additív Multiplikatív 1. Y = Y + V Y = Y ∙ V 2. Y = S + V Y = S ∙ V 3. Y = Y + S + V Y = Y ∙ S ∙ V 4. Y = Y + S + C + V Y = Y ∙ S ∙ C ∙ V . Pl. 3. modell: Additív Multiplikativ azonos kilengés növekvő kilengés (csökkenő) Az összetevők vizsgálata: felbontjuk komponenseire, elkülönítjük az összetevők egyedi hatását.

- páratlan tagszám: pl. k=3 y1 = (y1+y2+y3)/3, y2 = y2+y3+y4)/3, stb. Trendszámítás Cél: a fő tendencia kimutatása, az idősor kisimítása Két módszer: a) mozgóátlagolás b) analitikus trendszámítás Mozgóátlagolás Láncolatosan tovahaladó k tagszámú átlagolás - páratlan tagszám: pl. k=3 y1 = (y1+y2+y3)/3, y2 = y2+y3+y4)/3, stb. - páratlan tagszám: pl. k=4 öttagú kronológikus átlag (lásd mintapélda) Előny: gyors kisimítás Hátrány: lerövidülés, nincs számszerű információ, csak ábra

. Mozgó átlagok számításának sémája k=3

Egy gazdálkodó szervezet árbevételének adatai k megválasztása: ne legyen se túl kicsi, se túl nagy, szezonalitás esetén k=idények száma, vagy többszöröse.

Árbevétel és mozgóátlagolású trendjének alakulása 2006-2010 . Árbevétel és mozgóátlagolású trendjének alakulása 2006-2010

. Analitikus trendszámítás Legjobb kisimítás, az idősor alapirányzatát valamilyen ismert függvénnyel fejezzük ki (alaptendencia matematikai modellje; (lásd regresszió-elemzés) Alkalmazás: Múltbeli tendencia megismerése (információk: paraméterek, trendértékek) Előrejelzés → trendextrapoláció

Az analitikus trendszámítás feladatai: . Az analitikus trendszámítás feladatai: 1. A megfelelő trendfüggvény kiválasztása; specifikáció. Választható trendfüggvények: a) lineáris b) exponenciális, c) hiperbolikus, d) parabolák, e) logisztikus függvény. legszorosabb illeszkedés elve: 2. A választott trendfüggvény meghatározása (paraméterek becslése legkisebb négyzetek elvén) 3. Trendértékek kiszámítása 4. Trendfüggvény-illeszkedés mérése Se, Vse 5. Következtetések levonása → minimum

. Lineáris trendszámítás b) t = 1, 2, . n (számítógépes programok) → normálegyenletek Paraméterek számításához → Megoldás: kódolt t értékekkel a)  t = 0 feltétel Kódolás páratlan és páros tagszámú idősornál: b) t = 1, 2, . n (számítógépes programok)

Paraméterek számítása . Paraméterek számítása a)  t = 0 Σt=0 → t = 1, 2, . N Négy  közvetlen normálegyenletbe való Behelyettesítésével az egyenletek megoldása

. Példa: Egy cég dolgozói létszámának alakulása: Trendegyenlet meghatározása Trendegyenlet:

. t = 1, 2, . n kódolással a trendegyenlet: Trendértékek számítása: (első és utolsó) = 281,4 + (25,1 -3) = 206,2 (206 fő) vagy 181,1 + (25,1  1) = 206 = 281,1 + (25,1 3) = 356,8 (357 fő) Illeszkedésvizsgálat: Értelmezés: bo : évi átlaglétszám 281 fő ( t = 0) 2003 évi becsült létszám 181 fő (t = 1, 2, .n) b1: évente átlagosan 25 fővel nőtt a létszám Páros tagú idősor esetén 2b1-et értelmezünk

. Exponenciális trend: a szomszédos relatív változások megközelítően állandóak Modell: Linearizálás: logaritmus transzformációval Megoldás a lineáris közelítés szerint Értelmezés: 100∙b1 → változás átlagos üteme %-ban (páros tagú idősornál b1 négyzetét értelmezzük) Hiperbolikus trend: modell: Információ: Y hosszú távon b0 felé tart Parabolikus trend: a változás irányában törés: növekedés és csökkenés → konkáv par. Csökkenés és növekedés → konvex par. Információ: szélsőérték → a törés mikor volt ?

. Logisztikus trend → hosszú idősoroknál. Három jellegzetes szakasz: 1. lassú növekedés 2. gyors felfutás, 3. csökkenő mértékű növekedéssel közeledés a telítődési szinthez (termékek életgörbéje) . k a trend maximális értéke, azaz a telítődési szint Modell: A mobil-előfizetők számának alakulása 1992-2006)

Szezonalitás elemzése Szezonális hullámzás jellemzője: zömmel rövid táv (éves periódus), azonos hullámhossz, rendszeres ismétlődés, azonos idényekben azonos irányú kilengések Szezonális ingadozás mérése szezonális eltérések Szej (additív idősor) b) szezonindexek Szij (multiplikatív idősor) j: az idények száma

Mérés trendmentes idősorokban 1. Az idősor azonos idényeinek adatait átlagoljuk → véletlen kiküszöbölése. 2. Kiszámítjuk az idősor (fő)átlagát 3. Az idényátlagokat a főátlaghoz viszonyítjuk. - Additív idősor (Y=S+V) : kivonás → Szej (j=1,2,.j): eltérések mértéke (több, vagy kevesebb) az idényátlagtól - Multiplikatív idősor: (Y=S ∙ V) osztás → Szij ∙ 100 : százalékos eltérések az szezonátlagtól

. Példa: Egy cég munkavállalói létszáma, fő Sze1: 24 - 35 = -11 Szezonális eltérések: fő Sze1: 24 - 35 = -11 Sze2: 34 - 35 = - 1 Sze3: 52 - 35 = 17 Sze4: 30 - 35 = - 5 Σ = 0 Szezonindexek, % Szi1: 24 : 35 = 0,686 68,6 % Szi2: 34 : 35 = 0,971 97,1 % Szi3: 52 : 35 = 1,486 148,6 % Szi4: 30 : 35 = 0,857 85,7 % Σ = 4

Mérés trendet tartalmazó idősorban 1. Trendérték meghatározása (mozgóátlagolással, vagy trendfüggvények segítségével). Trendkiszűrés az idősor modell átrendezésével - Additív modell: jobboldalon már csak S és V hatások - Multiplikatív modell: Véletlen hatás leválasztása a trendmentes adatok idényenkénti egyszerű számtani átlagolásával: - Additív modell → szezonális eltérések - Multiplikatív modell → szezonindexek Értelmezés: a trendértéktől való abszolút (Szej) és %-os (Szij) eltérések a j idényben

Szezonalitás mérése Egy cég árbevétel adatai: . Szezonalitás mérése Egy cég árbevétel adatai:

Szezonindexek: % Szi1 = (1,045+1,031+1,026) : 3 = 1,034  103,4 % . Szezonális eltérések: M Ft Sze1 = (6,7 + 5 + 4,5) : 3 = 5,4 Sze2 =(– 1,8 – 6,5 – 3,5) : 3 = – 3,9 Sze3 = (– 12 – 9,5 – 5,5) : 3 = – 9,0 Sze4 = (4,7 + 8 + 7,4) : 3 = 6,7 Szezonindexek: % Szi1 = (1,045+1,031+1,026) : 3 = 1,034  103,4 % Szi2 = (0,988+0,961+0,980) : 3 = 0,976  97,6 % Szi3 = (0,915+0,940+0,967) : 3 = 0,941  94,1 % Szi4 = (1,032+1,050+1,043) : 3 = 1,042  104,2 %

A szezonális mérőszámok felhasználása . A szezonális mérőszámok felhasználása A mérőszámok információinak figyelembe vétele a gyakorlatban (pl. éves tervek idényekre bontása, előrejelzések készítése) Szezonhatás kiszűrése az idősorokból, azaz szezonálisan kiigazított idősorok képzése Árbevétel mintapélda szezonális kiigazítása Y/Szij

Ciklikus komponens vizsgálata Kétféle lehetőség a C becslésére: Analitikus trendértékekkel mentesített (Y/Y) idősoron végzett mozgóátlagolással. Mozgóátlagolású trend és az analitikus trend különbségével (hányadosával). A mozgóátlagolás a V hatását szűri ki. Az így kapott értékek ábrája ad információt a ciklikus hatásról (ciklushossz, ciklus-szakaszok, csúcs- és mélypontok)

. Előrejelzés: idősorból végzett becslés Ex ant: a megfigyelési időszakon kívülre Leggyakrabban használt módszerek: Idősor komponensek (trend stb.) alapján Simító eljárások, Komplex modellek (sztochasztikus eljárások) Szakértői becslések Idősor komponensek alapján - Trend-extrapoláció: pl. a t+1 időszakra: Lineáris trend: - Szezonalitás figyelembe vétele: Additív m. Multipl. m. . .