Statisztikai áttekintés (I.)

Slides:



Advertisements
Hasonló előadás
Hipotézisvizsgálat az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi az adatok ismeretében megfogalmazódnak bizonyos hipotézisek erre.
Advertisements

Hipotézis-ellenőrzés (Statisztikai próbák)
4. Két összetartozó minta összehasonlítása
I. előadás.
II. előadás.
BECSLÉS A sokasági átlag becslése
Kvantitatív módszerek
BEFEKTETÉSEK TECHNIKAI KÉRDÉSEI
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Becsléselméleti ismétlés
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
Mintavételes eljárások
III. előadás.
Lineáris korreláció és lineáris regresszió. A probléma felvetése y = 1,138x + 80,778r = 0,8962.
Az élővilág kutatásának matematikai, statisztikai eszköztára
Regresszióanalízis 10. gyakorlat.
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
Nem-paraméteres eljárások, több csoport összehasonlítása
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Készítette: Kosztyán Zsolt Tibor
Kvantitatív módszerek
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Egytényezős variancia-analízis
Az F-próba szignifikáns
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Valószínűségszámítás
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 14. előadás.
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Többváltozós adatelemzés
Következtető statisztika 9.
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Hipotézis vizsgálat.
Lineáris regresszió.
t A kétoldalú statisztikai próba alapfogalmai
Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek.
Paleobiológiai módszerek és modellek 4. hét
I. előadás.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Petrovics Petra Doktorandusz
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.

Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
Konzultáció november 19. Nemparaméteres próbák, egymintás próbák
Lineáris regressziós modellek
II. előadás.
I. Előadás bgk. uni-obuda
III. zárthelyi dolgozat konzultáció
III. előadás.
Hipotézisvizsgálatok Paraméteres próbák
Szabályozott és képes termékek/szolgáltatások, folyamatok, rendszerek
Kockázat és megbízhatóság
Gazdaságinformatikus MSc
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Dr. Varga Beatrix egyetemi docens
1.3. Hipotézisvizsgálat, statisztikai próbák
Előadás másolata:

Statisztikai áttekintés (I.) Statisztika: valószínűségi változók megfigyelt értékeinek ismeretlen paramétert nem tartalmazó függvénye Példa: egy sokaságból vett minta értékeinek átlaga Jelölés: X valószínűségi változó, a sokaság elméleti eloszlása; X1, X2, …, Xn az X megfigyelései, mint valószínűségi változók (~mintaelemek); x1, x2, …, xn a megfigyelt értékek (~a ténylegesen mért minta) Véletlen minta: bármely n elemű kombinációnak egyenlő esélye van arra, hogy az legyen a kiválasztott minta – mi most csak ezzel foglalkozunk → X1, X2, …, Xn független azonos eloszlású (iid) valószínűségi változók, eloszlásuk ugyanaz, mint X-é A statisztika is egy valószínűségi változó (mert valószínűségi változók függvénye), eloszlása a mintavételi eloszlás (sampling distribution)

Statisztikai áttekintés (II.) Példa: normális eloszlásból vett n elemű minta átlaga X ~ N(μ;σ) a sokaság elméleti eloszlása T(X1, X2, …, Xn) = (X1 + X2 + … + Xn)/n a statisztika T ~ N(μ;σ/√n) a statisztika mintavételi eloszlása Statisztikák fő alkalmazása: becslés és hipotézisvizsgálat Becslés Példa: keressük a sokaság ismert eloszlásának ismeretlen paraméterét Példa: normális eloszlás várható értékének becslése mintaátlaggal (ld. fent)

Statisztikai áttekintés (III.) Hipotézisvizsgálat Alapvető lépései: 1) két egymással szembenálló hipotézis megfogalmazása 2) egy tesztstatisztika megszerkesztése és mintavételi eloszlásának meghatározása 3) döntési szabály felállítása és választás a hipotézisek közül Ad1) Null- (H0) és alternatív hipotézisek (H1) Példa: H0: μ = μ0, H1: μ ≠ μ0 Ad2) T(x1, x2, …, xn) kiszámítása és eloszlásának meghatározása a nullhipotézis igaz volta esetén Ad3) kritikus, ill. elfogadási tartomány megadása, hogy T milyen megfigyelt értékei esetén vessük el, ill. fogadjuk el a nullhipotézist

Statisztikai áttekintés (IV.) Hipotézisvizsgálat lehetséges kimenetelei Helyes döntés (hamis nullhipotézis elvetése, helyes nullhipotézis elfogadása) Elsőfajú hiba (Type I error): igaz H0 elvetése Másodfajú hiba (Type II error): hamis H0 elfogadása Gyakorlatban: Elsőfajú hiba legnagyobb megengedett valószínűsége (a) rögzítve (tipikusan 1%, 5%, 10%) Majd ehhez olyan próba (tesztstatisztika), amelyre a másodfajú hiba valószínűsége (b) minimális a: szignifikanciaszint 1 – b: próba ereje (el tudjuk vetni a hamis H0-t)

Statisztikai áttekintés (V.) Példa: normális eloszlású valószínűségi változó várható értékének tesztelése H0: μ = μ0, H1: μ ≠ μ0 Ez egy kétoldali (two-tailed) hipotézis: az elméleti várható érték H0 bármelyik oldalára eshet, azaz nagyobb és kisebb is lehet μ0-nál (vö. egyoldali (one-tailed) hipotézis: H0-nak csak az egyik oldalára eshet, pl. csak kisebb lehet μ0-nál) A tesztstatisztika: Ahol a felülvonás az átlagot, s pedig a korrigált empirikus szórást jelöli Ha H0 igaz, akkor ez a tesztstatisztika Student-féle t-elosz-lást követ n – 1 szabadságfokkal (d.f.)

Statisztikai áttekintés (VI.) Kritikus értékek meghatározása: mely t* érték felett lesz a t-eloszlás sűrűségfüggvényének integrálja az a szignifikanciaszint fele A t-eloszlás szimmetriája miatt a/2-t nézünk, mert t* felett és –t* alatt ítéljük „túl nagynak”, azaz szignifikánsnak a mintaátlag eltérését; a két oldal a/2-je adja ki az a szignifikanciaszintet Ábrázolva: Ha |tc| > t*, akkor elvetjük H0-t, egyébként elfogadjuk

Statisztikai áttekintés (VII.) Példa – befektetés várható hozamának tesztelése: H0: μ = 15%, H1: μ ≠ 15%; normális eloszlást feltételezünk n = 100 elemű mintán 12%-os átlagot és 10%-os szórást mértünk, a szignifikanciaszint 5% d.f. = 100 – 1 = 99, ez alapján az a/2 = 0,025-höz tartozó t* kritikus érték 1,984 (pl. t-eloszlás táblázatából) tc = √100*(0,12 – 0,15)/0,1 = –3 Mivel |tc| > t*, mert 3 > 1,984 ezért elvetjük a hipotézist 5%-os szignifikanciaszinten miszerint a valódi várható hozam 15%. Magyarán, a mért 12%-os érték túl távol van a 15%-tól, hogy pusztán a véletlen mintavétel műve legyen.

Statisztikai áttekintés (VIII.) p-érték megközelítés: mi az a legalacsonyabb szignifikanciaszint, amely mellett H0-t még éppen elvetnénk? Másként: meddig csökkenthetjük a szignifikanciaszintet, hogy H0-t még éppen el tudjuk vetni Döntés: ha p kisebb, mint a számunkra elfogadható maximális a, akkor elvetjük H0-t, egyébként elfogadjuk Példa: p = 0,005: ha a szignifikanciaszint 1%, akkor elvetnénk H0-t, mert 0,005 < 0,01 p-érték számítása a várható értékre: a t-eloszlás sűrűségfüggvényének integrálja tc felett és –tc alatt Előző példa folyt.: tc = ±3 → p = 0,0034 = 0,34% < 5%, tehát a valódi várható érték kisebb, mint 5%-os szign.szinten is különbözik 15%-tól (a szign.szintet egészen 0,34%-ig tudnánk csökkenteni, csak ez alatt fogadnánk el H0-t; tehát igen csekéllyé tehető az elsőfajú hiba valószínűsége)

Statisztikai áttekintés (IX.) Eddig: pontbecslés: az ismeretlen paraméter egyedi értékét becsültük Intervallum-becslés: az ismeretlen paraméter lehetséges értékeinek valamilyen tartományát becsüljük → Konfidencia-intervallum: az ismeretlen paraméter valamilyen valószínűséggel az adott intervallumba esik (pl. 95%-os konfidencia-intervallum) Példa folyt.: normális eloszlás várható értékére, 95%-os intervallumra Tudjuk a mintavételi eloszlást (t-eloszlás, n – 1 d.f.), ez alapján: Ezt átrendezve: t’ értéket meghatározva a konfidencia-intervallum adódik

Statisztikai áttekintés (X.) Előző példa (várható hozamra) folyt.: t’ = 1,984 (ugyanaz, mint a korábbi t*) Az intervallum határai így: 12% ± 1,984 x 10%/√100 Amiből maga az intervallum: (10%; 14%) Tehát a valódi várható hozam a minta alapján 95%-os valószínűséggel 10% és 14% között van Megjegyzés: konfidencia-intervallum és hipotézisvizsgálat kapcsolata: ha a nullhipotézist tartalmazza az 1 – a százalékos konfidencia-intervallum, akkor nem tudjuk elvetni a H0-t az a szignifikanciaszinten Előző példa folyt.: a 15% a (10%; 14%) intervallumon kívül esik, ezért elvetjük a nullhipotézist az 5%-os szinten

Korrelációs vizsgálat Hozamok auto- és keresztkorrelációja Becslés: k a késleltetés; autokorreláció esetén y helyén x (Torzított, de konzisztens – a torzítás a minta növekedésével csökken) H0: rk = 0, H1: rk ≠ 0 A tesztstatisztika (t-hányadoshoz hasonló, nem részletezzük) közelítőleg sztenderd normális eloszlású (nagy mintában) H0 igaz volta esetén Közelítő konfidencia-intervallumok (st. norm. eloszl. krit. értékeiből): 1%: ±2,6/√n 5%: ±2/√n 10%: ±1,6/√n Döntés: ha a mért együttható beleesik az intervallumba, akkor nem különbözik szignifikánsan nullától, egyébként igen.

Béták becslése (I.) Árfolyamadatokból hozamok Árfolyamadatok korrekciója Osztalékfizetés és címletmegosztás: D: osztalék, „ex-dividend” napon hozzáadva (=ameddig a napig meg kell venni a részvényt, hogy jogosult legyen az osztalékra) f: címletmegosztási faktor – pl. ha 1 db részvényből lett 2 db, akkor f = 2; ha 2 db-ból 3 db, akkor f = 1,5 Index választása piaci portfóliónak A szükséges árfolyam-korrekciók itt is meglegyenek Azonos devizára váltás – tipikusan USD Reálhozamok képzése – a devizának megfelelő inflációval

Béták becslése (II.) CAPM egyenletének becslése: a befektetés és a piaci index (portfólió) múltbeli hozamai közötti lineáris regresszió Megjegyzés: a CAPM várható (ex ante) hozamok közötti kapcsolatot fogalmaz meg – a gyakorlatban ezeket nem, hanem csak a realizált (ex post) hozamokat tudjuk megfigyelni Jobb híján ezekből becslünk (vö. együttes eloszlások időbeli stabilitása) Az indexmodell: Az α értékének az elmélet szerint nullának kell lennie – vö. CAPM egyenlete korábban Emlékezzünk: az α nem más, mint az abnormál hozam várható értéke Vö. tőkepiaci hatékonyság – az abnormális hozam várható értéke nulla Megjegyzés: loghozamok kívánatosak: kivonás reálhozamot ad, nem kell inflációval külön korrigálni (diszkrét hozamnál a kivonás közelítő, ld. korábban)

Béták becslése (III.) Jelölésileg: ri – rf = Ri és rM – rf = RM hozamprémiumok (excess returns) Az indexmodell egyenlet egy alternatív formája: Ha rf konstans, akkor pontosan ugyanazt a bétát kell, hogy kapjuk, mint az indexmodell esetében Bár rf időben változik, változékonysága kicsi, így a fenti alternatív specifikáció jó közelítés, tehát a csillagozott paraméterek ≈ csillag nélküliekkel Vigyázat: ennek a tengelymetszete nem egyszerűen α, hanem α + rf(1 – β)!

Béták becslése (IV.) A lineáris regressziós modell általános feltételezései (a megfigyeléseket t indexszel jelölve) A hibatag várható értéke 0 bármely t-re Homoszkedaszticitás: a hibatag szórása ugyanakkora bármely t-re A hibatagok kölcsönösen függetlenek (nincs autokorr.) A hibatagok és magyarázó változók is kölcsönösen függetlenek A hibatagok normális eloszlásúak bármely t-re A fentiekből következik: a hibatagok iid-k ~ N(0;σ)

Béták becslése (V.) A paraméterek becslésére alkalmazott tipikus módszer: klasszikus legkisebb négyzetek (OLS) módszere Elve (az indexmodell jelöléseivel): Ahol n a megfigyelések száma, a kalap pedig a becsült paramétert jelöli Ha a korábban említett feltételek fennállnak, akkor az OLS „nagyon jó” módszer a lineáris egyenlet paramétereinek becslésére „nagyon jó”: pl. torzítatlan, minimális varianciájú becslés

Béták becslése (VI.) Hipotézisvizsgálat a becsült OLS paraméterekre H0: β = 0, H1: β ≠ 0 (kétoldali hipotézis) H0: α = 0, H1: α ≠ 0 (kétoldali hipotézis) A tesztstatisztikákat itt most mellőzzük – a lényeg, hogy Student-féle t-eloszlást követnek n – 2 szabadságfokkal, ha H0 igaz A döntési logika ugyanaz, mint korábban a várható értéknél láttuk A p-érték megközelítés is ugyanúgy alkalmazható α-ra és β-ra úgyszintén megadhatók konfidencia-intervallumok: pl. a becsült együtthatók körül, ún. „sztenderd hibájuk” (S.E.) többszöröseivel (a mintamérettől függően) Példa: 95%-os konfidencia-intervallum „nagy mintára”: β^ ± 1,96 x S.E.(β^)

Béták becslése (VII.) Záró megjegyzések Ha a hibatagok nem normális eloszlásúak: a tesztstatisztika nem t-eloszlású → a hipotézisvizsgálat érvénytelen Nagy mintában többnyire „megoldódik” Ha a hibatagok autokorreláltak és/vagy heteroszkedasztikusak: a becsült paraméterek sztenderd hibája torzított (és inkonzisztens) → a hipotézisvizsgálat nem „megbízható” A becsült béták esetleges korrekciója Átlaghoz való visszatérés, 1-hez tartás Más pénzügyi változók (pl. vállalatméret, osztalékhozam) beépítése a bétabecslésbe Ritka kereskedés miatti korrekció

Az alkalmazás lényegi kérdései Tőkepiaci hatékonyság gyenge szintjének tesztelése Auto- és keresztkorrelációs vizsgálatok – találunk-e nullától szignifikánsan különböző korrelációt? Befektetési stratégia eredményességének vizsgálata Stratégia szerinti múltbeli hozamok előállítása Stratégia bétájának és alfájának becslése A stratégia alfája szignifikánsan különbözik nullától?