STATISZTIKA II. 2. Előadás

Slides:



Advertisements
Hasonló előadás
Hipotézis-ellenőrzés (Statisztikai próbák)
Advertisements

I. előadás.
II. előadás.
Statisztika II. I. Dr. Szalka Éva, Ph.D..
BECSLÉS A sokasági átlag becslése
Gazdaságelemzési és Statisztikai Tanszék
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Általános statisztika II.
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék STATISZTIKA I. 11. Előadás.
Gazdaságelemzési és Statisztikai Tanszék
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Közlekedésstatisztika
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
Mintavételes eljárások
III. előadás.
A középérték mérőszámai
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Statisztika II. III. Dr. Szalka Éva, Ph.D..
Készítette: Kosztyán Zsolt Tibor
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Egytényezős variancia-analízis
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
STATISZTIKA II. 3. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
STATISZTIKA II. 4. Előadás
STATISZTIKA II. 6. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Kvantitatív Módszerek
Valószínűségszámítás
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 14. előadás.
Gazdaságstatisztika 13. előadás.
Gazdaságstatisztika 15. előadás.
Hipotézis vizsgálat (2)
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Alapfogalmak.
Mintavételes eljárások
I. előadás.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Mintavételes Eljárások.
A szóráselemzés gondolatmenete
Bevezetés a méréskiértékelésbe (BMETE80ME19) Intervallumbecslések 2014/
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Valószínűségszámítás II.
Bevezetés a méréskiértékelésbe (BMETE80ME19)
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Kvantitatív módszerek Becsléselmélet október 15.
Leíró statisztika, részekre bontott sokaság, becslés Árva Gábor PhD Hallgató.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
Konzultáció – Részekre bontott sokaság vizsgálata, Becslés November 5. Gazdaságstatisztika.
Gazdaságstatisztika Becsléselmélet október 30. és november 5.
Kvantitatív módszerek
II. előadás.
Kvantitatív módszerek MBA és Számvitel mesterszak
Becsléselmélet - Konzultáció
I. Előadás bgk. uni-obuda
A matematikai statisztika alapfogalmai
Gazdaságinformatikus MSc
1.3. Hipotézisvizsgálat, statisztikai próbák
Előadás másolata:

STATISZTIKA II. 2. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék

Mintavétel A mintából való következtetés az induktív statisztika lényege. Két alapvető feladata: Becslés: a mintából számított jellemzők alapján közelítjük a sokasági jellemzők értékét. Hipotézisvizsgálat: a sokaságra tett bizonyos feltevések (hipotézisek) minta alapján történő statisztikai megerősítése vagy cáfolása.

A becslés és a hipotézisvizsgálat feladatainak csoportosítása: milyen sokasági jellemzőt vizsgálunk milyen, mekkora és mennyi a minta száma milyen feltételezéseket teszünk illetve fogadunk el a vizsgálat során.

Véletlen mintavételi tervek Független, azonos eloszlású (FAE) minta: független, azonos eloszlású elemekből álló minta. Véges sokaságból, azonos valószínűségű, visszatevéses kiválasztással vagy végtelen sokaságból azonos valószínűségű kiválasztással nyert minta. Egyszerű véletlen (EV) minta: Véges sokaságból azonos kiválasztási valószínűséggel, visszatevés nélkül választott minta. (Komplett lista szükséges)

Statisztikai becslések Sok területen, eltérő módon végzünk közelítő számításokat – becslés kifejezés használata (értékösszeg becslése osztályközös gyakorisági sorból, hiányzó adatok becslése adatfelvételkor) Becslés: a sokasági jellemzők értékének minta alapján történő közelítő meghatározása. Pontbecslés - egy sokasági jellemzőnek egy ponttal való becslése (a mintából egy értéket határozunk meg). Intervallumbecslés - egy sokasági jellemzőnek egy intervallummal történő becslése (alsó és felső határ).

Pont és intervallumbecslés Sokasági érték Sokasági érték Pontbecslés Intervallumbecslés

– Pontbecslés (Intervallumbecslés) – Hipotézisvizsgálat

Pontbecslések Becslőfüggvény (estimator) a mintaelemekre épített függvény, amely alkalmas arra, hogy segítségével pontbecsléseket készítsünk. A becslőfüggvény mintáról mintára állandó, de a minták változnak, maga a becslés (estimate) vagy maguk a becsült értékek változók. A pontbecslések értékei is mintáról mintára változnak, és ha a minta véletlen (valószínűségi) minta, akkor a becslések valószínűségi változókként viselkednek. A becslőfüggvényeket ekkor a momentumaikkal és eloszlásukkal jellemezhetjük.

Becslőfüggvények és becslések értékelése Általánosan a keresett sokasági jellemző: Θ; θ A becslés: kalap: Becsülhető pl. Sokasági átlag Értékösszeg Szórás Arány

Becslőfüggvények és becslések értékelése Pontbecsléskor egy sokasági jellemző becslésére több becslőfüggvény is készíthető pl. sokasági átlag (várható érték): - mintaátlag, - minta mediánja, - legkisebb és legnagyobb mintaelem számtani átlaga. Becslőfüggvény: jó – jobb – legjobb Leggyakrabban a változók első két momentumát használjuk becslési kritériumként. ?????

Momentumok A eltérések r-edik hatványaiból számított számtani átlag. Az r-edik momentum (A=0): súlyozatlan: súlyozott: vegyük észre, hogy:

Centrális momentumok Ha , az r-edik centrális momentum: súlyozatlan: súlyozott: vegyük észre, hogy:

Becslőfüggvények és becslések értékelése Becslési kritériumok Torzítatlanság A becslőfüggvény becsült értéke megegyezik a becsülni kívánt sokasági jellemzővel Konzisztencia Nagy minta esetén a becsült érték nagy valószínűséggel közelítse meg a sokasági jellemző értéket. A torzítás mértéke egy megengedett határon belül marad. Hatásosság A becslés szórása (standard hiba) a lehető legkisebb legyen.

Torzítatlanság, torzítás Torzítatlanság (a becslőfüggvény tulajdonsága): az összes lehetséges mintán számított becslések várható értéke megegyezik a becsülni kívánt sokasági jellemzővel (a becslések a cél körül szóródnak). Várható érték Sokasági jellemző

Két torzítatlan becslőfüggvény közül azt tekintjük jobbnak, amelyiknek az összes lehetséges mintán értelmezett varianciája kisebb.

Minimumvariancia (minimális variancia kritérium) (a torzítatlan becslőfüggvény tulajdonsága): két vagy több torzítatlan becslőfüggvény közül az, amelyiknek legkisebb a szórásnégyzete (varianciája).

Torzítatlanság és a variancia esetei Torzítatlan, kis variancia Torzítatlan, nagy variancia Torzított, kis variancia Torzított, nagy variancia

EV (visszatevés nélküli) minta alapsokaság: 1, 5, 10, 12 Kételemű minták Háromelemű minták Mintaelemek Mintaátlag 1, 5 3 1, 5, 10 5,333 1, 10 5,5 1, 5, 12 6 1, 12 6,5 1, 10, 12 7,666 5, 10 7,5 5, 10, 12 9 5, 12 8,5   10, 12 11 Átlag 7 7,00 Szórás 2,48 1,43 Variancia 6,17 2,06

Torzítatlanság, torzítás Várható érték Sokasági jellemző Torzítás (bias)

Torzított becslés esetén Átlagos négyzetes hiba - Mean Square Error (MSE): a variancia és a torzítás négyzetének összege

Aszimptotikus vagy nagymintás elmélet Aszimptotikusan torzítatlan becslőfüggvény véges minták esetén torzított, de ez a torzítás a mintanagyság minden határon túl történő növelésével 0-hoz tart. Ha érvényesül akkor aszimptotikusan torzítatlan

Aszimptotikus vagy nagymintás elmélet A gyakorlati statisztika több száz vagy több ezer elemű mintái már igen nagynak tekinthetők. A gyakorlati statisztika széles körben használja a közelítő nagymintás eredményeket.

Korrigált tapasztalati variancia: torzítatlanul becsüli a sokasági varianciát. (Excelben a SZÓRÁS függvény ezt használja fel. A SZÓRÁSP az alapsokaságból számított szórást adja.)

Konzisztencia Konzisztencia (a becslőfüggvény tulajdonsága): a becslőfüggvény torzítatlan vagy legalább nagy minták esetén torzítatlan és varianciája a mintanagyság növelésével 0-hoz tart. Kedvező tulajdonság, mivel elegendően nagy minta esetén egészen kis szóródással tetszőlegesen közel juthatunk a becslés tárgyához, azaz becslésünk pontossága nagy lesz.

Pontbecslés módszerei Analógia Legkisebb négyzetek elve Maximum likelihood elv Momentumok módszere Rendszerint a sokaságot elemeivel adjuk meg. A megfelelő eloszlás jellemzőit, paramétereit kell becsülni.

Pontbecslés módszerei Analógia A mintában a vizsgálni kívánt sokasági mutatónak megfelelő mutatót határozzuk meg, és alkalmazzuk becslőfüggvényként. Sokaság Minta átlag átlag szórás szórás arány arány

Pontbecslés módszerei (Analógia) sokasági átlag mintaátlag A sokasági és a mintaelemekkel ugyanazokat a műveleteket végeztük el. Kivétel pl. a sokasági értékösszegnek a mintából történő becslésekor a N/n-szeresével célszerű becsülni.

Pontbecslés módszerei (legkisebb négyzetek elve) Legkisebb négyzetek módszere (LKN) általában tetszőleges modell, szűkebb értelemben valószínűségeloszlás illesztésére szolgáló módszer. Olyan paramétereket keres, melyek esetén a megfigyelt és a modellből számított értékek eltérés négyzetösszege (euklideszi távolsága) minimális. nagyon széles körben elterjedt

Pontbecslés módszerei (momentumok módszere) (ismert valószínűség-eloszlás paramétereinek becslésére szolgáló eszköz): olyan paramétereket keres, amelyek mellett a sokaság elméleti, és a nekik megfelelő mintabeli empirikus momentumok megegyeznek.

Pontbecslés módszerei (momentumok módszere) Pl. exponenciális eloszlás esetén a sokasági paraméter az eloszlás várható értéke (első elméleti momentuma), ennek becslőfüggvénye a minta első (empirikus) momentuma, azaz a minta átlaga. Ez a módszer elég általános feltételek mellett konzisztens becslőfüggvényt eredményez.

Pontbecslés módszerei (maximum likelihood módszer, ML) (ismert valószínűség-eloszlás paramétereinek becslésére szolgáló eszköz): olyan paramétereket keres, amelyek mellett a leginkább hihető (valószínű), hogy a kiválasztott minta a megfelelő eloszlásból származik.

Pontbecslés módszerei (maximum likelihood módszer, ML) Ha egy sokaságban jó (0) és selejtes (1) darabok vannak, és a selejtesek P arányát akarjuk becsülni kételemű mintákból, akkor visszatevéses esetben (FAE) a lehetséges mintákat és azok bekövetkezési valószínűségét a következő táblázat mutatja:

Minta Valószínűsége Összesen 1 0, 0 (1-P)2 0, 1 (1-P)P 1, 0 P(1-P) 1, 1 P2 Összesen 1 A 2. oszlop az ún. likelihood függvény, ami az egyes lehetséges minták bekövetkezésének valószínűségét adja. (2. és 4. eset)

Pontbecslés módszerei (maximum likelihood módszer, ML) Az ML-lel készült becslőfüggvények konzisztensek, és végtelenbe tartó mintanagyság esetén minimális varianciájúak, határeloszlásuk (a becslések eloszlása nagy minták esetén) normális.

Intervallumbecslés Az intervallumbecslés azt keresi, hogy melyik az az intervallum (alsó és felső határ), amelyik előre meghatározott nagy (pl. 95%-os) valószínűséggel tartalmazza a becsülni kívánt jellemzőt - konfidencia-intervallum Ismételt mintavétel esetén az esetek átlagosan (1-α)*100 százalékában igaz, az hogy az intervallum lefedi (tartalmazza) a keresett sokasági jellemzőt. Megbízhatósági (konfidencia) paraméter

Intervallumbecslés Normális eloszlású sokaság esetén a mintaátlag is normális eloszlású

Intervallumbecslés z változó standard normális eloszlást követ Annak a valószínűsége, hogy a z változó egy (z1,z2) intervallumba esik (Standard normális eloszlásfüggvény értékeinek táblázata)

Intervallumbecslés a standardizált változó egy szimmetrikus (-z, z) intervallumba esése

Intervallumbecslés hibahatár hibahatár

Egy kis bolt napi forgalma félkilós kenyérből (darab) 63 64 57 80 71 69 74 70 79 61 68 58 55 59 62 66 67 73 56 65 77 72 75

Intervallumbecslés A napi értékesítés normális eloszlású. Feltételezhető, hogy a szórás 6 db. Készítsen nagy (95%-os) megbízhatósággal intervallum becslést (a 48 nap adata alapján) az ismeretlen sokasági várható értékre.

Intervallumbecslés

Intervallumbecslés A mintavételt 10 alkalommal elvégezve a következő eredményeket kaptuk (66 darabos átlagot feltételezve):

Tartalmazza-e a sokasági átlagot? Sorszám Alsó határ Felső határ Tartalmazza-e a sokasági átlagot? 1 64,2 67,6 Igen 2 65,1 68,5 3 63,9 67,3 4 64,7 68,1 5 65,9 69,3 6 64,3 67,7 7 62,2 65,6 Nem 8 65,5 68,9 9 64,4 67,8 10 63,7

95%-os valószínűség ?????