STATISZTIKA II. 2. Előadás

STATISZTIKA II. 2. Előadás
Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék

Mintavétel A mintából való következtetés az induktív statisztika lényege. Két alapvető feladata: Becslés: a mintából számított jellemzők alapján közelítjük a sokasági jellemzők értékét. Hipotézisvizsgálat: a sokaságra tett bizonyos feltevések (hipotézisek) minta alapján történő statisztikai megerősítése vagy cáfolása.

A becslés és a hipotézisvizsgálat feladatainak csoportosítása:
milyen sokasági jellemzőt vizsgálunk milyen, mekkora és mennyi a minta száma milyen feltételezéseket teszünk illetve fogadunk el a vizsgálat során.

Véletlen mintavételi tervek
Független, azonos eloszlású (FAE) minta: független, azonos eloszlású elemekből álló minta. Véges sokaságból, azonos valószínűségű, visszatevéses kiválasztással vagy végtelen sokaságból azonos valószínűségű kiválasztással nyert minta. Egyszerű véletlen (EV) minta: Véges sokaságból azonos kiválasztási valószínűséggel, visszatevés nélkül választott minta. (Komplett lista szükséges)

Statisztikai becslések
Sok területen, eltérő módon végzünk közelítő számításokat – becslés kifejezés használata (értékösszeg becslése osztályközös gyakorisági sorból, hiányzó adatok becslése adatfelvételkor) Becslés: a sokasági jellemzők értékének minta alapján történő közelítő meghatározása. Pontbecslés - egy sokasági jellemzőnek egy ponttal való becslése (a mintából egy értéket határozunk meg). Intervallumbecslés - egy sokasági jellemzőnek egy intervallummal történő becslése (alsó és felső határ).

Pont és intervallumbecslés
Sokasági érték Sokasági érték Pontbecslés Intervallumbecslés

– Pontbecslés (Intervallumbecslés) – Hipotézisvizsgálat

Pontbecslések Becslőfüggvény (estimator)
a mintaelemekre épített függvény, amely alkalmas arra, hogy segítségével pontbecsléseket készítsünk. A becslőfüggvény mintáról mintára állandó, de a minták változnak, maga a becslés (estimate) vagy maguk a becsült értékek változók. A pontbecslések értékei is mintáról mintára változnak, és ha a minta véletlen (valószínűségi) minta, akkor a becslések valószínűségi változókként viselkednek. A becslőfüggvényeket ekkor a momentumaikkal és eloszlásukkal jellemezhetjük.

Becslőfüggvények és becslések értékelése
Általánosan a keresett sokasági jellemző: Θ; θ A becslés: kalap: Becsülhető pl. Sokasági átlag Értékösszeg Szórás Arány

Pontbecsléskor egy sokasági jellemző becslésére több becslőfüggvény is készíthető pl. sokasági átlag (várható érték): - mintaátlag, - minta mediánja, - legkisebb és legnagyobb mintaelem számtani átlaga. Becslőfüggvény: jó – jobb – legjobb Leggyakrabban a változók első két momentumát használjuk becslési kritériumként. ?????

Momentumok A eltérések r-edik hatványaiból számított számtani átlag.
Az r-edik momentum (A=0): súlyozatlan: súlyozott: vegyük észre, hogy:

Centrális momentumok Ha , az r-edik centrális momentum:
súlyozatlan: súlyozott: vegyük észre, hogy:

Becslési kritériumok Torzítatlanság A becslőfüggvény becsült értéke megegyezik a becsülni kívánt sokasági jellemzővel Konzisztencia Nagy minta esetén a becsült érték nagy valószínűséggel közelítse meg a sokasági jellemző értéket. A torzítás mértéke egy megengedett határon belül marad. Hatásosság A becslés szórása (standard hiba) a lehető legkisebb legyen.

Torzítatlanság, torzítás
Torzítatlanság (a becslőfüggvény tulajdonsága): az összes lehetséges mintán számított becslések várható értéke megegyezik a becsülni kívánt sokasági jellemzővel (a becslések a cél körül szóródnak). Várható érték Sokasági jellemző

Két torzítatlan becslőfüggvény közül azt tekintjük jobbnak, amelyiknek az összes lehetséges mintán értelmezett varianciája kisebb.

Minimumvariancia (minimális variancia kritérium)
(a torzítatlan becslőfüggvény tulajdonsága): két vagy több torzítatlan becslőfüggvény közül az, amelyiknek legkisebb a szórásnégyzete (varianciája).

Torzítatlanság és a variancia esetei
Torzítatlan, kis variancia Torzítatlan, nagy variancia Torzított, kis variancia Torzított, nagy variancia

EV (visszatevés nélküli) minta alapsokaság: 1, 5, 10, 12
Kételemű minták Háromelemű minták Mintaelemek Mintaátlag 1, 5 3 1, 5, 10 5,333 1, 10 5,5 1, 5, 12 6 1, 12 6,5 1, 10, 12 7,666 5, 10 7,5 5, 10, 12 9 5, 12 8,5 10, 12 11 Átlag 7 7,00 Szórás 2,48 1,43 Variancia 6,17 2,06

Torzítatlanság, torzítás
Várható érték Sokasági jellemző Torzítás (bias)

Torzított becslés esetén
Átlagos négyzetes hiba - Mean Square Error (MSE): a variancia és a torzítás négyzetének összege

Aszimptotikus vagy nagymintás elmélet
Aszimptotikusan torzítatlan becslőfüggvény véges minták esetén torzított, de ez a torzítás a mintanagyság minden határon túl történő növelésével 0-hoz tart. Ha érvényesül akkor aszimptotikusan torzítatlan

Aszimptotikus vagy nagymintás elmélet
A gyakorlati statisztika több száz vagy több ezer elemű mintái már igen nagynak tekinthetők. A gyakorlati statisztika széles körben használja a közelítő nagymintás eredményeket.

Korrigált tapasztalati variancia:
torzítatlanul becsüli a sokasági varianciát. (Excelben a SZÓRÁS függvény ezt használja fel. A SZÓRÁSP az alapsokaságból számított szórást adja.)

Konzisztencia Konzisztencia (a becslőfüggvény tulajdonsága):
a becslőfüggvény torzítatlan vagy legalább nagy minták esetén torzítatlan és varianciája a mintanagyság növelésével 0-hoz tart. Kedvező tulajdonság, mivel elegendően nagy minta esetén egészen kis szóródással tetszőlegesen közel juthatunk a becslés tárgyához, azaz becslésünk pontossága nagy lesz.

Pontbecslés módszerei
Analógia Legkisebb négyzetek elve Maximum likelihood elv Momentumok módszere Rendszerint a sokaságot elemeivel adjuk meg. A megfelelő eloszlás jellemzőit, paramétereit kell becsülni.

Pontbecslés módszerei
Analógia A mintában a vizsgálni kívánt sokasági mutatónak megfelelő mutatót határozzuk meg, és alkalmazzuk becslőfüggvényként. Sokaság Minta átlag átlag szórás szórás arány arány

Pontbecslés módszerei (Analógia)
sokasági átlag mintaátlag A sokasági és a mintaelemekkel ugyanazokat a műveleteket végeztük el. Kivétel pl. a sokasági értékösszegnek a mintából történő becslésekor a N/n-szeresével célszerű becsülni.

Pontbecslés módszerei (legkisebb négyzetek elve)
Legkisebb négyzetek módszere (LKN) általában tetszőleges modell, szűkebb értelemben valószínűségeloszlás illesztésére szolgáló módszer. Olyan paramétereket keres, melyek esetén a megfigyelt és a modellből számított értékek eltérés négyzetösszege (euklideszi távolsága) minimális. nagyon széles körben elterjedt

Pontbecslés módszerei (momentumok módszere)
(ismert valószínűség-eloszlás paramétereinek becslésére szolgáló eszköz): olyan paramétereket keres, amelyek mellett a sokaság elméleti, és a nekik megfelelő mintabeli empirikus momentumok megegyeznek.

Pontbecslés módszerei (momentumok módszere)
Pl. exponenciális eloszlás esetén a sokasági paraméter az eloszlás várható értéke (első elméleti momentuma), ennek becslőfüggvénye a minta első (empirikus) momentuma, azaz a minta átlaga. Ez a módszer elég általános feltételek mellett konzisztens becslőfüggvényt eredményez.

Pontbecslés módszerei (maximum likelihood módszer, ML)
(ismert valószínűség-eloszlás paramétereinek becslésére szolgáló eszköz): olyan paramétereket keres, amelyek mellett a leginkább hihető (valószínű), hogy a kiválasztott minta a megfelelő eloszlásból származik.

Ha egy sokaságban jó (0) és selejtes (1) darabok vannak, és a selejtesek P arányát akarjuk becsülni kételemű mintákból, akkor visszatevéses esetben (FAE) a lehetséges mintákat és azok bekövetkezési valószínűségét a következő táblázat mutatja:

Minta Valószínűsége Összesen 1
0, 0 (1-P)2 0, 1 (1-P)P 1, 0 P(1-P) 1, 1 P2 Összesen 1 A 2. oszlop az ún. likelihood függvény, ami az egyes lehetséges minták bekövetkezésének valószínűségét adja. (2. és 4. eset)

Az ML-lel készült becslőfüggvények konzisztensek, és végtelenbe tartó mintanagyság esetén minimális varianciájúak, határeloszlásuk (a becslések eloszlása nagy minták esetén) normális.

Intervallumbecslés Az intervallumbecslés azt keresi, hogy melyik az az intervallum (alsó és felső határ), amelyik előre meghatározott nagy (pl. 95%-os) valószínűséggel tartalmazza a becsülni kívánt jellemzőt - konfidencia-intervallum Ismételt mintavétel esetén az esetek átlagosan (1-α)*100 százalékában igaz, az hogy az intervallum lefedi (tartalmazza) a keresett sokasági jellemzőt. Megbízhatósági (konfidencia) paraméter

Intervallumbecslés Normális eloszlású sokaság esetén a mintaátlag is normális eloszlású

Intervallumbecslés z változó standard normális eloszlást követ
Annak a valószínűsége, hogy a z változó egy (z1,z2) intervallumba esik (Standard normális eloszlásfüggvény értékeinek táblázata)

Intervallumbecslés a standardizált változó egy szimmetrikus (-z, z) intervallumba esése

Intervallumbecslés hibahatár hibahatár

Egy kis bolt napi forgalma félkilós kenyérből (darab)
63 64 57 80 71 69 74 70 79 61 68 58 55 59 62 66 67 73 56 65 77 72 75

Intervallumbecslés A napi értékesítés normális eloszlású.
Feltételezhető, hogy a szórás 6 db. Készítsen nagy (95%-os) megbízhatósággal intervallum becslést (a 48 nap adata alapján) az ismeretlen sokasági várható értékre.

Intervallumbecslés

Intervallumbecslés A mintavételt 10 alkalommal elvégezve a következő eredményeket kaptuk (66 darabos átlagot feltételezve):

Tartalmazza-e a sokasági átlagot?
Sorszám Alsó határ Felső határ Tartalmazza-e a sokasági átlagot? 1 64,2 67,6 Igen 2 65,1 68,5 3 63,9 67,3 4 64,7 68,1 5 65,9 69,3 6 64,3 67,7 7 62,2 65,6 Nem 8 65,5 68,9 9 64,4 67,8 10 63,7

95%-os valószínűség ?????

STATISZTIKA II. 2. Előadás

Hasonló előadás

Az előadások a következő témára: "STATISZTIKA II. 2. Előadás"— Előadás másolata:

Hasonló előadás

Projectumról

Visszajelzés

Bejelentkezés

A társadalmi hálózaton keresztül belépni:

STATISZTIKA II. 2. Előadás

Hasonló előadás

Az előadások a következő témára: "STATISZTIKA II. 2. Előadás"— Előadás másolata:

Hasonló előadás

Projectumról

Visszajelzés