Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

STATISZTIKA II. 2. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.

Hasonló előadás


Az előadások a következő témára: "STATISZTIKA II. 2. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék."— Előadás másolata:

1 STATISZTIKA II. 2. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék

2 A mintából való következtetés az induktív statisztika lényege. Két alapvető feladata: Becslés: a mintából számított jellemzők alapján közelítjük a sokasági jellemzők értékét. Hipotézisvizsgálat: a sokaságra tett bizonyos feltevések (hipotézisek) minta alapján történő statisztikai megerősítése vagy cáfolása. Mintavétel

3 A becslés és a hipotézisvizsgálat feladatainak csoportosítása: milyen sokasági jellemzőt vizsgálunk milyen, mekkora és mennyi a minta száma milyen feltételezéseket teszünk illetve fogadunk el a vizsgálat során.

4

5 Független, azonos eloszlású (FAE) minta: független, azonos eloszlású elemekből álló minta. Véges sokaságból, azonos valószínűségű, visszatevéses kiválasztással vagy végtelen sokaságból azonos valószínűségű kiválasztással nyert minta. Egyszerű véletlen (EV) minta: Véges sokaságból azonos kiválasztási valószínűséggel, visszatevés nélkül választott minta. (Komplett lista szükséges) Véletlen mintavételi tervek

6 Sok területen, eltérő módon végzünk közelítő számításokat – becslés kifejezés használata (értékösszeg becslése osztályközös gyakorisági sorból, hiányzó adatok becslése adatfelvételkor) Becslés: a sokasági jellemzők értékének minta alapján történő közelítő meghatározása. –Pontbecslés - egy sokasági jellemzőnek egy ponttal való becslése (a mintából egy értéket határozunk meg). –Intervallumbecslés - egy sokasági jellemzőnek egy intervallummal történő becslése (alsó és felső határ). Statisztikai becslések

7 Pont és intervallumbecslés Pontbecslés Sokasági érték Intervallumbecslés

8 – Pontbecslés (Intervallumbecslés) – Hipotézisvizsgálat

9 Becslőfüggvény (estimator) a mintaelemekre épített függvény, amely alkalmas arra, hogy segítségével pontbecsléseket készítsünk. A becslőfüggvény mintáról mintára állandó, de a minták változnak, maga a becslés (estimate) vagy maguk a becsült értékek változók. A pontbecslések értékei is mintáról mintára változnak, és ha a minta véletlen (valószínűségi) minta, akkor a becslések valószínűségi változókként viselkednek. A becslőfüggvényeket ekkor a momentumaikkal és eloszlásukkal jellemezhetjük. Pontbecslések

10 Általánosan a keresett sokasági jellemző: Θ; θ A becslés: kalap: Becsülhető pl. Sokasági átlag Értékösszeg Szórás Arány Becslőfüggvények és becslések értékelése

11 Pontbecsléskor egy sokasági jellemző becslésére több becslőfüggvény is készíthető pl. sokasági átlag (várható érték): - mintaátlag, - minta mediánja, - legkisebb és legnagyobb mintaelem számtani átlaga. Becslőfüggvény:jó – jobb – legjobb Leggyakrabban a változók első két momentumát használjuk becslési kritériumként. Becslőfüggvények és becslések értékelése ?????

12 Momentumok A eltérések r-edik hatványaiból számított számtani átlag. Az r-edik momentum (A=0): súlyozatlan:súlyozott: vegyük észre, hogy:

13 Centrális momentumok Ha, az r-edik centrális momentum: súlyozatlan: súlyozott: vegyük észre, hogy:

14 Becslési kritériumok Torzítatlanság –A becslőfüggvény becsült értéke megegyezik a becsülni kívánt sokasági jellemzővel Konzisztencia –Nagy minta esetén a becsült érték nagy valószínűséggel közelítse meg a sokasági jellemző értéket. A torzítás mértéke egy megengedett határon belül marad. Hatásosság –A becslés szórása (standard hiba) a lehető legkisebb legyen. Becslőfüggvények és becslések értékelése

15 Torzítatlanság (a becslőfüggvény tulajdonsága): az összes lehetséges mintán számított becslések várható értéke megegyezik a becsülni kívánt sokasági jellemzővel (a becslések a cél körül szóródnak). Torzítatlanság, torzítás Sokasági jellemzőVárható érték

16 Két torzítatlan becslőfüggvény közül azt tekintjük jobbnak, amelyiknek az összes lehetséges mintán értelmezett varianciája kisebb.

17 Minimumvariancia (minimális variancia kritérium) (a torzítatlan becslőfüggvény tulajdonsága): két vagy több torzítatlan becslőfüggvény közül az, amelyiknek legkisebb a szórásnégyzete (varianciája).

18 Torzítatlanság és a variancia esetei Torzítatlan, kis variancia Torzítatlan, nagy variancia Torzított, kis variancia Torzított, nagy variancia

19 Kételemű mintákHáromelemű minták MintaelemekMintaátlagMintaelemekMintaátlag 1, 531, 5, 105,333 1, 105,51, 5, 126 1, 126,51, 10, 127,666 5, 107,55, 10, 129 5, 128,5 10, 1211 Átlag 7 7,00 Szórás 2,48 1,43 Variancia 6,17 2,06 EV (visszatevés nélküli) minta alapsokaság: 1, 5, 10, 12

20 Torzítatlanság, torzítás Várható érték Sokasági jellemző Torzítás (bias)

21 Átlagos négyzetes hiba - Mean Square Error (MSE): a variancia és a torzítás négyzetének összege Torzított becslés esetén

22 Aszimptotikusan torzítatlan becslőfüggvény véges minták esetén torzított, de ez a torzítás a mintanagyság minden határon túl történő növelésével 0-hoz tart. Ha érvényesül akkoraszimptotikusan torzítatlan Aszimptotikus vagy nagymintás elmélet

23 A gyakorlati statisztika több száz vagy több ezer elemű mintái már igen nagynak tekinthetők. A gyakorlati statisztika széles körben használja a közelítő nagymintás eredményeket. Aszimptotikus vagy nagymintás elmélet

24

25 Korrigált tapasztalati variancia: torzítatlanul becsüli a sokasági varianciát. ( Excelben a SZÓRÁS függvény ezt használja fel. A SZÓRÁSP az alapsokaságból számított szórást adja.)

26 Konzisztencia (a becslőfüggvény tulajdonsága): a becslőfüggvény torzítatlan vagy legalább nagy minták esetén torzítatlan és varianciája a mintanagyság növelésével 0-hoz tart. Kedvező tulajdonság, mivel elegendően nagy minta esetén egészen kis szóródással tetszőlegesen közel juthatunk a becslés tárgyához, azaz becslésünk pontossága nagy lesz. Konzisztencia

27 Analógia Legkisebb négyzetek elve Maximum likelihood elv Momentumok módszere Pontbecslés módszerei Rendszerint a sokaságot elemeivel adjuk meg. A megfelelő eloszlás jellemzőit, paramétereit kell becsülni.

28 Analógia A mintában a vizsgálni kívánt sokasági mutatónak megfelelő mutatót határozzuk meg, és alkalmazzuk becslőfüggvényként. SokaságMintaátlagszórásarány Pontbecslés módszerei

29 sokasági átlagmintaátlag A sokasági és a mintaelemekkel ugyanazokat a műveleteket végeztük el. Kivétel pl. a sokasági értékösszegnek a mintából történő becslésekor a N/n-szeresével célszerű becsülni. Pontbecslés módszerei (Analógia)

30 Legkisebb négyzetek módszere (LKN) általában tetszőleges modell, szűkebb értelemben valószínűségeloszlás illesztésére szolgáló módszer. Olyan paramétereket keres, melyek esetén a megfigyelt és a modellből számított értékek eltérés négyzetösszege (euklideszi távolsága) minimális. nagyon széles körben elterjedt Pontbecslés módszerei (legkisebb négyzetek elve)

31 Momentumok módszere: (ismert valószínűség-eloszlás paramétereinek becslésére szolgáló eszköz): olyan paramétereket keres, amelyek mellett a sokaság elméleti, és a nekik megfelelő mintabeli empirikus momentumok megegyeznek. Pontbecslés módszerei (momentumok módszere)

32 Pl. exponenciális eloszlás esetén a sokasági paraméter az eloszlás várható értéke (első elméleti momentuma), ennek becslőfüggvénye a minta első (empirikus) momentuma, azaz a minta átlaga. Ez a módszer elég általános feltételek mellett konzisztens becslőfüggvényt eredményez. Pontbecslés módszerei (momentumok módszere)

33 Maximum likelihood módszer: (ismert valószínűség-eloszlás paramétereinek becslésére szolgáló eszköz): olyan paramétereket keres, amelyek mellett a leginkább hihető (valószínű), hogy a kiválasztott minta a megfelelő eloszlásból származik. Pontbecslés módszerei (maximum likelihood módszer, ML)

34 Ha egy sokaságban jó (0) és selejtes (1) darabok vannak, és a selejtesek P arányát akarjuk becsülni kételemű mintákból, akkor visszatevéses esetben (FAE) a lehetséges mintákat és azok bekövetkezési valószínűségét a következő táblázat mutatja: Pontbecslés módszerei (maximum likelihood módszer, ML)

35 MintaValószínűsége 0, 0(1-P) 2 0, 1(1-P)P 1, 0P(1-P) 1, 1P2P2 Összesen 1 A 2. oszlop az ún. likelihood függvény, ami az egyes lehetséges minták bekövetkezésének valószínűségét adja. (2. és 4. eset)

36 Az ML-lel készült becslőfüggvények konzisztensek, és végtelenbe tartó mintanagyság esetén minimális varianciájúak, határeloszlásuk (a becslések eloszlása nagy minták esetén) normális. Pontbecslés módszerei (maximum likelihood módszer, ML)

37 Az intervallumbecslés azt keresi, hogy melyik az az intervallum (alsó és felső határ), amelyik előre meghatározott nagy (pl. 95%-os) valószínűséggel tartalmazza a becsülni kívánt jellemzőt - konfidencia-intervallum Ismételt mintavétel esetén az esetek átlagosan (1-α)*100 százalékában igaz, az hogy az intervallum lefedi (tartalmazza) a keresett sokasági jellemzőt. Intervallumbecslés Megbízhatósági (konfidencia) paraméter

38 Normális eloszlású sokaság esetén a mintaátlag is normális eloszlású Intervallumbecslés

39 z változó standard normális eloszlást követ Annak a valószínűsége, hogy a z változó egy (z 1,z 2 ) intervallumba esik (Standard normális eloszlásfüggvény értékeinek táblázata) Intervallumbecslés

40 a standardizált változó egy szimmetrikus (-z, z) intervallumba esése Intervallumbecslés

41 hibahatár Intervallumbecslés

42

43

44

45 Egy kis bolt napi forgalma félkilós kenyérből (darab)

46 A napi értékesítés normális eloszlású. Feltételezhető, hogy a szórás 6 db. Készítsen nagy (95%-os) megbízhatósággal intervallum becslést (a 48 nap adata alapján) az ismeretlen sokasági várható értékre. Intervallumbecslés

47

48

49 A mintavételt 10 alkalommal elvégezve a következő eredményeket kaptuk (66 darabos átlagot feltételezve): Intervallumbecslés

50 SorszámAlsó határ Felső határ Tartalmazza-e a sokasági átlagot? 164,267,6Igen 265,168,5Igen 363,967,3Igen 464,768,1Igen 565,969,3Igen 664,367,7Igen 762,265,6Nem 865,568,9Igen 964,467,8Igen 1063,767,7Igen

51 95%-os valószínűség ?????


Letölteni ppt "STATISZTIKA II. 2. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék."

Hasonló előadás


Google Hirdetések