Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Mintavételes eljárások Becslés

Hasonló előadás


Az előadások a következő témára: "Mintavételes eljárások Becslés"— Előadás másolata:

1 Mintavételes eljárások Becslés
2. hét Mintavételes eljárások Becslés

2 Teljes sokaság vizsgálata
Egy tanulócsoport hallgatóinak ösztöndíjaira vonatkozó adatokat Hallgató sorszáma Ösztöndíj értéke (Ft) 1 7000 2 9500 3 13000 4 10000 5 8000 6 9000 7 12000 8 11000 Jellemezzük a tanulócsoport hallgatóit, mint sokaságot az ösztöndíjuk alapján!

3 Általános jelölések: sokaság-minta
Megnevezés Alapsokaságban Mintában Sokaság elemszáma N n Az i-edik egyed ismérvértéke Xi xi Az ismérvértékek átlaga Az ismérvértékek szórása

4 Mintából való következtetés
Becslés Hipotézisvizsgálat Becslés: A sokaság bizonyos jellemzőinek, paraméterének közelítő megállapításával foglalkozik . Hipotézisvizsgálat: A sokaságra vonatkozó valamely állítás helyességét ellenőrzi. Estimation theory is a branch of statistics and signal processing that deals with estimating the values of parameters based on measured/empirical data. The parameters describe an underlying physical setting in such a way that the value of the parameters affects the distribution of the measured data. An estimator attempts to approximate the unknown parameters using the measurements. In estimation theory, it is assumed that the desired information is embedded in a noisy signal. Noise adds uncertainty, without which the problem would be deterministic and estimation would not be needed. The estimator estimates the parameters of a physical model based on measured data.

5 STATISZTIKAI BECSLÉS

6 Alapfogalmak Becslőfüggvény : egy olyan statisztika, ami valamely sokasági jellemző mintából történő közelítő meghatározását szolgálja. Pontbecslés A becslőfüggvény mintából számított konkrét értéke Intervallumbecslés Adott  megbízhatósági szinthez tartozó intervallum alsó és felső határának meghatározása Sokasági jellemző (paraméter): Konfidencia-intervallum egy x1, x2, ….xn mintából: Meg kell határoznunk a becslő függvénynek azt a és értékeit, melyekre teljesül, hogy π valószínűséggel közrefogják a sokasági paramétert. Standard hiba A becslő függvény valamennyi lehetséges mintából számított értékeinek a szórása.

7 Becslő függvényekkel szemben támasztott követelmények
Torzítatlanság: Torzítatlannak nevezzük a becslő függvényt, ha a várható értéke egyenlő a paraméterrel, ellenkező esetben a becslő függvény torzított. A továbbiakban a következők becslő függvényeket fogjuk alkalmazni: Mintaátlag (a sokasági várható érték torzítatlan becslő függvénye). A mintabeli relatív gyakoriság (a sokasági megoszlási viszonyszám (valószínűség) torzítatlan becslése). A korrigált tapasztalati szórásnégyzetet (a sokasági szórásnégyzet torzítatlan becslő függvénye.) Hatásosság: két becslő függvény közül azt tekintjük hatásosabbnak, amelynek kisebb a szórása (standard hibája). Konzisztencia: a mintanagyság növelésével a becslés nagy valószínűséggel a sokasági paraméter felé, a becslő függvény szórása pedig a nulla felé tart. Ezért nagy minta használata esetén elfogadható az olyan konzisztens becslés is, amely nem torzítatlan.

8 A becslési eljárás lépései
A becslés célja és a sokaságra vonatkozó mintán kívüli információk ismeretében megválasztjuk az alkalmazandó becslő formulát. Meghatározzuk a mintaátlagot. Megfelelő módon kiszámítjuk a standard hibát. Az elvárt megbízhatósági szintnek megfelelően meghatározzuk a megbízhatósági együttható értékét az eloszlástáblázatok segítségével. Meghatározzuk a konfidencia intervallumot.

9 Várható érték intervallum becslése
Alapesetei: Normális eloszlású sokaság, melynek szórása ismert. Normális eloszlású sokaság, melynek szórása nem ismert. Ha a sokaság nem tekinthető normális eloszlásúnak: Ebben az esetben a központi határeloszlás már említett tételére támaszkodva azt mondhatjuk, hogy ha kellően nagy méretű mintát vizsgálunk, akkor a változó közelíti a normális eloszlást. Amennyiben kis minta áll rendelkezésre az elemzéshez, úgy egyéni sajátosságokat figyelembe vevő módszereket kell alkalmaznunk.

10 Várható érték becslése

11 1.) sokaság eloszlása normális, ismert a sokasági szórás, mintanagyság tetszőleges 2.) sokaság eloszlása nem ismert, nem ismert a sokasági szórás, nagy minta 3.) sokaság eloszlása normális, nem ismert a sokasági szórás, n < 100

12 Ahol: a becslőfüggvény mintából számított konkrét értéke
standard normális eloszlású valószínűségi változó a mintaátlag standard hibája ( a mintaátlagok szórása) =n-1 szabadságfokú Student-eloszlású valószínűségi változó A Student-féle t eloszlás a szabadságfok növelésével a normálishoz tart.

13 Várható érték intervallum becslése
Lépései: A sokaság a vizsgált változó alapján normális eloszlású, a minta elemszám tetszőleges és a szórását is ismerjük valamilyen korábbi felmérésből. A várható érték pontbecsléséből kell kiindulnunk. A mintaátlagot standardizáljuk, azaz a következő képlet alapján transzformáljuk: Adott π megbízhatósági szint mellett egy normális eloszlású, ismert szórású sokaság várható értékének intervalluma a következő formula segítségével becsülhető:

14 Mintapélda – várható érték
Egy élelmiszer-feldolgozó vállalat adatai (N=50.000): Nettó töltősúly (g) Üvegek száma (db) 10 40 180 50 20 Összesen 300 A sokasági szórás ismeretében (σ=15g) a standard hiba z=2,32

15 z (z) 0,0 0,000 0,1 0,080 0,2 0,159 0,3 0,236 0,4 0,311 0,5 0,383 0,6 0,452 0,7 0,516 0,8 0,576 0,9 0,632 1,0 0,683 1,1 0,729 1,2 0,770 1,3 0,806 1,4 0,839 1,5 0,866 1,6 0,890 1,65 0,90 1,7 0,911 1,8 0,928 1,9 0,943 1,96 0,95 2,0 0,955 2,06 0,96 2,1 0,964 2,17 0,97 2,2 0,972 2,3 0,979 2,32 0,98 2,4 0,984 2,5 0,988 2,58 0,99 2,6 0,991 2,7 0,993 2,8 0,995 2,9 0,996 3,0 0,997 3,30 0,999

16 Várható érték intervallum becslése
Lépései: A sokaság a vizsgált változó alapján normális eloszlású, a minta elemszám 100 egyednél nagyobb és a szórását nem ismerjük. A várható érték pontbecsléséből kell kiindulnunk. A mintaátlagot standardizáljuk, azaz a következő képlet alapján transzformáljuk: Adott π megbízhatósági szint mellett egy normális eloszlású, ismeretlen szórású sokaság várható értékének intervalluma a következő formula segítségével becsülhető:

17 Mintapélda – várható érték
Egy élelmiszer-feldolgozó vállalat adatai Nettó töltősúly (g) Üvegek száma (db) 10 40 180 50 20 Összesen 300 z=1,96 A mintabeli szórás és a standard hiba meghatározása

18 Valószínűség vagy arány becslése

19 Konfidencia-intervallum

20 Mintapélda – arány Egy élelmiszer-feldolgozó vállalat adatai (N=50.000): Határozzuk meg 95%-os megbízhatóság mellett, hogy a gép áltat megtöltött üvegek közül hány százalék nem haladja meg az 1480 grammot! Nettó töltősúly (g) Üvegek száma (db) 10 40 180 50 20 Összesen 300 Mintabeli arány meghatározása: z=1,96 Standard hiba meghatározása: 95%-os megbízhatósággal a 1480 grammnál kisebb súlyú üvegek aránya legalább 12,465 és legfeljebb 20,88%

21 Szórásnégyzet, szórás becslése
Jellemzői: A szórás pontbecslésére általában a korrigált tapasztalati szórást, mint torzítatlan becslő függvényt használjuk. A minta normális eloszlású sokaságból származik. Nincs semmiféle korlátozás a minta nagyságára nézve. Becslőfüggvény:

22 Mintapélda – szórás becslése
Egy egyetemen dolgozatírás után a hallgatók által elért pontszámok alakulását vizsgáltuk 100 elemű véletlen kiválasztással gyűjtött minta alapján. Pontszám Dolgozatok száma (db) 8 26 37 23 6 Összesen 100

23 χ2 Df 0,005 0,01 0,025 0,05 0,10 0,25 0,50 0,75 0,90 0,95 0,975 0,99 0,995 1 0,0000 0,0002 0,0010 0,039 0,0158 0,102 0,455 1,32 2,71 3,84 5,02 6,63 7,88 2 0,0100 0,0201 0,0506 0,103 0,211 0,575 1,39 2,77 4,61 5,99 7,38 9,21 10,6 3 0,072 0,115 0,216 0,352 0,584 1,21 2,37 4,11 6,25 7,81 9,35 11,3 12,8 4 0,207 0,297 0,484 0,711 1,06 1,92 3,36 5,39 7,78 9,49 11,1 13,3 14,9 5 0,412 0,554 0,831 1,15 1,61 2,67 4,35 9,24 15,1 16,7 6 0,676 0,872 1,24 1,64 2,20 3,45 5,35 7,84 12,6 14,4 16,8 18,5 7 0,989 1,69 2,17 2,83 4,25 6,35 9,04 12,0 14,1 16,0 20,3 8 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,2 13,4 15,5 17,5 20,1 22,0 9 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,4 14,7 16,9 19,0 21,7 23,6 10 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,5 18,3 20,5 23,2 25,2 11 2,60 3,05 3,82 4,57 5,58 7,58 10,3 13,7 17,3 19,7 21,9 24,7 26,8 12 3,07 3,57 4,40 5,23 6,30 8,44 14,8 21,0 23,3 26,2 28,3 13 5,01 5,89 7,04 9,30 12,3 19,8 22,4 27,7 29,8 14 4,07 4,66 5,63 6,57 7,79 17,1 21,1 23,7 26,1 29,1 31,3 15 4,60 6,26 7,26 8,55 11,0 14,3 18,2 22,3 25,0 27,5 30,6 32,8 16 5,14 5,81 6,91 7,96 9,31 11,9 15,3 19,4 23,5 26,3 28,8 32,0 34,3 17 5,70 6,41 7,56 8,67 10,1 16,3 24,8 27,6 30,2 33,4 35,7 18 7,01 8,23 9,39 10,9 21,6 26,0 28,9 31,5 34,8 37,2 19 6,84 7,63 8,91 11,7 14,6 22,7 27,2 30,1 32,9 36,2 38,6 20 7,43 8,26 9,59 12,4 19,3 23,8 28,4 31,4 34,2 37,6 40,0 21 8,03 8,90 11,6 13,2 24,9 29,6 32,7 35,5 38,9 41,4 22 8,64 9,54 14,0 17,2 21,3 30,8 33,9 36,8 40,3 42,8 23 9,26 13,1 18,1 27,1 35,2 38,1 41,6 44,2 24 9,89 13,8 15,7 28,2 33,2 36,4 39,4 43,0 45,6 25 10,5 11,5 16,5 19,9 24,3 29,3 34,4 37,7 40,6 44,3 46,9 26 11,2 12,2 15,4 20,8 25,3 30,4 35,6 41,9 48,3 27 11,8 12,9 16,2 36,7 40,1 43,2 47,0 49,6 28 13,6 18,9 27,3 32,6 37,9 41,3 44,5 51,0 29 17,7 33,7 39,1 42,6 45,7 52,3 30 15,0 20,6 24,5 43,8 50,9 53,7 40 20,7 22,2 24,4 26,5 39,3 51,8 55,8 59,3 63,7 66,8 50 28,0 29,7 32,4 42,9 49,3 56,3 63,2 67,5 71,4 76,2 79,5 60 37,5 40,5 46,5 67,0 74,4 79,1 83,3 88,4 92,0 70 43,3 45,4 48,8 51,7 55,3 61,7 69,3 77,6 85,5 90,5 95,0 100,4 104,2 80 51,2 53,5 57,2 60,4 64,3 71,1 79,3 88,1 96,6 101,9 106,6 112,3 116,3 90 59,2 61,8 65,6 69,1 73,3 80,6 89,3 98,6 107,6 113,1 118,1 124,1 128,3 100 67,3 70,1 74,2 77,9 82,4 90,1 99,3 109,1 118,5 124,3 129,6 135,8 140,2

24 KÖSZÖNÖM A FIGYELMET!


Letölteni ppt "Mintavételes eljárások Becslés"

Hasonló előadás


Google Hirdetések