Mintavételes eljárások Becslés

Slides:



Advertisements
Hasonló előadás
Hipotézis-ellenőrzés (Statisztikai próbák)
Advertisements

I. előadás.
II. előadás.
Dixon Próbadb.Valószínűségi szint (p%) n10%5%1%7.3?4321 7? ,890,940,99pH7,07,27,3 4 0,68 0,770,89n=4 r 10 = (7,3-7,3)/(7,3-7,0) = 0 r 10 =(x 1 -x.
BECSLÉS A sokasági átlag becslése
„ A jó példa legyen ragadós! Legjobb gyakorlatok a közpénzek felhasználásánál” szeminárium „Önkormányzatok jó gyakorlata a takarékos gazdálkodásért” 2011.
Az időjárás és éghajlat
Kvantitatív Módszerek
A TAO támogatási rendszer Magyar Labdarúgás Fóruma
Költségvetés főösszegei Év Költségvetés főösszege
Kvantitatív módszerek
A ÉVI ORSZÁGOS KOMPETENCIAMÉRÉS ISKOLAI EREDMÉNYEI.
Általános statisztika II.
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Hipotézisvizsgálat Dr. Varga Beatrix egy. docens.
III. előadás.
Méréskiértékelés, matematikai statisztika
Kezelések által okozott eltérések értékelése Szórások elemzése Variancia analízis ZH március ZH tematika: március
100-as szög méreteinek gyakorisága (n = 100) db mm.
DIT-ÚMVP III-IV. tengelyét érintő programmódosítási javaslatok
Kvantitatív módszerek
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Statisztika II. III. Dr. Szalka Éva, Ph.D..
Budapesti Műszaki és Gazdaságtudományi Egyetem
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
STATISZTIKA II. 2. Előadás
STATISZTIKA II. 6. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
VII. Nevelésügyi Kongresszus 7. Szekció Intézményfenntartás, irányítás és finanszírozás Ifi István ügyosztályvezető, Budapest Főváros Főpolgármesteri.
Kvantitatív Módszerek
TOLNA MEGYEI ÖNKORMÁNYZAT. ILLETÉKBEVÉTEL ( m Ft-ban) Teljesített és várható bevétel Változás.
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Mintavételi hiba, hibaszámítás
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Becslés Dr. Varga Beatrix egy. docens.
1 A Nyugat- és Közép-Dunántúl megyei jogú városainak összehasonlítása a KSH statisztikai mutatói alapján év
Gazdaságstatisztika 14. előadás.
Gazdaságstatisztika 15. előadás.
Hipotézis vizsgálat (2)
1 A Nyugat- és Közép-Dunántúl megyei jogú városainak összehasonlítása a KSH statisztikai mutatói alapján év
Következtető statisztika 9.
Alapsokaság (populáció)
Két kvantitatív változó kapcsolatának vizsgálata
Forrás allokáció LHH Ft/ 1 Euro HPME katalógus III. tengely Összforrás: Euro Ft LHH forrás: Euro Ft nem LHH.
KERESETEK ALAKULÁSA 2011 JANUÁR 18 jövedelmi szint.
I. előadás.
TÁRSADALOMSTATISZTIKA Sztochasztikus kapcsolatok II.
Baróczi Lóránt BSc gépészmérnök jelölt GÖRDÜLŐCSAPÁGYAK REMANENS ÉLETTARTAMÁNAK VIZSGÁLATA Tervezésvezető: Dr. Szilágyi Attila egyetemi docens Konzulens:
GAZDASÁGI ADOTTSÁGOK ÉS FEJLŐDÉSI IRÁNYOK A délkelet-európai országok Novák Tamás MTA – VKI május 16.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Valószínűségszámítás II.
Kiugró adatok szűrése Dixon Próba db. Valószínűségi szint (p%) n 10%
Fónai Mihály – Márton Sándor A tehetséggondozó program hallgatóinak professzió-képe – egy sokváltozós modell- magyarázat lehetséges elemei – május.
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Kvantitatív módszerek Becsléselmélet október 15.
Gazdaságstatisztika Becsléselmélet október 30. és november 5.
Kvantitatív módszerek
II. előadás.
Becsléselmélet - Konzultáció
I. Előadás bgk. uni-obuda
Gazdaságinformatikus MSc
Előadás másolata:

Mintavételes eljárások Becslés 2. hét Mintavételes eljárások Becslés

Teljes sokaság vizsgálata Egy tanulócsoport hallgatóinak ösztöndíjaira vonatkozó adatokat Hallgató sorszáma Ösztöndíj értéke (Ft) 1 7000 2 9500 3 13000 4 10000 5 8000 6 9000 7 12000 8 11000 Jellemezzük a tanulócsoport hallgatóit, mint sokaságot az ösztöndíjuk alapján!

Általános jelölések: sokaság-minta Megnevezés Alapsokaságban Mintában Sokaság elemszáma N n Az i-edik egyed ismérvértéke Xi xi Az ismérvértékek átlaga Az ismérvértékek szórása

Mintából való következtetés Becslés Hipotézisvizsgálat Becslés: A sokaság bizonyos jellemzőinek, paraméterének közelítő megállapításával foglalkozik . Hipotézisvizsgálat: A sokaságra vonatkozó valamely állítás helyességét ellenőrzi. Estimation theory is a branch of statistics and signal processing that deals with estimating the values of parameters based on measured/empirical data. The parameters describe an underlying physical setting in such a way that the value of the parameters affects the distribution of the measured data. An estimator attempts to approximate the unknown parameters using the measurements. In estimation theory, it is assumed that the desired information is embedded in a noisy signal. Noise adds uncertainty, without which the problem would be deterministic and estimation would not be needed. The estimator estimates the parameters of a physical model based on measured data.

STATISZTIKAI BECSLÉS

Alapfogalmak Becslőfüggvény : egy olyan statisztika, ami valamely sokasági jellemző mintából történő közelítő meghatározását szolgálja. Pontbecslés A becslőfüggvény mintából számított konkrét értéke Intervallumbecslés Adott  megbízhatósági szinthez tartozó intervallum alsó és felső határának meghatározása Sokasági jellemző (paraméter): Konfidencia-intervallum egy x1, x2, ….xn mintából: Meg kell határoznunk a becslő függvénynek azt a és értékeit, melyekre teljesül, hogy π valószínűséggel közrefogják a sokasági paramétert. Standard hiba A becslő függvény valamennyi lehetséges mintából számított értékeinek a szórása.

Becslő függvényekkel szemben támasztott követelmények Torzítatlanság: Torzítatlannak nevezzük a becslő függvényt, ha a várható értéke egyenlő a paraméterrel, ellenkező esetben a becslő függvény torzított. A továbbiakban a következők becslő függvényeket fogjuk alkalmazni: Mintaátlag (a sokasági várható érték torzítatlan becslő függvénye). A mintabeli relatív gyakoriság (a sokasági megoszlási viszonyszám (valószínűség) torzítatlan becslése). A korrigált tapasztalati szórásnégyzetet (a sokasági szórásnégyzet torzítatlan becslő függvénye.) Hatásosság: két becslő függvény közül azt tekintjük hatásosabbnak, amelynek kisebb a szórása (standard hibája). Konzisztencia: a mintanagyság növelésével a becslés nagy valószínűséggel a sokasági paraméter felé, a becslő függvény szórása pedig a nulla felé tart. Ezért nagy minta használata esetén elfogadható az olyan konzisztens becslés is, amely nem torzítatlan.

A becslési eljárás lépései A becslés célja és a sokaságra vonatkozó mintán kívüli információk ismeretében megválasztjuk az alkalmazandó becslő formulát. Meghatározzuk a mintaátlagot. Megfelelő módon kiszámítjuk a standard hibát. Az elvárt megbízhatósági szintnek megfelelően meghatározzuk a megbízhatósági együttható értékét az eloszlástáblázatok segítségével. Meghatározzuk a konfidencia intervallumot.

Várható érték intervallum becslése Alapesetei: Normális eloszlású sokaság, melynek szórása ismert. Normális eloszlású sokaság, melynek szórása nem ismert. Ha a sokaság nem tekinthető normális eloszlásúnak: Ebben az esetben a központi határeloszlás már említett tételére támaszkodva azt mondhatjuk, hogy ha kellően nagy méretű mintát vizsgálunk, akkor a változó közelíti a normális eloszlást. Amennyiben kis minta áll rendelkezésre az elemzéshez, úgy egyéni sajátosságokat figyelembe vevő módszereket kell alkalmaznunk.

Várható érték becslése

1.) sokaság eloszlása normális, ismert a sokasági szórás, mintanagyság tetszőleges 2.) sokaság eloszlása nem ismert, nem ismert a sokasági szórás, nagy minta 3.) sokaság eloszlása normális, nem ismert a sokasági szórás, n < 100

Ahol: a becslőfüggvény mintából számított konkrét értéke standard normális eloszlású valószínűségi változó a mintaátlag standard hibája ( a mintaátlagok szórása) =n-1 szabadságfokú Student-eloszlású valószínűségi változó A Student-féle t eloszlás a szabadságfok növelésével a normálishoz tart.

Várható érték intervallum becslése Lépései: A sokaság a vizsgált változó alapján normális eloszlású, a minta elemszám tetszőleges és a szórását is ismerjük valamilyen korábbi felmérésből. A várható érték pontbecsléséből kell kiindulnunk. A mintaátlagot standardizáljuk, azaz a következő képlet alapján transzformáljuk: Adott π megbízhatósági szint mellett egy normális eloszlású, ismert szórású sokaság várható értékének intervalluma a következő formula segítségével becsülhető:

Mintapélda – várható érték Egy élelmiszer-feldolgozó vállalat adatai (N=50.000): Nettó töltősúly (g) Üvegek száma (db) 1440 - 1460 10 1461 - 1480 40 1481 - 1500 180 1501 - 1520 50 1521 - 1540 20 Összesen 300 A sokasági szórás ismeretében (σ=15g) a standard hiba z=2,32

z (z) 0,0 0,000 0,1 0,080 0,2 0,159 0,3 0,236 0,4 0,311 0,5 0,383 0,6 0,452 0,7 0,516 0,8 0,576 0,9 0,632 1,0 0,683 1,1 0,729 1,2 0,770 1,3 0,806 1,4 0,839 1,5 0,866 1,6 0,890 1,65 0,90 1,7 0,911 1,8 0,928 1,9 0,943 1,96 0,95 2,0 0,955 2,06 0,96 2,1 0,964 2,17 0,97 2,2 0,972 2,3 0,979 2,32 0,98 2,4 0,984 2,5 0,988 2,58 0,99 2,6 0,991 2,7 0,993 2,8 0,995 2,9 0,996 3,0 0,997 3,30 0,999

Várható érték intervallum becslése Lépései: A sokaság a vizsgált változó alapján normális eloszlású, a minta elemszám 100 egyednél nagyobb és a szórását nem ismerjük. A várható érték pontbecsléséből kell kiindulnunk. A mintaátlagot standardizáljuk, azaz a következő képlet alapján transzformáljuk: Adott π megbízhatósági szint mellett egy normális eloszlású, ismeretlen szórású sokaság várható értékének intervalluma a következő formula segítségével becsülhető:

Mintapélda – várható érték Egy élelmiszer-feldolgozó vállalat adatai Nettó töltősúly (g) Üvegek száma (db) 1440 - 1460 10 1461 - 1480 40 1481 - 1500 180 1501 - 1520 50 1521 - 1540 20 Összesen 300 z=1,96 A mintabeli szórás és a standard hiba meghatározása

Valószínűség vagy arány becslése

Konfidencia-intervallum

Mintapélda – arány Egy élelmiszer-feldolgozó vállalat adatai (N=50.000): Határozzuk meg 95%-os megbízhatóság mellett, hogy a gép áltat megtöltött üvegek közül hány százalék nem haladja meg az 1480 grammot! Nettó töltősúly (g) Üvegek száma (db) 1440 - 1460 10 1461 - 1480 40 1481 - 1500 180 1501 - 1520 50 1521 - 1540 20 Összesen 300 Mintabeli arány meghatározása: z=1,96 Standard hiba meghatározása: 95%-os megbízhatósággal a 1480 grammnál kisebb súlyú üvegek aránya legalább 12,465 és legfeljebb 20,88%

Szórásnégyzet, szórás becslése Jellemzői: A szórás pontbecslésére általában a korrigált tapasztalati szórást, mint torzítatlan becslő függvényt használjuk. A minta normális eloszlású sokaságból származik. Nincs semmiféle korlátozás a minta nagyságára nézve. Becslőfüggvény:

Mintapélda – szórás becslése Egy egyetemen dolgozatírás után a hallgatók által elért pontszámok alakulását vizsgáltuk 100 elemű véletlen kiválasztással gyűjtött minta alapján. Pontszám Dolgozatok száma (db) 0 - 20 8 21 - 40 26 41 - 60 37 61 - 80 23 81 - 100 6 Összesen 100

χ2 Df 0,005 0,01 0,025 0,05 0,10 0,25 0,50 0,75 0,90 0,95 0,975 0,99 0,995 1 0,0000 0,0002 0,0010 0,039 0,0158 0,102 0,455 1,32 2,71 3,84 5,02 6,63 7,88 2 0,0100 0,0201 0,0506 0,103 0,211 0,575 1,39 2,77 4,61 5,99 7,38 9,21 10,6 3 0,072 0,115 0,216 0,352 0,584 1,21 2,37 4,11 6,25 7,81 9,35 11,3 12,8 4 0,207 0,297 0,484 0,711 1,06 1,92 3,36 5,39 7,78 9,49 11,1 13,3 14,9 5 0,412 0,554 0,831 1,15 1,61 2,67 4,35 9,24 15,1 16,7 6 0,676 0,872 1,24 1,64 2,20 3,45 5,35 7,84 12,6 14,4 16,8 18,5 7 0,989 1,69 2,17 2,83 4,25 6,35 9,04 12,0 14,1 16,0 20,3 8 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,2 13,4 15,5 17,5 20,1 22,0 9 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,4 14,7 16,9 19,0 21,7 23,6 10 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,5 18,3 20,5 23,2 25,2 11 2,60 3,05 3,82 4,57 5,58 7,58 10,3 13,7 17,3 19,7 21,9 24,7 26,8 12 3,07 3,57 4,40 5,23 6,30 8,44 14,8 21,0 23,3 26,2 28,3 13 5,01 5,89 7,04 9,30 12,3 19,8 22,4 27,7 29,8 14 4,07 4,66 5,63 6,57 7,79 17,1 21,1 23,7 26,1 29,1 31,3 15 4,60 6,26 7,26 8,55 11,0 14,3 18,2 22,3 25,0 27,5 30,6 32,8 16 5,14 5,81 6,91 7,96 9,31 11,9 15,3 19,4 23,5 26,3 28,8 32,0 34,3 17 5,70 6,41 7,56 8,67 10,1 16,3 24,8 27,6 30,2 33,4 35,7 18 7,01 8,23 9,39 10,9 21,6 26,0 28,9 31,5 34,8 37,2 19 6,84 7,63 8,91 11,7 14,6 22,7 27,2 30,1 32,9 36,2 38,6 20 7,43 8,26 9,59 12,4 19,3 23,8 28,4 31,4 34,2 37,6 40,0 21 8,03 8,90 11,6 13,2 24,9 29,6 32,7 35,5 38,9 41,4 22 8,64 9,54 14,0 17,2 21,3 30,8 33,9 36,8 40,3 42,8 23 9,26 13,1 18,1 27,1 35,2 38,1 41,6 44,2 24 9,89 13,8 15,7 28,2 33,2 36,4 39,4 43,0 45,6 25 10,5 11,5 16,5 19,9 24,3 29,3 34,4 37,7 40,6 44,3 46,9 26 11,2 12,2 15,4 20,8 25,3 30,4 35,6 41,9 48,3 27 11,8 12,9 16,2 36,7 40,1 43,2 47,0 49,6 28 13,6 18,9 27,3 32,6 37,9 41,3 44,5 51,0 29 17,7 33,7 39,1 42,6 45,7 52,3 30 15,0 20,6 24,5 43,8 50,9 53,7 40 20,7 22,2 24,4 26,5 39,3 51,8 55,8 59,3 63,7 66,8 50 28,0 29,7 32,4 42,9 49,3 56,3 63,2 67,5 71,4 76,2 79,5 60 37,5 40,5 46,5 67,0 74,4 79,1 83,3 88,4 92,0 70 43,3 45,4 48,8 51,7 55,3 61,7 69,3 77,6 85,5 90,5 95,0 100,4 104,2 80 51,2 53,5 57,2 60,4 64,3 71,1 79,3 88,1 96,6 101,9 106,6 112,3 116,3 90 59,2 61,8 65,6 69,1 73,3 80,6 89,3 98,6 107,6 113,1 118,1 124,1 128,3 100 67,3 70,1 74,2 77,9 82,4 90,1 99,3 109,1 118,5 124,3 129,6 135,8 140,2

KÖSZÖNÖM A FIGYELMET!