STATISZTIKA II. 3. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék
Olyan jelenségek, amelyek a véletlentől függő értéket vesznek fel
A sokasági átlagra (várható értékre), a sokasági varianciára, a sokaság egy arányára (népességen belül a sokgyermekes családok arányára). Intervallumbecslés FAE mintából
Az átlag és arány becslés esetében normális eloszlással jól közelíthető: az előírt szabványoktól való eltérés (hiba) (minőségellenőrzés), nem normális, de szimmetrikus eloszlás nem túl kis minták esetében (30<n), erősen ferde, nem szimmetrikus eloszlás nagy minta elemszám esetében (100<n). Intervallumbecslés FAE mintából
A sokasági várható érték becslésének két esete: Sokasági szórás (variancia) ismert Sokasági szórást a mintából kell becsülni Intervallumbecslés FAE mintából
Sokasági szórás (variancia) ismert változó standard normális eloszlású, de ha a szórást a mintából kell becsülni s 2 -tel (korrigált tapasztalati szórás), akkor a standardizálás így nem végezhető el. Intervallumbecslés FAE mintából
Sokasági szórást a mintából kell becsülni A t változó Student (t) eloszlást követ n-1 szabadságfokkal. A Student (t) eloszlás hasonlít a standard normális eloszláshoz: –szimmetrikus, –a szabadságfok (minta nagyság) növekedésével tart a normális eloszláshoz. Ezért nagy minták esetén az ismert és a becsült szórás közelít egymáshoz. Intervallumbecslés FAE mintából
Sokasági szórás ismert (nem kell becsülni): a megadott megbízhatósági szinthez meghatározzuk a z szorzót, majd az összefüggésből kiszámítjuk a konfidencia- intervallum alsó és felső határait. Intervallumbecslés FAE mintából
A sokasági szórás nem ismert: a mintából torzítatlanul kell becsülni majd a megfelelő szabadságfokú t-eloszlás táblázatból meghatározzuk aértéket. Ezután az összefüggésből kiszámítjuk a konfidencia-intervallum alsó és felső határait. Intervallumbecslés FAE mintából
a várható érték konfidencia-intervallumának alsó és felső határa: Formalizálva: Intervallumbecslés FAE mintából
ismert sokasági szórás esetén a összefüggésből indulunk ki, és ezt rendezzük át n-re Ez után rögzítve a megbízhatósági szintet és a hibahatárt, a szórás ismeretében kiszámíthatjuk a szükséges minta elemszámát. Intervallumbecslés FAE mintából a mintanagyság meghatározása
7.6. példa A félliteres zacskós tejet automata csomagolja. FAE minta alapján becsüljük az átlagos töltési mennyiséget, készítsünk 95%-os megbízhatósággal intervallum becslést ! (eloszlás normális, szórás nem ismert) Félliteres zacskós tej (ml)
Ugyan ebben az esetben a mintanagyság meghatározása ismert szórás esetén:
K: a sokaság egy meghatározott tulajdonságával rendelkező elemeinek száma pl. egy adott jövedelemszint alattiak száma P: a sokasági arányt Pontbecslés (a mintából számított hasonló arány): Arány (valószínűség) intervallumbecslés
Ez a p FAE minta esetében binomiális eloszlást követ Elegendően nagy minta esetén a binomiális eloszlás jól közelíthető normális eloszlással P 0,5 körül kis minta P 0 vagy 1 körüli nagy minta Arány (valószínűség) intervallumbecslés
általános hüvelykujjszabály: P=0,5 legalább 20 elemű minta P=0,1 vagy P=0,9, legalább 100 elemű minta szükséges a normális eloszláson alapuló közelítéshez Arány (valószínűség) intervallumbecslés
Ha a minta elegendően nagy, akkor és a standard normális eloszlás alkalmazható Arány (valószínűség) intervallumbecslés
Így a konfidencia-intervallum: ahol egyenlet megoldásának eredményeként kapjuk. Arány (valószínűség) intervallumbecslés
7.7. példa A KSH által 2004-re közölt munkanélküliségi adatok ellenőrzésére 1500 elemű véletlen mintát vettek. A mintában a munkanélküliségi ráta 6,3% (p 1 =0,063), az aktivitási ráta 53,6% (p 2 =0,536) volt. A becslést 95,5% megbízhatóságon elvégezve (z=2) a következőket kapták: Arány intervallumbecslése mintából
Kiindulva a A mintanagyság meghatározása A becsülni kívánt arány ismeretlen, de P=0,5-nél maximumot ad: max P(1-P)=0,25 így P-től függetlenül is használható. Arány intervallumbecslés minta elemszáma
vagy a torzítatlan Nézzük az s 2 eloszlását…….. Sokasági variancia becslés
Ha Y (és y i ) normális eloszlású változók, akkor bizonyítható, hogy azváltozó n-1 szabadságfokú -eloszlást követ. Az eloszlás nem szimmetrikus, ezért az alsó és felső szélén kijelölt valószínűség nem egyforma hosszúságú intervallumot jelent. A konfidencia-intervallum nem szimmetrikus a pontbecslésre. Sokasági variancia becslés
Khi-négyzet eloszlások
7.8. példa Egy teszt magnetofon esetében 10 (alkalommal), egymástól független szalagsebességet mértek (cm/sec). A minta alapján becsüljük (normális eloszlást feltételezve) az ingadozást mérő szórásnégyzetet (szórást) és 90%-os konfidencia intervallumát. Magnó szalagsebessége (cm/sec) 4,755 4,766 4,761 4,762 4,759 4,766 4,760 4,758 4,762 4,760
A minta átlaga:
Tűréshatár