Mintavétel és becslés október október 26.

Slides:



Advertisements
Hasonló előadás
Szimmetriák szerepe a szilárdtestfizikában
Advertisements

Kauzális modellek Randall Munroe.
A TUDOMÁNYOS KUTATÁS MÓDSZERTANA
2.1Jelátalakítás - kódolás
Az úttervezési előírások változásai
Fizika II..
Számítógépes Hálózatok
Profitmaximalizálás  = TR – TC
A járműfenntartás valószínűségi alapjai
Szenzorok Bevezetés és alapfogalmak
Végeselemes modellezés matematikai alapjai
A magas baleseti kockázatú útszakaszok rangsorolása
Szerkezetek Dinamikája
MÉZHAMISÍTÁS.
Hőtan BMegeenatmh 5. Többfázisú rendszerek
BMEGEENATMH Hőátadás.
AUTOMATIKAI ÉPÍTŐELEMEK Széchenyi István Egyetem
Skandináv dizájn Hisnyay – Heinzelmann Luca FG58PY.
VÁLLALATI Pénzügyek 2 – MM
Hőtan BMEGEENATMH 4. Gázkörfolyamatok.
Szerkezetek Dinamikája
Összeállította: Polák József
A TUDOMÁNYOS KUTATÁS MÓDSZERTANA
Csáfordi, Zsolt – Kiss, Károly Miklós – Lengyel, Balázs
Tisztelt Hallgatók! Az alábbi példamegoldások segítségével felkészülhetnek a 15 pontos zárthelyi dolgozatra, ahol azt kell majd bizonyítaniuk, hogy a vállalati.
J. Caesar hatalomra jutása atl. 16d
Anyagforgalom a vizekben
Kováts András MTA TK KI Menedék Egyesület
Az eljárás megindítása; eljárási döntések az eljárás megindítása után
Melanóma Hakkel Tamás PPKE-ITK
Az új közbeszerzési szabályozás – jó és rossz gyakorlatok
Képzőművészet Zene Tánc
Penicillin származékok szabadgyökös reakciói
Boros Sándor, Batta Gyula
Bevezetés az alvás-és álomkutatásba
Kalandozások az álomkutatás területén
TANKERÜLETI (JÁRÁSI) SZAKÉRTŐI BIZOTTSÁG
Nemzetközi tapasztalatok kihűléssel kapcsolatban
Gajdácsi József Főigazgató-helyettes
Követelmények Szorgalmi időszakban:
Brachmann Krisztina Országos Epidemiológiai Központ
A nyelvtechnológia eszközei és nyersanyagai 2016/ félév
Járványügyi teendők meningococcus betegség esetén
Kezdetek októberében a könyvtár TÁMOP (3.2.4/08/01) pályázatának keretében vette kezdetét a Mentori szolgálat.
Poszt transzlációs módosulások
Vitaminok.
A sebész fő ellensége: a vérzés
Pharmanex ® Bone Formula
Data Mining Machine Learning a gyakorlatban - eszközök és technikák
VÁLLALATI PÉNZÜGYEK I. Dr. Tóth Tamás.
Pontos, precíz és hatékony elméleti módszerek az anion-pi kölcsönhatási energiák számítására modell szerkezetekben előadó: Mezei Pál Dániel Ph. D. hallgató.
Bevezetés a pszichológiába
MOSZKVA ZENE: KALINKA –HELMUT LOTTI AUTOMATA.
Bőrimpedancia A bőr fajlagos ellenállásának és kapacitásának meghatározása Impedancia (Z): Ohmos ellenállást, frekvenciafüggő elemeket (kondenzátort, tekercset)
Poimenika SRTA –
Végeselemes modellezés matematikai alapjai
Összefoglalás.
Az energiarendszerek jellemzői, hatékonysága
Varga Júlia MTA KRTK KTI Szirák,
Konzerváló fogászat Dr. Szabó Balázs
Outlier detektálás nagyméretű adathalmazokon
További MapReduce szemelvények: gráfproblémák
Ráhagyások, Mérés, adatgyűjtés
Járműcsarnokok technológiai méretezése
Grafikai művészet Victor Vasarely Maurits Cornelis Escher.
VÁLLALATI PÉNZÜGYEK I. Dr. Tóth Tamás.
RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
Az anyagok fejlesztésével a méretek csökkennek [Feynman, 1959].
Bevezetés a színek elméletébe és a fényképezéssel kapcsolatos fogalmak
Minőségmenedzsment alapjai
Előadás másolata:

Mintavétel és becslés 2017. október 24. 2017. október 26. Gazdaságstatisztika Mintavétel és becslés 2017. október 24. 2017. október 26.

Néhány hasznos gondolat 2. ZH: 2017. november 2; kezdés 08:00-kor és 12:00-kor! Beosztás ÜTI weblapon, Neptun üzenet Konzultáció: 2017. október 31. (kedd) 16:00-18:00 Q-II. Zárthelyi anyaga: Leíró statisztika (ábrázolás, mutatószámok) Heterogén sokaság vizsgálata Becslés A jegyzet 1-4. fejezete (88. oldalig) Gazdaságstatisztika

Sokaság: a vizsgálat tárgyát képező egységek összessége Matematikai statisztika lényege Sokaság: a vizsgálat tárgyát képező egységek összessége Következtetés A minta elemei az alapsokaság eloszlásával megegyező eloszlású valószínűségi változók. Minta: valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés (mérés) eredménye Mintavétel Mintavétel: a statisztikai sokaságból információszerzés céljából véletlenszerűen egyedi elemeket emelünk ki

Mintavétel – részleges megfigyelés Cél: következtetéseket vonjunk le a teljes sokaságra vonatkozóan a sokaság részleges megismerése által A MINTA CSAK ESZKÖZ A SOKASÁG TELJES MEGISMERÉSÉHEZ! De milyen a jó minta? Mintavételi és nem mintavételi hiba

Mintavételi hiba A mintából számított bármely mutató értéke mintáról mintára változik. A mintából számított értékek a megfelelő sokasági jellemző körül szóródnak. Ez a szóródás kisebb minták esetében nagyobb, nagyobb minták esetében kisebb. A mintavételi hiba a vizsgált mutató lehetséges mintákból számított értékeinek átlagos eltérését mutatja a megfelelő sokasági értéktől.

Adatfelvételi módok Adatfelvétel Teljes körű – csak véges sokaság esetén (pl. népszámlálás) Részleges Mintavételes megfigyelés Kísérleti eredmények gyűjtése Egyéb részleges megfigyelés Véletlen(szerű) kiválasztás Nemvéletlen(szerű) kiválasztás

Kísérletezzünk! Következtetés Mintavétel Mennyi lehet a szemüveges Hallgatók aránya a tárgyat felvett Hallgatók között? Becslés Igaz-e, hogy a szemüveges Hallgatók aránya a tárgyat felvettek körében (pl.) 25 %? Hipotézisvizsgálat Következtetés A szemüveges Hallgatók aránya ITT ÉS MOST: leíró statisztika Minta: valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés (mérés) eredménye Mintavétel Sokaság: a vizsgálat tárgyát képező egységek összessége A tárgyat felvett 764 Hallgató

Véletlen mintavétel Olyan kiválasztási eljárás, melynek során ismert vagy meghatározható a sokaság egyes elemeinek mintába kerülési esélye. Mintavételi hiba számszerűsítése Reprezentativitás biztosítása: a minta összetétele csak a véletlen hatások miatt tér el a sokaságétól Visszatevéses egyszerű véletlen mintavétel Visszatevés nélküli egyszerű véletlen mintavétel Rétegzett mintavétel Csoportos mintavétel Többlépcsős mintavétel Gazdaságstatisztika

Véletlen mintavétel Visszatevéses egyszerű véletlen mintavétel A sokaságból egyenlő valószínűséggel, a visszatevéses technika miatt egymástól függetlenül veszünk mintát. Inkább elméleti, mint gyakorlati jelentőség. Visszatevés nélküli egyszerű véletlen mintavétel A sokaságból egyenlő valószínűséggel veszünk mintát, a mintaelemek egymástól nem függetlenek. Inkább gyakorlati, mint elméleti jelentőség. Következtetés pontosságát meghatározó tényezők: Minta elemszáma Sokaság heterogenitása Gazdaságstatisztika

Véletlen mintavétel Rétegzett mintavétel: a sokaságot egy csoportképző ismérv szerint rétegekre bontjuk, majd minden rétegből egyszerű véletlen mintát veszünk. Teljes lista Következtetés megbízhatóságát meghatározó tényező: Rétegek heterogenitása Rétegképző ismérv „jósága” Szóráshányados mutató Gazdaságstatisztika

Véletlen mintavétel Csoportos mintavétel: olyan nyilvántartásból történik a kiválasztás, amely a sokaság egységeit nem elkülönítve, hanem természetes vagy mesterséges csoportokban tartalmazza. Csoportképző ismérv Csoportok közül egyszerű véletlen mintavétel Következtetés megbízhatóságát meghatározó tényező: Csoport heterogenitása Többlépcsős mintavétel: csoportos általánosítása Gazdaságstatisztika

A becslés elmélete (Majdnem) minden elméleti eloszlásnak van(nak) paramétere(i) Becslési eljárások: Pontbecslés: a becsülni kívánt elméleti paramétert egy értékkel becsüli Intervallumbecslés: előre meghatározott megbízhatósággal egy intervallumot ad a keresett sokasági paraméterre A becsülni kívánt sokasági paraméter jelölése: Θ A sokaság ismeretlen konstans értékei, értékük nem függ a véletlentől A becslés a sokaságból kivett véletlen minta alapján valósul meg: a mintaelemek függvénye, becslőfüggvény Véletlen minta esetén az aktuális minta függ a véletlentől, ezért minden mintaelem, és a függvényükben számított becslés is valószínűségi változó. A mintából számított pontbecslés: Gazdaságstatisztika

A becslés elmélete mintáról mintára változik maga is valósz. változó Minta-1 mintáról mintára változik Minta-2 maga is valósz. változó Minta-3 adott elméleti eloszlással, szórással stb. jellemezhető Gazdaságstatisztika

Becslés elmélete Mikor tekinthető a mintából számított mutató az ismeretlen elméleti paraméter jó becslésének? Mikor jobb egy becslés, mint a másik? Becslési kritériumok (Fisher kritériumok) Torzítatlanság Hatásosság Konzisztencia Elégségesség Gazdaságstatisztika

Becslési kritériumok - torzítatlanság Torzítatlan a becslőfüggvény, ha annak várható értéke megegyezik a becsülni kívánt sokasági paraméterrel: Nincs szisztematikus, egyirányú eltérés a becslés és a becsült paraméter között Két torzított becslőfüggvény közül azt tekintjük jobbnak, amelyiknél kisebb a torzítás abszolút értéke. torzítatlan torzított f(x) f(x) Gazdaságstatisztika

Becslések tulajdonságai – torzítatlan becslés Kockadobás esetén a dobott számérték – mint valószínűségi változó – elméleti várható értéke 3,5, elméleti szórása 1,7078. 50 db háromelemű minta tapasztalati és korrigált tapasztalati szórásai, valamint ezek átlagértékei Gazdaságstatisztika

Példa - Torzítatlan becslés  F(x), f(x), M(), D() …. , S1 , S1* , S2* , S2 , S3* , S3  Gazdaságstatisztika

Becslési kritériumok - konzisztencia Konzisztens a becslőfüggvény, ha ingadozása a becsült paraméter körül a minta elemszámának növelésével egyre csökken. A becslőfüggvény értékei nagy minta esetén jól közelítsék a megfelelő sokasági jellemzőt. f(x) Gazdaságstatisztika

Becslések tulajdonságai – konzisztens becslés Kockadobás esetén a dobott érték tapasztalati és korrigált tapasztalati szórásának alakulása a minta nagyságának függvényében Gazdaságstatisztika

Becslési kritériumok - Hatásosság A becslések ingadozását a becslések szórásával mérjük. Két becslés közül a kevésbé ingadozót tekintjük hatásosabbnak. f(x) Gazdaságstatisztika

 (Normális el.) Hatásos becslés Me1 Me2 Me3 F(x), f(x), M()=, D()= Me1 Me torzítatlan konzisztens Me2 elégséges Me3 Gazdaságstatisztika

Becslések tulajdonságai – hatásos becslés Az átlag kisebb szórással ingadozik, mint a medián, ezért a számtani átlag a hatásosabb becslés. Gazdaságstatisztika

Becslési kritériumok - elégségesség A becslés elégséges, ha minden információt tartalmaz a paraméterre vonatkozóan. Nincs más olyan becslés, amely a paraméterről több információt szolgáltatna, mint az elégséges becslés. Gazdaságstatisztika

Becslési kritériumok Torzítatlanság Hatásosság Konzisztencia Elégséges A becslés várható értéke a becsülendő sokasági paraméter A becslés a szóban forgó paraméterérték körül ingadozik Asszimptotikusan torzítatlan becslések Hatásosság A becslés ingadozása (szórása) a becsülendő paraméter körül Konzisztencia A becslés ingadozása növelve a mintaszámot egyre csökken Elégséges Lényegében minden információt tartalmaz a becsülendő paraméterről Gazdaságstatisztika

A pontbecslés módszerei Maximum-likelihood módszer (a legnagyobb valószínűség elve) Ún. likelihood függvényt állít fel, amely a mintaelemek együttes sűrűségfüggvénye. Az ismeretlen paraméter becslésére azt a statisztikát használjuk, melyre ez a függvény maximális értéket vesz fel. Az eredeti eloszlás ismerete szükséges. A legkisebb négyzetek módszere Nem szükséges az eredeti eloszlás ismerete, de ismert a törvényszerűség, amely a megfigyeléseinket előállította. Cél ezen elméleti modell a paramétereit a meghatározása úgy, hogy a tényleges és a becsült paraméterekkel illesztett modellek négyzetes eltérése, azaz az eltérések négyzetösszege minimális legyen. Gazdaságstatisztika

A pontbecslés módszerei Grafikus paraméterbecslés A gyakorlat számára könnyebben kezelhetőbb eljárás. Pontossága a grafikus ábrázolás adta lehetőségektől függ, viszont egyszerűsége miatt sokszor jól használható. Lényege, hogy valamilyen módon (többnyire logaritmizálással) linearizáljuk az eloszlásfüggvényt, s az adatokat grafikusan ábrázolva az egyenes meredekségéből és/vagy tengelymetszetéből következtetünk az eloszlás ismeretlen paraméteré(ei)re. Gazdaságstatisztika

Intervallumbecslés mintáról mintára változik maga is valósz. változó Minta-1 mintáról mintára változik Minta-2 maga is valósz. változó Minta-3 adott elméleti eloszlással, szórással stb. jellemezhető Gazdaságstatisztika

Intervallumbecslés Pontbecslés: az ismeretlen sokasági jellemző értékére egy mintából egyetlen pontot határoztunk meg, amely eleget tett valamilyen követelménynek. Intervallumbecslés: a minta alapján olyan intervallumot határozunk meg, amely előre megadott (nagy) valószínűséggel tartalmazza a becsülni kívánt jellemzőt. Gazdaságstatisztika

Intervallumbecslés A pontbecslés csak véletlenül egyezik meg a sokasági paraméterrel, általában annak környezetében helyezkedik el – mintavételi hiba! A pontbecslés intervallumbecsléssel egészíthető ki. A mintavételi hibát figyelembe véve adott (nagy) megbízhatóságú intervallumbecslést adunk a becsülni kívánt sokasági paraméterre. Milyen széles legyen, hogy lefedje a becsülni kívánt sokasági paramétert? A mintastatisztika szóródásának mértéke függ a minta elemszámától. A sokasági paramétert becslő függvényünk mintavételi eloszlása Ennek ismeretében meg tudunk adni egy olyan intervallumot, amely az ismeretlen paramétert nagy valószínűséggel tartalmazza – DE 100%-os biztonság nincs! Gazdaságstatisztika

Intervallumbecslés Az intervallumbecslés lényege, hogy ismerjük pontbecslésünk valószínűségi tulajdonságait, és ezek segítségével egy adott megbízhatósági intervallumot adunk meg a sokasági paraméterre. A konfidencia-intervallum is valószínűségi változó, vagyis a konfidencia-intervallumok is mintáról mintára változnak. A mintavétel végrehajtása után a konfidencia-intervallum vagy tartalmazza a becsülni kívánt sokasági paramétert vagy nem. Amennyiben a mintavételt újra és újra megismételnénk, és elkészítenénk a konfidencia-intervallumokat, az esetek (1-α)%-ában a sokasági jellemző a konfidencia-intervallumon belül lenne. Gazdaságstatisztika

Intervallum szélessége Sokasági szórás intervallum szélessége Mintaszám Megbízhatósági szint Gazdaságstatisztika

Intervallum becslés – várható érték  Normális el. M()=, D()=0 ismert n elemű FAE mintából számított számtani átlaggal becsüljük Normális eloszlás (Mintavételi eloszlás) Kvantitatív módszerek

Bizonyítsuk be, hogy 𝐷 𝑥 = 𝜎 𝑜 𝑛 ! Szorgalmi feladat Bizonyítsuk be, hogy 𝐷 𝑥 = 𝜎 𝑜 𝑛 ! Leadási határidő: 2017.10.26 óra eleje A helyes megoldás 2 pontot ér! Gazdaságstatisztika

Intervallumbecslés a normális eloszlás várható értékére ±2 szigmás szabály: Átrendezés után:  Gazdaságstatisztika

Várható érték becslése – ismert alapsokasági szórás A  valószínűségi változó N(,0) eloszlású, ahol 0 szórás ismert A  sokasági paramétert statisztikai mintából a számtani átlaggal becsüljük. Az átlag eloszlása normális: A konfidencia- intervallum sugarát adott megbízhatósági szinthez tartozó maximális hibának nevezzük. Gazdaságstatisztika

A megfelelő z-érték keresése Legyen 𝜶=𝟎,𝟏, így 𝟏− 𝜶 𝟐 =𝟏−𝟎,𝟎𝟓=𝟎,𝟗𝟓 Keressük azt a 𝒛 értéket, ahol 𝚽 𝒛 =𝟎,𝟗𝟓 Gazdaságstatisztika

Várható érték becslése – ismert alapsokasági szórás – egyoldali becslés Gazdaságstatisztika

Példa Egy gép 1000 grammos kávékivonatot tölt. A töltősúly ellenőrzésére 9 elemű véletlen mintát vettek a termelésből, és az alábbi nettó töltési tömegeket mérték grammban: 990, 1004, 996, 1000, 999, 1005, 997, 1001, 1000 A gép által töltött tömeg normális eloszlású valószínűségi változó 4,5g szórással. Határozzuk meg 95%-os megbízhatósággal a termékek várható értékének konfidencia intervallumát! Megoldás: n=9 Gazdaságstatisztika

Példa =0,95  =0,05  kétoldali becslés: /2=0,025  z/2=1,96 Ez azt jelenti, hogy 95%-os megbízhatósági szinten a gép által töltött tömeg várható értéke 996,1711 gramm és 1002,051 gramm között van. Gazdaságstatisztika

Példa Tegyük fel, hogy a technológiát úgy kell beállítani, hogy a töltősúly hosszabb távon ne haladja meg az 1002 grammot. A minta alapján 95%-os megbízhatósággal teljesíti-e ezt a töltőgép? n=9 =0,95  =0,05  egyoldali becslés  z=1,645 Ez azt jelenti, hogy 95%-os megbízhatósági szinten a gép által töltött tömeg várható értéke 1001,58 gramm alatt van, 95%-os megbízhatósággal teljesíti az elvárást. Gazdaságstatisztika

Szorgalmi feladat 1 pont Egy vasútvonalon egy hétig minden vonaton feljegyezték az utasok számát. Az eredményeket az alábbi táblázat tartalmazza: Adjunk 99%-os megbízhatósággal intervallumbecslést a vonaton utazók számának várható értékére! Utasok száma Vonatok száma 𝟎≤𝒙≤𝟑𝟎 6 𝟑𝟎<𝑿≤𝟔𝟎 12 𝟔𝟎<𝒙≤𝟗𝟎 28 𝟗𝟎<𝑿≤𝟏𝟐𝟎 30 𝟏𝟐𝟎<𝑿≤𝟏𝟓𝟎 16 𝟏𝟓𝟎<𝑿<≤𝟏𝟖𝟎 8

Szorgalmi feladat megoldása Ismert, hogy 𝒙 =93,6, illetve 𝝈 𝒐 =𝟑𝟖,𝟓. 𝜶=𝟎,𝟎𝟏 így 𝟏− 𝜶 𝟐 =𝟎,𝟗𝟗𝟓 𝑷 𝒙 − 𝒛 𝜶 𝟐 𝝈 𝒐 𝒏 <𝝁< 𝒙 + 𝒛 𝜶 𝟐 𝝈 𝒐 𝒏 =𝟏−𝜶 𝒛 𝜶/𝟐 =𝟐,𝟓𝟖 𝑷 𝟗𝟑,𝟔−𝟐,𝟓𝟖 𝟑𝟖,𝟓 𝟏𝟎𝟎 <𝝁<𝟗𝟑,𝟔−𝟐,𝟓𝟖 𝟑𝟖,𝟓 𝟏𝟎𝟎 =𝟎,𝟗𝟗 𝟖𝟑,𝟔𝟔𝟕<𝝁<𝟏𝟎𝟑,𝟓𝟑𝟑 99%-os megbízhatósággal a vonatok utazók számának várható értéke 83,667 és 103,533 fő között van. Gazdaságstatisztika

Mintanagyság meghatározása Adottak a megbízhatósági és pontossági követelmények, és ennek tükrében kell a minta elemszámát meghatározni Gazdaságstatisztika

Példa Kávékivonatos példa – ismert elméleti szórás Mekkora mintára van szükségünk ahhoz, hogy a becslés hibáját a harmadára csökkentsük? Gazdaságstatisztika

Mintanagyság meghatározása Pontossági követelmény Megbízhatósági szint Az intervallum szélessége Gazdaságstatisztika

Várható érték becslése – ismeretlen alapsokasági szórás Feltétel: a sokaság normális eloszlású, de nem ismerjük sem a várható értéket (μ-t), sem a sokasági szórást (σ0-t). Kis mintánk van, n<30. Az átlag továbbra is normális eloszlású Az ismeretlen alapsokasági szórás (σ) becslésére a korrigált tapasztalati szórást használjuk fel ( 𝑠 ∗ , torzítatlan becslés.) 𝒛= 𝒙 −𝝁 𝝈/ 𝒏 helyett 𝒕= 𝒙−𝝁 𝒔 ∗ / 𝒏 , ami Student eloszlású valószínűségi változó ν=n-1 szabadsági fokkal A konfidencia intervallum:

A t-érték meghatározása Megbízhatósági szint Szabadságfok: DF=n-1 Gazdaságstatisztika

Várható érték becslés nagy minták esetében Feloldható a sokaság normalitására vonatkozó feltétel: Ha az alapsokaság szimmetrikus, n>30 Nem szimmetrikus alapsokaság esetében, n>100 A Student-féle t-eloszlás helyettesíthető standard normális eloszlással Gazdaságstatisztika

Példa Tegyük fel, hogy kávé töltőgépes példánál nem ismerjük az elméleti szórást, de továbbra is tudjuk, hogy a töltési tömeg normális eloszlással írható le. A grammokban mért töltési tömegek egy 9 elemű minta alapján: 990, 1004, 996, 1000, 999, 1005, 997, 1001, 1000 Adjunk becslést 95%-os megbízhatósági szinten a töltőtömeg várható értékére! Megoldás: n=9 A σ0 nem ismert, becsülnünk kell a minta korrigált tapasztalati szórásával:

Példa ε= 0,95  =0,05  kétoldali becslés: /2=0,025 t/2=2,306 (DF=9-1=8) σ0 nem ismert, becsültük Szélesebb intervallum! σ0 ismert

Sokasági arány becslése A sokaságon belül egyetlen (mennyiségi vagy minőségi) ismérv szerint 2 csoportba soroljuk a sokasági elemeket. A sokasági arány: P Torzítatlan becslőfüggvénye: p = k/n p = k/n Binomiális eloszlás M(p) = P D2(p) = P(1-P)/n Közelítjük normális eloszlással

Példa A Felvillanyozzuk Kft. napi termeléséből vett n = 200 elemű mintában a hibás égők száma 24 db. 95%-os és 99%-os megbízhatósági szint mellett adjunk intervallumbecslést a hibás égők sokasági arányára! Megoldás: n = 200 p = 24/200 = 0,12  = 0,95   = 0,05  kétoldali becslés: /2 = 0,025  z/2 = 1,96 1−𝛼/2 95%-os megbízhatósági szinten a sokasági arány, vagyis a hibás égők aránya 7,5% és 16,5% között van.

Példa  = 0,99   = 0,01  kétoldali becslés: /2 = 0,005  z/2 = 2,58 99%-os megbízhatósági szinten a sokasági arány, vagyis a hibás égők aránya 6,066% és 17,934% között van. α =1% Szélesebb intervallum! α =5%

Mintanagyság meghatározása Adottak a megbízhatósági és pontossági követelmények, és ennek tükrében kell a minta elemszámát meghatározni Gazdaságstatisztika

Példa Felvillanyozzuk Kft. – 95%-os megbízhatóság mellett csökkentsük a becslés hibáját a felére! Gazdaságstatisztika

Szorgalmi feladat Egy vasútvonalon egy hétig minden vonaton feljegyezték az utasok számát. Az eredményeket az alábbi táblázat tartalmazza: Adjunk 95%-os megbízhatóságú intervallumot azon vonatok arányára, amelyen 60-nál kevesebben utaztak! Utasok száma Vonatok száma 𝟎≤𝑿<𝟑𝟎 6 𝟑𝟎≤𝑿<𝟔𝟎 12 𝟔𝟎≤𝑿<𝟗𝟎 28 𝟗𝟎≤𝑿<𝟏𝟐𝟎 30 𝟏𝟐𝟎≤𝑿<𝟏𝟓𝟎 16 𝟏𝟓𝟎≤𝑿≤𝟏𝟖𝟎 8

Szorgalmi feladat megoldása =0,95 innen 𝜶=𝟎,𝟎𝟓; kétoldali becslés, így 𝜶 𝟐 =𝟎,𝟎𝟐𝟓. Keressük a 𝒛 𝜶/𝟐 értéket, azt az értéket, ahol az 𝑵~(𝟎,𝟏) eloszlás felveszi a 0,975 értéket: 𝚽 −𝟏 𝟎,𝟗𝟕𝟓 =𝟏,𝟗𝟔 𝒑= 𝒌 𝒏 = 𝟔+𝟏𝟐 𝟏𝟎𝟎 =𝟎,𝟏𝟖 (a mintában 18 olyan vonat volt, amin 60-nál kevesebben utaztak). 𝑷 𝒑− 𝒛 𝜶 𝟐 𝒑 𝟏−𝒑 𝑵 <𝑷<𝒑+ 𝒛 𝜶 𝟐 𝒑 𝟏−𝒑 𝑵 =𝟏−𝜶 𝑷(𝟎,𝟏𝟖−𝟏,𝟗𝟔 𝟎,𝟏𝟖∗𝟎,𝟖𝟐 𝟏𝟎𝟎 <P<𝟎,𝟏𝟖+𝟏,𝟗𝟔 𝟎,𝟏𝟖∗𝟎,𝟖𝟐 𝟏𝟎𝟎 )=0,95 𝟎,𝟏𝟎𝟒𝟕<𝑷<𝟎,𝟐𝟓𝟓𝟑 95%-os megbízhatósági szinten 10,47 % és 25,53 % között van az olyan vonatok aránya, amelyen 60-nál kevesebben utaztak. Gazdaságstatisztika

Sokasági variancia becslése σ2 torzítatlan becslése: korrigált tapasztalati szórás Ekkor a 𝑛−1 𝑠 ∗ 2 𝜎 2 változó n-1 szabadsági fokú χ2 eloszlású követ. A χ2 eloszlás: független standard normális eloszlású változók négyzetei összegének eloszlása. Egy paramétere van: ν=n-1, ahol n az összegezendő egymástól független valószínűségi változók számát jelenti. Csak pozitív értékeken értelmezzük, balra aszimmetrikus, a szabadságfok növelésével közelít a normális eloszláshoz. Következmény: a konfidencia intervallum nem lesz szimmetrikus a pontbecslésre! KIZÁRÓLAG NORMÁLIS ELOSZLÁSÚ ALAPSOKASÁG ESETÉN BECSÜLHETŐ!!!

Sokasági variancia becslése  Normális el. !! M()=, D2()=2 - csak pozitív értékekre értelmezett - nem szimmetrikus !! mintából becsüljük, s2 vagy s*2 2-eloszlású (Mintavételi eloszlás)

Példa A Felvillanyozzuk Kft. karácsonyfaégőinek élettartamát n = 16 elemű mintából vizsgálva azt találták, hogy az élettartamok korrigált tapasztalati szórása 10 óra. Határozzuk meg az égők varianciájára, ill. szórására vonatkozó 95%-os konfidencia-határokat! Megoldás: n = 16 s* = 10 óra DF = n – 1 = 16 – 1 = 15  = 0,95   = 0,05  kétoldali becslés: /2 = 0,025  1 – /2 = 0,975 95%-os megbízhatósági szinten a sokasági szórás 7,38 és 15,5 óra között van. 54,5 < 2 < 239,6 7,38 < < 15,5

Alapsokasági szórás becslése nagy mintából A Chi-négyzet eloszlás értékei kifejezhetőek a standard-normális eloszlás értékei segítségével χ 𝟐 − 𝟐𝒗−𝟏 ~𝑵(𝟎,𝟏) Ez alapján a megfelelő értékek: Alapsokasági szórás becslése esetében az alapsokaság eloszlásának normalitására vonatkozó feltétel nagy minták esetében sem oldható fel! Gazdaságstatisztika

Szorgalmi feladat Egy vasútvonalon egy hétig minden vonaton feljegyezték az utasok számát. Az eredményeket az alábbi táblázat tartalmazza: Adjunk 99%-os megbízhatóságú intervallumot az utasok számának szórására! Utasok száma Vonatok száma 𝟎≤𝑿<𝟑𝟎 6 𝟑𝟎≤𝑿<𝟔𝟎 12 𝟔𝟎≤𝑿<𝟗𝟎 28 𝟗𝟎≤𝑿<𝟏𝟐𝟎 30 𝟏𝟐𝟎≤𝑿<𝟏𝟓𝟎 16 𝟏𝟓𝟎≤𝑿≤𝟏𝟖𝟎 8

Szorgalmi feladat megoldása =0,99 innen 𝜶=𝟎,𝟎𝟏; kétoldali becslés, így 𝜶 𝟐 =𝟎,𝟎𝟎𝟎𝟓 és 𝟏− 𝜶 𝟐 =𝟎,𝟗𝟗𝟓. 𝑫𝑭=𝒏−𝟏 így 𝑫𝑭=𝟏𝟎𝟎−𝟏=𝟗𝟗. χ2 𝜶 𝟐 (𝑫𝑭=𝟗𝟗)=𝟏𝟒𝟎,𝟏𝟕 és χ2 𝟏−𝜶/𝟐 𝑫𝑭=𝟗𝟗 =𝟒𝟔,𝟕𝟓𝟖 𝑷 (𝒏−𝟏) 𝒔 ∗ 𝟐 χ2 𝜶 𝟐 <𝝈 𝟐 < (𝒏−𝟏) 𝒔 ∗ 𝟐 χ2 𝟏−𝜶/𝟐 =𝟏−𝜶 𝑷 𝟗𝟗∗ 𝟑𝟖,𝟓𝟔 𝟐 𝟏𝟒𝟎,𝟏𝟕 < 𝝈 𝟐 < 𝟗𝟗∗ 𝟑𝟖,𝟓𝟔 𝟐 𝟔𝟕,𝟑𝟐𝟖 =𝟎,𝟗𝟗 𝟏𝟎𝟓𝟎,𝟏𝟓𝟕< 𝝈 𝟐 <𝟐𝟏𝟖𝟔,𝟑𝟏𝟗 𝟑𝟐,𝟒𝟎𝟔<𝝈<𝟒𝟔,𝟕𝟓𝟖 99%-os megbízhatósággal az utasok számának szórása 32,406 fő és 46,758 fő között van. Gazdaságstatisztika

Köszönöm a figyelmet! Árva Gábor