BECSLÉS A sokasági átlag becslése

Slides:



Advertisements
Hasonló előadás
Hipotézis-ellenőrzés (Statisztikai próbák)
Advertisements

I. előadás.
„Esélyteremtés és értékalakulás” Konferencia Megyeháza Kaposvár, 2009
II. előadás.
Statisztika II. I. Dr. Szalka Éva, Ph.D..
2006. február 17. Valószínűségszámítás és statisztika II. Telefonos feladat Egy kalapban van két korong, az egyiknek mindkét oldala piros, a másiknak.
3. Két független minta összehasonlítása
Műveletek logaritmussal
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Két változó közötti összefüggés
Általános statisztika II.
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Gazdaságelemzési és Statisztikai Tanszék
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
Mintavételes eljárások
III. előadás.
Regresszióanalízis 10. gyakorlat.
Kvantitatív módszerek
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Statisztika II. III. Dr. Szalka Éva, Ph.D..
Készítette: Kosztyán Zsolt Tibor
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
Matematikai alapok és valószínűségszámítás

A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
STATISZTIKA II. 2. Előadás
STATISZTIKA II. 3. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
STATISZTIKA II. 4. Előadás
Készítette: Horváth Zoltán (2012)
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Valószínűségszámítás
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika Bevezetés szeptember 11.
Gazdaságstatisztika 14. előadás.
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Gazdaságstatisztika 15. előadás.
Hipotézis vizsgálat (2)
Következtető statisztika 9.
Hipotézis-ellenőrzés (Folytatás)
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Két kvantitatív változó kapcsolatának vizsgálata
Mintavételes eljárások
I. előadás.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Mintavételes Eljárások.
Bevezetés a méréskiértékelésbe (BMETE80ME19) Intervallumbecslések 2014/
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Valószínűségszámítás II.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Kvantitatív módszerek Becsléselmélet október 15.
Konzultáció – Részekre bontott sokaság vizsgálata, Becslés November 5. Gazdaságstatisztika.
Gazdaságstatisztika Becsléselmélet október 30. és november 5.
Kvantitatív módszerek
II. előadás.
Becsléselmélet - Konzultáció
I. Előadás bgk. uni-obuda
Kockázat és megbízhatóság
Gazdaságinformatikus MSc
Előadás másolata:

BECSLÉS A sokasági átlag becslése KÖVETKEZTETŐ STATISZTIKA MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 tavasz Utoljára módosítva: 2010.02.17

A becslés alapfeladata Pl. Hányan láttak egy TV műsort? Jellemzően kétféle választ lehet adni: Pontbecslés Pl. „A minta alapján a sokasági nézettségi arány 32 %”. Vesznek egy mintát, azaz, megkérdeznek 1300 embert, és ebből következtetnek, hogy a teljes sokaság hányadrésze látta a műsort. Intervallumbecslés: „A nézettségi arány 95% valószínűséggel 29 és 35 % közé esik.”

Sokaság és minta A mintavétel módja lehet: véletlen és nem véletlen A véletlen kiválasztás. Ismerjük a sokaság elemeinek mintába kerülési valószínűségét. A vél. minta fontos jellemzője: a reprezentativitás. Egyszerű véletlen mintavétel Visszatevéssel Visszatevés nélkül Rétegzett minta Csoportos és többlépcsős minta

A nem-véletlen kiválasztás Szisztematikus mintavétel (PL. a kijáratnál minden 10-ik vevő megkérdezése) Kvóta szerinti minta Koncentrált minta Önkényes minta

A mintaátlag eloszlása Alapkérdések: Tekinthető-e, ill. mikor tekinthető a mintaátlag eloszlása normális eloszlásúnak? A mintaátlag várható értéke és a sokasági átlag közötti összefüggés A mintaátlag szórása és a sokasági szórás közötti összefüggés

A mintaátlag eloszlása A mintaátlag valószínűségi változó (mintáról mintára változik), amelynek van eloszlása, várható értéke, szórása. A mintaátlag normális eloszlású, Ha a sokaság normális eloszlású Vagy: ha a minta elég nagy. (n > 30; pl. 100 elem) Ha a sokaság eloszlása nem ismert és a minta kicsi (30 elem alatti), akkor a mintaátlag eloszlása sem ismert. (Ekkor további megfontolásokra van szükség.)

A mintaátlag eloszlásának paraméterei Ha a minta véletlen (a sokaság eloszlásától függetlenül, akár visszatevéses a mintavétel akár nem) akkor, (A mintaátlag várható értéke a sokasági átlag) A mintaátlagok szórása, (standard hiba) Visszatevéses mintánál: Visszatevés nélküli mintánál: Ahol n / N a kiválasztási arány

PÉLDA sokaság és a minta közötti összefüggésre Vegyünk egy 5 elemű sokaságot. A sokaság elemei legyenek: (2, 3, 4, 5, 6). N =5 Írjuk össze az összes lehetséges 2 elemű mintát! n = 2 (minden húzás után visszatesszük a kihúzott elemet.) Ellenőrizzük, hogy A mintaátlagok várható értéke (átlaga) megyegyezik a sokasági átlaggal! A mintaátlag varianciája a sokasági variancia n-ed része! Végezzük el visszatevés nélküli mintára is! Hogyan módosul ekkor a mintátlag varianciája?

Megoldás 1. (Visszatevéses minta esetén) A sokasági átlag: A sokasági szórásnégyzet ill. szórás: A minta átlaga 2 3 2,5 4 5 3,5 A mintaátlagok átlaga: A mintaátlagok szórásnégyzete: Következtetés:

Megoldás 2. (Visszatevés nélküli minta esetén) A sokasági átlag: 4 A sokasági szórásnégyzet: 2 ill. szórás: A minta átlaga 2 3 2,5 4 5 3,5 6 4,5 A mintaátlagok átlaga: 4 A mintaátlagok szórásnégyzete = Következtetés:

A becslő-fv és a jó becslés kritériumai A becslő fv fogalma: A sokasági paraméter becslésére szolgáló, a mintaelemek értékétől függő függvény. pl. a mintaátlag egy becslőfv, mert értéke a mintaelemek értékétől függ, és ezzel becsüljük a sokasági átlagot. A jó becslés kritériumai Torzítatlanság Hatásosság Konzisztencia

Torzítatlan becslések A mintaátlag a sokasági átlag torzítatlan becslése mintabeli arány a sokasági aránynak torzítatlan becslése Vagy: A minta szórása a sokasági szórás torzított becslése. A minta korrigált szórása már torzítatlan

A jó becslés kritériumai (folyt) Hatásosság: a becslőfüggvény szórása. Minél kisebb a szórása, annál hatásosabb Konzisztencia (az a tulajdonság, hogy egyre nagyobb mintát véve egyre pontosabb becslést kapunk)

BECSLÉS A sokasági várható érték intervallum-becslése A sokasági várható értéket a mintaközéppel becsüljük. Ez így egy torzítatlan pontbecslés, - amely nem fog pontosan egybeesni a sokaság tényleges várható értékével. Meg tudunk azonban adni egy intervallumot, amelybe a sokasági várható érték egy előre adott (pl. 95%-os) valószínűséggel beleesik.

A sokasági átlag intervallumbecslése 95 %-os megbízhatósági szint mellett Ismerjük a mintaátlag eloszlását, és szórását. Tudjuk, hogy Kérdés: mekkora az az intervallum, amelybe a véletlen minta átlaga, ill. annak standardje 95 % valószínűséggel esik? Átrendezve: Rövidebb formában: Tehát 95 % a valószínűsége annak, hogy a sokasági a mintaátlag 1,96 szórásnyi környezetében található.

Az intervallumbecslés általános gondolatmenete Annak a valószínűsége, hogy Átrendezve Tömörebben:

Kifejezések Az (1-a) valószínűség a megbízhatósági szint, vagy konfidencia-szint Az (1-a) valószínűséghez tartozó intervallum a megbízhatósági intervallum vagy konfidencia-intervallum A szorzat a maximális hiba vagy hibahatár.

PÉLDA - Átlagbecslési alapfeladat A főiskolások sokaságából 100 fős, azonos eloszlású véletlen mintát vettünk. A mintaátlag 178 cm-nek adódott. A sokaságról tudjuk, hogy normál eloszlású, 15 cm-es szórással, nem ismerjük viszont a sokasági átlagot. Adjon becslést a sokasági átlagra 95%-os megbízhatósági szinten! Hogyan változna az eredmény, ha a megbízhatósági szint csak 90%-os lenne?

További figyelembeveendő problémák Ha nem független a mintavétel. Ha nem ismerjük a sokasági szórást,

A nem független mintavétel esete A standard hiba kisebb lesz, ahol az n /N a kiválasztási arány.

Példa Becslés – nem független mintavétellel Egy 200 fős cég dolgozóiból egyszerű véletlen mintavétellel kiválasztottunk 100 főt, hogy megbecsülhessük a dolgozók átlagbérét. A mintaátlag 82 eFt. A sokaságról tudjuk, hogy normál eloszlású 15 eFt szórással Becsülje meg a cég dolgozóinak átlagbérét, ha a megbízhatósági szint 95%! Hogyan változna az eredmény, ha a vizsgált cég dolgozóinak száma 20 000 fő lenne, de az egyéb adatok változatlanok maradnának? Megoldás

Ha a sokasági szórás nem ismert Ha nem ismerjük a sokasági szórást, akkor a mintából becsüljük. A korrigált mintaszórással számolunk: és (n -1) szabadságfokú t-eloszlással

A Student (t) eloszlás használata Mikor? Ha az alapsokaság szórása, nem ismert. kis minta (n<30) esetén kötelező, nagy minta (n>30; az n=100 már nagy minta!) esetén a standard normális eloszlás z- je is használható Miért? mert a mintátlag standardje nem a standard normál eloszlást követi, hanem a nagyobb szórású t-eloszlást. A mintából becsült szórás használata esetén a becslés bizonytalanabb.

A Student (t) eloszlás ábrája különböző mintanagyságok mellett

PÉLDA (Becslés, – a sokasági szórás nem ismert) Egy 5 ezer fős egyetemen 9 fős egyszerű véletlen minta alapján szeretnénk becslést adni a matematika vizsgára fordított tanulási időre. A normáleloszlás feltételezhető. A mintaátlag 16 óra. A minta korrigált szórása 4 óra. Adjunk becslést az egyetemi készülési átlagra 95%-os megbízhatósági szint mellett! Hogyan változna az eredmény, ha 100 fős mintára vonatkozna a fenti átlag és korrigált szórás?

Értékösszeg-becslés esetén Megszorozzuk N-nel a mintából becsült átlagot és a D maximális hibát (hibahatárt) Egyébként minden ugyanúgy megy, mint az átlag-becslésnél.

PÉLDA (Értékösszeg becslése) Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 ft. Mennyi a mintaátlag standard hibája? Becsülje meg 95%-os valószínűséggel, hogy mennyi az egy hallgatóra jutó színházjegy vásárlás értéke a vizsgált főiskolán! Mennyi a főiskolások által szinházjegyre költött teljes összeg maximális értéke? (A megbízhatósági szint továbbra is 95%)

Az átlagbecslés lépései (Áttekintés) 1. A becslőfv az 2. A becslőfv eloszlása: normális vagy Student t? Ismert-e a sokasági szórás? Ha nem: a minta nagy vagy kicsi? 3. A standard hiba kiszámítása Ha a minta visszatevés nélküli, 0,05 alatt van-e az (n/N) arány? Független-e (visszatevéses-e) a minta? 4. A konf. intervallum kiszámítása Adott konfidenciaszinthez tartozó z vagy t meghatározása (táblázatból v. szám.géppel) 5. Az eredmény értelmezése

Minta-nagyság meghatározása EV mintánál Visszatevéses eset: Visszatevés nélküli eset:

PÉLDA (Folyt) Értékösszeg becslése, mintanagyság meghatározása Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 Ft. KÉRDÉS: Ha az - átlagra vonatkozó – becslés hibahatárát 80 forint alá szeretnénk szorítani, mekkora mintára lenne szükségünk?

Köszönöm a figyelmüket!

HIVATK. Ez itt egy hivatkozás a 22-ik diához Vissza