BECSLÉS A sokasági átlag becslése KÖVETKEZTETŐ STATISZTIKA MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 tavasz Utoljára módosítva: 2010.02.17
A becslés alapfeladata Pl. Hányan láttak egy TV műsort? Jellemzően kétféle választ lehet adni: Pontbecslés Pl. „A minta alapján a sokasági nézettségi arány 32 %”. Vesznek egy mintát, azaz, megkérdeznek 1300 embert, és ebből következtetnek, hogy a teljes sokaság hányadrésze látta a műsort. Intervallumbecslés: „A nézettségi arány 95% valószínűséggel 29 és 35 % közé esik.”
Sokaság és minta A mintavétel módja lehet: véletlen és nem véletlen A véletlen kiválasztás. Ismerjük a sokaság elemeinek mintába kerülési valószínűségét. A vél. minta fontos jellemzője: a reprezentativitás. Egyszerű véletlen mintavétel Visszatevéssel Visszatevés nélkül Rétegzett minta Csoportos és többlépcsős minta
A nem-véletlen kiválasztás Szisztematikus mintavétel (PL. a kijáratnál minden 10-ik vevő megkérdezése) Kvóta szerinti minta Koncentrált minta Önkényes minta
A mintaátlag eloszlása Alapkérdések: Tekinthető-e, ill. mikor tekinthető a mintaátlag eloszlása normális eloszlásúnak? A mintaátlag várható értéke és a sokasági átlag közötti összefüggés A mintaátlag szórása és a sokasági szórás közötti összefüggés
A mintaátlag eloszlása A mintaátlag valószínűségi változó (mintáról mintára változik), amelynek van eloszlása, várható értéke, szórása. A mintaátlag normális eloszlású, Ha a sokaság normális eloszlású Vagy: ha a minta elég nagy. (n > 30; pl. 100 elem) Ha a sokaság eloszlása nem ismert és a minta kicsi (30 elem alatti), akkor a mintaátlag eloszlása sem ismert. (Ekkor további megfontolásokra van szükség.)
A mintaátlag eloszlásának paraméterei Ha a minta véletlen (a sokaság eloszlásától függetlenül, akár visszatevéses a mintavétel akár nem) akkor, (A mintaátlag várható értéke a sokasági átlag) A mintaátlagok szórása, (standard hiba) Visszatevéses mintánál: Visszatevés nélküli mintánál: Ahol n / N a kiválasztási arány
PÉLDA sokaság és a minta közötti összefüggésre Vegyünk egy 5 elemű sokaságot. A sokaság elemei legyenek: (2, 3, 4, 5, 6). N =5 Írjuk össze az összes lehetséges 2 elemű mintát! n = 2 (minden húzás után visszatesszük a kihúzott elemet.) Ellenőrizzük, hogy A mintaátlagok várható értéke (átlaga) megyegyezik a sokasági átlaggal! A mintaátlag varianciája a sokasági variancia n-ed része! Végezzük el visszatevés nélküli mintára is! Hogyan módosul ekkor a mintátlag varianciája?
Megoldás 1. (Visszatevéses minta esetén) A sokasági átlag: A sokasági szórásnégyzet ill. szórás: A minta átlaga 2 3 2,5 4 5 3,5 A mintaátlagok átlaga: A mintaátlagok szórásnégyzete: Következtetés:
Megoldás 2. (Visszatevés nélküli minta esetén) A sokasági átlag: 4 A sokasági szórásnégyzet: 2 ill. szórás: A minta átlaga 2 3 2,5 4 5 3,5 6 4,5 A mintaátlagok átlaga: 4 A mintaátlagok szórásnégyzete = Következtetés:
A becslő-fv és a jó becslés kritériumai A becslő fv fogalma: A sokasági paraméter becslésére szolgáló, a mintaelemek értékétől függő függvény. pl. a mintaátlag egy becslőfv, mert értéke a mintaelemek értékétől függ, és ezzel becsüljük a sokasági átlagot. A jó becslés kritériumai Torzítatlanság Hatásosság Konzisztencia
Torzítatlan becslések A mintaátlag a sokasági átlag torzítatlan becslése mintabeli arány a sokasági aránynak torzítatlan becslése Vagy: A minta szórása a sokasági szórás torzított becslése. A minta korrigált szórása már torzítatlan
A jó becslés kritériumai (folyt) Hatásosság: a becslőfüggvény szórása. Minél kisebb a szórása, annál hatásosabb Konzisztencia (az a tulajdonság, hogy egyre nagyobb mintát véve egyre pontosabb becslést kapunk)
BECSLÉS A sokasági várható érték intervallum-becslése A sokasági várható értéket a mintaközéppel becsüljük. Ez így egy torzítatlan pontbecslés, - amely nem fog pontosan egybeesni a sokaság tényleges várható értékével. Meg tudunk azonban adni egy intervallumot, amelybe a sokasági várható érték egy előre adott (pl. 95%-os) valószínűséggel beleesik.
A sokasági átlag intervallumbecslése 95 %-os megbízhatósági szint mellett Ismerjük a mintaátlag eloszlását, és szórását. Tudjuk, hogy Kérdés: mekkora az az intervallum, amelybe a véletlen minta átlaga, ill. annak standardje 95 % valószínűséggel esik? Átrendezve: Rövidebb formában: Tehát 95 % a valószínűsége annak, hogy a sokasági a mintaátlag 1,96 szórásnyi környezetében található.
Az intervallumbecslés általános gondolatmenete Annak a valószínűsége, hogy Átrendezve Tömörebben:
Kifejezések Az (1-a) valószínűség a megbízhatósági szint, vagy konfidencia-szint Az (1-a) valószínűséghez tartozó intervallum a megbízhatósági intervallum vagy konfidencia-intervallum A szorzat a maximális hiba vagy hibahatár.
PÉLDA - Átlagbecslési alapfeladat A főiskolások sokaságából 100 fős, azonos eloszlású véletlen mintát vettünk. A mintaátlag 178 cm-nek adódott. A sokaságról tudjuk, hogy normál eloszlású, 15 cm-es szórással, nem ismerjük viszont a sokasági átlagot. Adjon becslést a sokasági átlagra 95%-os megbízhatósági szinten! Hogyan változna az eredmény, ha a megbízhatósági szint csak 90%-os lenne?
További figyelembeveendő problémák Ha nem független a mintavétel. Ha nem ismerjük a sokasági szórást,
A nem független mintavétel esete A standard hiba kisebb lesz, ahol az n /N a kiválasztási arány.
Példa Becslés – nem független mintavétellel Egy 200 fős cég dolgozóiból egyszerű véletlen mintavétellel kiválasztottunk 100 főt, hogy megbecsülhessük a dolgozók átlagbérét. A mintaátlag 82 eFt. A sokaságról tudjuk, hogy normál eloszlású 15 eFt szórással Becsülje meg a cég dolgozóinak átlagbérét, ha a megbízhatósági szint 95%! Hogyan változna az eredmény, ha a vizsgált cég dolgozóinak száma 20 000 fő lenne, de az egyéb adatok változatlanok maradnának? Megoldás
Ha a sokasági szórás nem ismert Ha nem ismerjük a sokasági szórást, akkor a mintából becsüljük. A korrigált mintaszórással számolunk: és (n -1) szabadságfokú t-eloszlással
A Student (t) eloszlás használata Mikor? Ha az alapsokaság szórása, nem ismert. kis minta (n<30) esetén kötelező, nagy minta (n>30; az n=100 már nagy minta!) esetén a standard normális eloszlás z- je is használható Miért? mert a mintátlag standardje nem a standard normál eloszlást követi, hanem a nagyobb szórású t-eloszlást. A mintából becsült szórás használata esetén a becslés bizonytalanabb.
A Student (t) eloszlás ábrája különböző mintanagyságok mellett
PÉLDA (Becslés, – a sokasági szórás nem ismert) Egy 5 ezer fős egyetemen 9 fős egyszerű véletlen minta alapján szeretnénk becslést adni a matematika vizsgára fordított tanulási időre. A normáleloszlás feltételezhető. A mintaátlag 16 óra. A minta korrigált szórása 4 óra. Adjunk becslést az egyetemi készülési átlagra 95%-os megbízhatósági szint mellett! Hogyan változna az eredmény, ha 100 fős mintára vonatkozna a fenti átlag és korrigált szórás?
Értékösszeg-becslés esetén Megszorozzuk N-nel a mintából becsült átlagot és a D maximális hibát (hibahatárt) Egyébként minden ugyanúgy megy, mint az átlag-becslésnél.
PÉLDA (Értékösszeg becslése) Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 ft. Mennyi a mintaátlag standard hibája? Becsülje meg 95%-os valószínűséggel, hogy mennyi az egy hallgatóra jutó színházjegy vásárlás értéke a vizsgált főiskolán! Mennyi a főiskolások által szinházjegyre költött teljes összeg maximális értéke? (A megbízhatósági szint továbbra is 95%)
Az átlagbecslés lépései (Áttekintés) 1. A becslőfv az 2. A becslőfv eloszlása: normális vagy Student t? Ismert-e a sokasági szórás? Ha nem: a minta nagy vagy kicsi? 3. A standard hiba kiszámítása Ha a minta visszatevés nélküli, 0,05 alatt van-e az (n/N) arány? Független-e (visszatevéses-e) a minta? 4. A konf. intervallum kiszámítása Adott konfidenciaszinthez tartozó z vagy t meghatározása (táblázatból v. szám.géppel) 5. Az eredmény értelmezése
Minta-nagyság meghatározása EV mintánál Visszatevéses eset: Visszatevés nélküli eset:
PÉLDA (Folyt) Értékösszeg becslése, mintanagyság meghatározása Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 Ft. KÉRDÉS: Ha az - átlagra vonatkozó – becslés hibahatárát 80 forint alá szeretnénk szorítani, mekkora mintára lenne szükségünk?
Köszönöm a figyelmüket!
HIVATK. Ez itt egy hivatkozás a 22-ik diához Vissza