Előadó: Prof. Dr. Besenyei Lajos STATISZTIKA VI. MINTAVÉTEL Előadó: Prof. Dr. Besenyei Lajos
A sokaság egy részének kiválasztását mintavételnek, a sokaság így kiválasztott részét mintának nevezzük. Alapkövetelmény: a sokaság helyes definiálása. Mintavételi keret. A statisztikai hibák két nagy csoportja: Nem mintavételi hiba (mérési, kódolási, kérdezési stb.) Mintavételi hiba, nem a teljes sokaságot, hanem annak csak egy részét figyeljük meg.
MINTAVÉTELI MÓDOK Véletlen, valószínűségi Ismert, vagy meghatározható a sokaság elemeinek mintába kerülési esélye. Mintavételi hiba csak itt számítható 1.1. Egyszerű véletlen (EV) 1.2. Rétegzett (R) 1.3. Csoportos (CS) 1.4. Többlépcsős (TL)
2. Nem véletlen 2.1. (EV) Szisztematikus 2.2. Kvótás 2.3. Koncentrált 2.4. Önkényes (szubjektív)
1.1. Egyszerű véletlen kiválasztás (EV) Homogén, véges elemszámú sokaság esetén, visszatevés nélkül, minden lehetséges „n” elemű minta kiválasztásnak azonos esélyt adva. Alkalmazásához komplett lista szükséges. Kiválasztási technika: sorsolás véletlen számok generálása szisztematikus
1.2. Rétegzett minta (R) Heterogén sokaság esetén alkalmazzuk. (A sokaságot homogén részekre bontják, ezeken belül egyszerű véletlen mintavételt hajtanak végre.) Előnye, hogy azonos mintanagyság esetén kisebb mintavételi hibát eredményez, mint a rétegzés nélküli EV mintavétel.
A minta elemszámának elosztása az egyes rétegek között: Egyenletes elosztás: minden rétegbe azonos számú mintaelem kerül Arányos elosztás: a tényleges, sokasági arányoknak megfelelően történik a rétegenkénti elosztás
Neyman-féle optimális elosztás: a rétegenkénti szórásokat vesszük figyelembe. (nagyobb szórású rétegből nagyobb elemszámot veszünk figyelembe) Költségoptimális elosztás a szórások mellett vannak információink (vagy feltételezéseink) az egységek költségeiről is
1.3. Csoportos (CS) minta Nincs (vagy igen költséges) a teljes lista beszerzése, de nagyobb összetartozó egységekre rendelkezésre áll. Csoportos mintavétel esetén a csoportok halmazából EV mintát veszünk, s ezen belül teljeskörű megfigyelést végzünk. (pl. középiskolások szórakozási szokásai: a középiskolák közül véletlenszerűen választunk, a kiválasztottaknál minden tanulót megkérdezünk.)
Elsődleges mintavételi egység: Amire a felvétel közvetlenül irányul. Végső mintavételi egység: Amelyikre nézve következtetéseket kívánunk levonni.
1.4. Többlépcsős mintavétel (TL) A CS mintát tovább bontjuk: a kiválasztott elsődleges egységeken belül további mintavételt hajtunk végre. (Nem kérdezünk meg minden középiskolás diákot a kiválasztott iskoláknál, hanem azoknak csak egy részét)
2.1. Szisztematikus kiválasztás: Hasonlóságot mutat a EV mintavétellel – ha a sorrend véletlenszerű. 2.2. Kvótás kiválasztás: A kérdezőknek tartani kell bizonyos kvótákat. (pl. 30%-a legyen vidéki, 60%-a férfi)
2.2. Koncentrált kiválasztás A sokaság legnagyobb súllyal rendelkező elemeit választják ki. (pl. TOP 200 vállalat megfigyelése) 2.3. Önkényes minta Tipikus esete a szakértői megkérdezés.
Paraméterek becslése, becslési kritériumok Becslés: a sokaság egy paraméterének mintából való közelítése Pontbecslés: egy értékkel való becslés Intervallumbecslés: előre meghatározott megbízhatósággal egy intervallumot ad a sokasági paraméterre. Becslő függvény: a minta alapján végzett becslés, amely függvénye a mintaelemeknek. Sokasági paraméterek: átlag, értékösszeg, szórás, arány
Bemutató példa Tételezzük fel, hogy a teljes sokaság (alapsokaság) 5 tagból áll (N=5) Az értékek: 1,2,3,4,5 Két tagú mintákat veszünk (n=2) Az összes lehetséges minták száma: (ismétlés nélkül) Általában:
Ssz. Lehetséges minta A minták átlaga 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5 2,0 3,0 4,0 -1,5 -1,0 -0,5 0,5 1,0 2,25 1,00 0,25 Σ - 3 7,5
Az alapsokaság átlaga: Az összes lehetséges mintaátlagból: Torzítatlanság: a becslőfüggvény várható értéke megegyezik a becsülni kívánt sokasági jellemzővel. (a mintaátlagok ingadozásának középpontjában a becsülni kívánt sokasági jellemző áll.)
Állapítsuk meg, hogyan szóródnak a mintaátlagok a sokasági tényleges átlag körül. Standard hiba:
Hatásosság: egy becslés annál hatásosabb minél kisebb a szórása (a minta alapján számított átlag annál közelebb van a tényleges értékhez.) Ennek mérése a standard hibával történik. Standard hiba: a véletlen hiba átlagos nagysága. Maximális hiba: az adott valószínűségi szinthez tartozó hiba. (a standard hiba valahányszorosa) A mintaátlagok normális eloszlást követnek.
Az intervallum a normális eloszlási görbe 68%-át fedi le. Az intervallum a görbe alatti terület 95,5 %-át fedi le. (Annak valószínűsége, hogy egy véletlenszerűen kiválasztott minta ebbe a sávba esik, 95,5%, hogy ezen kívül, 4,5%.
A becslés gyakorlati lépései: Véletlen minta kiválasztása. A lehetőségből egyetlen, konkrét mintánk van. A minta átlagának ( )és szórásának ( ) kiszámítása Standard hiba meghatározása (a mintabeli információ alapján)
A maximális hiba meghatározása: (adott valószínűségi szinten) A konfidencia intervallum felírása.