Mintavételes eljárások 2. hét Mintavételes eljárások
Adatszerzési módok típusai
Kontrollált kísérletek A végtelen sokaságról való informálódás eszköze. Arra ad választ, hogy a kísérlet végzője által megtervezett feltétel együttesek (kezelések) milyen eredményre vezetnek.
Reprezentatív megfigyelés A legfontosabb adatfelvételi módszer. A statisztikai következtetéselmélet kiindulópontja. A mintavételből származó minden eredményt a sokaság egészének jellemzésére használják fel, azaz általánosítanak a teljes sokaságra. Reprezentatív a minta, ha tükrözi az alapsokaságot, annak jellemzőit, tulajdonságait, összetételét. Mindig megadható a mintavételi hiba, azaz, hogy a mintavétel tényéből mekkora hiba fakad.
Nem reprezentatív megfigyelés (egyéb részleges megfigyelés) Nincs benne az általánosításra való törekvés, a következtetések kizárólag megfigyelt egyedekre vonatkoznak.
A statisztikai következtetéselmélet Célja: a részleges megfigyelések eredményeiből következtetés a sokaságra. Területei: A mintavétel módszertana és gyakorlata. A becslési eljárás. Hipotézisvizsgálat. Több változó kapcsolatának, együttmozgásának vizsgálata.
A mintavétel Célja: a megszerzett adatok alapján megalapozott következtetéseket hozni az alapsokaságra vonatkozóan. Lépései: A minta és a mintavétel megtervezése, mintaelemek kijelölése. A kijelölt mintaelemek megfigyelése. A mintavételi hiba kezelésének megtervezése.
A mintavételi hiba A vizsgált mutató lehetséges mintákból számított értékeinek átlagos eltérését mutatja a megfelelő sokasági értéktől. Típusai: Nemmintavételi hiba Mintavételi hiba A mintavételi hiba függ: A sokaság jellegétől. Az alkalmazott mintavételi eljárástól. A vizsgált mutatószám fajtájától. A minta nagyságától.
Véletlenen alapuló kiválasztás
I. FAE - független, azonos eloszlású minta Jellemzői: Homogén, végtelen sokaságból veszünk véletlen, visszatevéses vagy visszatevés nélküli mintát. Véges sokaságból azonos valószínűséggel veszünk visszatevéses mintát. Gyakorlati alkalmazása elsősorban a tömegtermelés minőségellenőrzésénél célszerű. Hibája: A sokasági szórás gyakran ismeretlen. Sokszor több változó vizsgálata a cél – a mintaelemszám meghatározása problémás.
II. EV - egyszerű véletlen minta Homogén és véges elemszámú sokaság esetén alkalmazható. A mintát visszatevés nélkül választjuk ki. Minden lehetséges n elemű minta kiválasztásának a valószínűsége azonos. Hasonló a FAE mintához, de véges és kisebb elemszámú sokaságok esetén inkább ez használatos.
EV - egyszerű véletlen minta Előnye: A visszatevés a gyakorlatban nem mindig, vagy nem teljeskörűen hajtható végre. Azonos elem ismételt megfigyelése felesleges. Hátránya: A megfigyelt sokaságok többnyire nem homogének. Lépései: A komplett lista összeállítása. A mintanagyság meghatározása. A minta kiválasztása.
III. R - rétegzett mintavétel Jellemzői: Heterogén sokaság esetén alkalmazható. Előzetes információ áll rendelkezésre arra nézve, hogy a sokaságot homogén osztályokba lehet sorolni. Lépései: Először a fősokaságot valamilyen ismérv szerint átfedés-mentesen homogén rétegekre osztjuk. Ezután az egyes rétegeken belül egymástól függetlenül EV (ritkábban FAE) mintát veszünk. Előnye: Azonos mintanagyság esetén a vizsgált jellemzőkre (, ) kisebb hibát kapunk, mint az EV mintavétellel feltéve, hogy a rétegezés jó volt. TÍPUSAI
1. Egyenletes rétegzés Jellemző: Minden egyes rétegbe azonos számú mintaelem kerül. Előnye: Egyszerű. Végrehajtása kényelmes. Könnyű az egyes rétegeket számszerűen jellemezni. N1≠N2, de n1= n2
2. Arányos rétegzés Jellemző: A mintába a sokasági arányoknak megfelelően választjuk meg az elemszámot. Előnye: Ha a rétegenkénti sokasági szórást nem ismerjük, az ebből számított mutatók mintavételi hibája minimális. A mintából számított főátlag hibája sohasem nagyobb, mint EV mintavételnél. .
3. Neyman-féle optimális rétegzés Jellemzői: A szórások alapján osztja a mintát. Nagyobb rétegekből nagyobb mintát vesz. A változékonyabb, heterogénebb rétegekből szintén nagyobb mintát vesz. Előnye: Főátlag becslése során a mintavételi hiba minimális. Hátránya: σj ritkán ismert.
4. Költség-optimális rétegzés Jellemzői: Az egyes rétegek szórása mellett ismerjük és a kiválasztásnál figyelembe vesszük az egyes rétegek megfigyelésének költségét is. Adott költségkeret mellett minimális hibát eredményez. Képlete: ahol πj az egyes rétegek elemeinek megfigyelési egységköltsége.
IV. CS - csoportos (egylépcsős) mintavétel Homogén, véges sokaság esetén használható, ha nem áll rendelkezésre a sokasági elemek teljes listája, de nagyobb csoportokra rendelkezünk listával. a csoportok a koncentráltságuk miatt könnyebben, olcsóbban figyelhetők meg, mint az egyedek. Lépései: Először a csoportok halmazából EV mintát veszünk. Az így kiválasztott csoportokat teljes körűen megfigyeljük. Előnye: Egyszerűbb és olcsóbb, mint a FAE vagy az EV minta. Hátránya: Pontossága függ a csoporton belüli homogenitástól.
V. TL - többlépcsős mintavétel Jellemzői: Hasonló esetekben használjuk, mint a csoportos mintavételt. Több lépcsőben jutunk el a végső megfigyelési egységhez. Leggyakoribb típusa a kétlépcsős mintavétel: először EV mintavétellel kiválasztjuk a csoportokat, majd a csoporton belül is EV mintavételt végzünk. Követelmény: A minta önsúlyozó legyen, azaz megtartsa a sokasági arányokat.
Nem véletlen mintavételi eljárások
1. Szisztematikus kiválasztás Jellemzői: ha n elemű mintát akarunk venni egy N elemű sokaságból, akkor meghatározva a k=N/n lépésközt a k0 véletlen kezdőpontból kiindulva minden k-adik elemet figyeljük meg: A minta gyorsan és mechanikusan kiválasztható. Egybeeshet az EV megfigyeléssel, ha az elemek felsorolása független a megfigyelés tárgyától.
2. Kvótás kiválasztás Jellemzői: Rögzítve van, hogy milyen összetételű mintát kell létrehozni. A „kereteket” véletlen kiválasztással kitöltik. A rétegzett mintavételhez hasonló eredmény hoz. Nem szükséges előre rögzíteni a sokasági vagy réteglistákat.
3. Koncentrált kiválasztás Jellemzői: Erősen koncentrált sokaság esetén alkalmazzák. Kevés egyed rendelkezik nagy befolyással a sokasági jellemzőre.
4. Hólabda kiválasztás Jellemzői: Ritka, nehezen számba vehető sokaságok esetén alkalmazzuk. Néhány kiválasztott egyedből indulunk ki. Minden egyed a saját „ismeretségi köréből” keresi a következő mintaelemet.
5. Önkényes, szubjektív kiválasztás Jellemzői: Szubjektív szempontok alapján történik a minta kiválasztása. Széleskörű ismeretek esetén jó jellemzőkkel rendelkező mintát lehet kapni.
Ismételt vagy másodlagos mintavételi eljárások jellemzői Speciális csoport a gyakorlatban alkalmazott mintavételi módok között. Elvi alapja az a felismerés, hogy a tényleges mintavétel igen költséges, míg a számítógép használata egyre olcsóbb! → a meglévő kisebb és olcsóbb mintákat számítógépes módszerekkel megtöbbszörözik. A meglévő mintából újabb mintákat képeznek azért, hogy a mintában lévő információkat jobban kihasználják.
Ismételt vagy másodlagos mintavételi eljárások típusai 1.) Független részminták módszere 2.) Kiegyensúlyozott ismétlések 3.) Jackknife módszer 4.) Bootstrap módszer
KÖSZÖNÖM A FIGYELMET!