Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
Gazdaságelemzési és Statisztikai Tanszék
STATISZTIKA I. 12. Előadás Dr. Balogh Péter docens Gazdaságelemzési és Statisztikai Tanszék
2
MINTAVÉTEL II.
3
Alapfogalmak Véletlen kiválasztás
olyan mintakiválasztás, ahol az egyes sokasági elemek előre meghatározott valószínűséggel kerülnek be a mintába Véletlen számok táblázata, Számítógép véletlenszám- generátora (pszeudo-véletlen számok) általában egyenletes eloszlású az eredmény, de választható más eloszlás is (normál, lognormál, exponenciális)
4
Alapfogalmak Véletlen minta valószínűségi mintának is nevezhető Minta
a sokaság megfigyelt része, melyet azért választunk ki, hogy belőle a sokaság tulajdonságaira következtessünk
5
Alapfogalmak nagy elemszámú minta > 30; de lehet több száz is
A minta nagysága „n” ( a mintában lévő elemek száma). n = 1-N-ig „N” az alapsokaság elem száma, Egymástól független minták száma (eloszlás szimmetriája számít) nagy elemszámú minta > 30; de lehet több száz is kis elemszámú minta < 30 kiválasztási arány a minta a sokaságnak mekkora részét öleli fel néhány ezrelék – 25 %
6
A mintajellemzők tulajdonságai
visszatevéses mintavétel (ismétléses), visszatevés nélküli mintavétel (ismétlés nélküli), Mintavételi eloszlás valamely, mintából számított mutatónak a különböző mintákon mért értékeinek eloszlása Mintavételi szórás (Standard hiba) FAE minta esetén a mintaátlag standard hibája:
7
A mintajellemzők tulajdonságai
Központi határeloszlás tétel Kimondja, hogy elég általános (gyakran teljesülő) feltételek fennállása esetén nagy minták átlaga függetlenül attól, hogy milyen volt a mintavétel alapjául szolgáló eloszlás; közelítőleg normális eloszlást követ
8
A dedukciótól az indukcióig
Sokaságból minta (N n) Éppen aktuális minta lehet véletlen vagy nem véletlen Véletlen minta jellemezhető, tulajdonságai levezethetők: Dedukció a statisztikai következtetés egyik fajtája: ismert tulajdonságú sokaságból következtetünk a belőle választott minták jellemzőire
9
A dedukciótól az indukcióig
a statisztikai következtetés egyik fajtája: a megfigyelt minta alapján következtetünk a sokaság jellemzőire. (eszköze a statisztikai becslés és a hipotézisvizsgálat) Statisztikai becslés az alapsokaságból vett minta alapján az alapsokaságot alkotó valószínűségi változók eloszlásának, jellemzőinek, paramétereinek becslése. Hipotézisvizsgálat az alapsokaságból vett minta alapján eldönti, hogy a sokaságra vonatkozó állítások statisztikai értelemben elfogadhatók-e.
10
A dedukciótól az indukcióig
Ha feltételezzük, hogy véletlen a minta, ismerjük a minta valószínűségi tulajdonságait. A mintaelem egy valószínűségi változó. A mintaelemek függvényei is azok. Ezen változók tulajdonságai levezethetők.
13
A dedukciótól az indukcióig
Lista az egész sokaság áttekintését biztosítja tényleges vagy átvitt értelemben Célsokaság az a sokaság, amelyre vizsgálatunk irányul Keretsokaság a célsokaságot többé kevésbé lefedő sokaság, amelyet meg lehet figyelni (egyszerűbb, olcsóbb) pl. lakótelep - lakóházak
14
A dedukciótól az indukcióig
Homogenitás Heterogenitás a priori (mintavétel előtt) -jövedelem Segédváltozók törzs vastagság – termés nagysága Pontossági követelmény kutató választja meg vagy külső adottság Felvételi költségadatok egységköltségek, költségfüggvények, költségkeret
15
Mintavétel típusai Véletlen minták Elemi szintű minták, LISTA
FAE EV R Egylépcsős (1L) Többlépcsős (TL) Elemi szintű minták, LISTA Csoportos minták
16
Mintavétel típusai Nem véletlen minták (Szisztematikus) Kvóta
Koncentrált Hólabda Önkényes (szubjektív)
17
Véletlen mintavételi tervek
Elemi szintű mintavétel – Csoportos mintavétel -a mintavétel közvetlenül azokra az elemekre irányul, amelyeket a későbbiekben megfigyelünk -elsődleges, másodlagos, … , végső egységek Független, azonos eloszlású (FAE) minta független, azonos eloszlású elemekből álló minta. Véges sokaságból, azonos valószínűségű, visszatevéses kiválasztással vagy végtelen sokaságból azonos valószínűségű kiválasztással nyert minta - tömegtermelés minőségellenőrzésekor (csavargyártó automata)
18
Véletlen mintavételi tervek
Mintanagyság meghatározása Sokasági szórásnégyzet Mintavételi szórásnégyzet
19
Véletlen mintavételi tervek
Egyszerű véletlen (EV) minta Véges sokaságból azonos kiválasztási valószínűséggel, visszatevés nélkül választott minta Komplett lista szükséges Minta nagyságot befolyásolja: Pontossági követelmények, sokaság szóródása, költségkeret Kiválasztás tervezett véletlen módon véletlenszám táblázat, számítógép Szisztematikus kiválasztás alkalmazása (n, N, k) hallgatók ABC sorrendje (sztochasztikus összefüggés hiánya esetén)
20
Véletlen mintavételi tervek
Rétegzett minta mintán kívüli információk alapján a vizsgált jellemző szerint viszonylag homogén részsokaságokból (rétegekből) kiválasztott minta a heterogén alapsokaságot rétegekre bontjuk, és ezekből külön – külön történik a mintavétel (vállalkozói, alkalmazotti jövedelem viszonyok vizsgálatakor) Mintaelosztás (allokáció) annak meghatározása, hogy rétegzett mintavétel esetén a teljes minta mekkora részei kerülnek az egyes rétegekbe
21
Véletlen mintavételi tervek
Egyenletes elosztás minden rétegbe azonos számú mintaelem kerül
22
Véletlen mintavételi tervek
Arányos elosztás (önsúlyozó minta) (6_3 példa) a sokasági arányoknak megfelelő mintavétel
23
Véletlen mintavételi tervek
Neyman (optimális) elosztás (6_4 példa) olyan mintaelosztás, amelyiknél az egyes rétegekbe a rétegek sokasági nagyságával és szórásával arányosan kerülnek mintaelemek. Ez az elosztás minimalizálja az átlagbecslés standard hibáját, ezért optimális elosztásnak is nevezik
24
Véletlen mintavételi tervek
Csoportos minta olyan minta, ahol a mintaelemeket mintavétel előtt részsokaságokba (csoportokba) sorolják, majd a mintavétel első lépcsőjét a csoportok szintjén hajtják végre csak akkor alkalmazzuk, ha nem ismerjük az alapsokaság minden egységét (pl. árbecslés, homogén sokaság esetén),
25
Véletlen mintavételi tervek
Egylépcsős minta olyan csoportos, ahol a mintába került csoportok valamennyi elemét megfigyelik Többlépcsős minta olyan csoportos minta, ahol a mintába került csoportok képzésével kettő vagy több lépésben jutnak el a megfigyelési egységekhez
26
Nemvéletlen mintavételi eljárások
Literary Digest (LD) közvéleménykutatása Gallup Intézet Szisztematikus kiválasztás a sokasági elemeket valamilyen (például alfabetikus) sorrendbe rakva, egymástól egyenlő távolságban lévő elemek kiválasztása
27
Nemvéletlen mintavételi eljárások
Kvótás kiválasztás olyan kiválasztási mód, ahol a fontosabb ismérvek szerinti sokasági arányok betartásával választanak véletlen vagy nemvéletlen mintát. A kiválasztás módja jellemzően a felvételt végző kérdező biztos feladata közvélemény kutatás, háztartási statisztikai felmérések, az alapsokaságot körzetekre bontják és ezen belül arányokat, kvótákat határoznak meg
28
Nemvéletlen mintavételi eljárások
Koncentrált kiválasztás a nemvéletlen kiválasztás gyakori módja: a gyakrabban előforduló elemek sokasági arányuknál nagyobb súlyt kapnak a kiválasztás során (árstatisztikai megfigyeléseknél, a legjellemzőbb típusok kerülnek a mintába) Hólabda kiválasztás ritka és nehezen számba vehető sokaság esetén; néhány ismert elemből indulnak ki
29
Nemvéletlen mintavételi eljárások
Önkényes kiválasztás szubjektív alapon a tipikusnak vélt elemeket vonják be a mintába termésbecslés esetén (nagy szakértelem szükséges)
30
Kombinált és mesterséges minták
Előzetes mintavétel Szekvenciális mintavétel Folytatólagos mintavétel Panelfelvétel olyan mintavétel, amely során egymást követő két vagy több időszakon keresztül a minta teljes mértékben vagy nagy részben állandó. Ennek következtében azonos elemek időbeli alakulására is információkat szolgáltat Teljes körű felvétel és a mintavétel összekapcsolása
31
Nemválaszolások a mintában
Adathiány Nemválaszolás a teljes körű vagy mintavételes felvétel kijelölt eleme bármely oknál fogva nem szolgáltat információt (nem válaszol a feltett kérdésekre) I. csoportosítás: Lefedési hiba Nem tartózkodik otthon Nem képes válaszolni Megtagadja a választ II. csoportosítás: Teljes nemválaszolás Részleges nemválaszolás
32
Nemválaszolások a mintában
Imputálás a felvétel során hiányzó adatok mesterséges pótlása Ha csak 1-1 válasz hiányzik: Deduktív imputáció Főátlag imputálás Részátlag imputálás Ha a teljes elem hiányzik: Belső módszer (hot-deck): Véletlen imputáció Szekvenciális imputáció Külső módszer(cold-deck): Regressziós becslés Többszörös imputáció
33
Nemválaszolások a mintában
Átsúlyozás az adatfelvétel meghiúsulásából adódó torzításokat ellensúlyozó módszer. Lényege az, hogy a megvalósult minta olyan súlyokat kapjon, amelyek biztosítják az arra épülő becslések torzítatlanságát
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.