Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Dr. Balogh Péter docens Gazdaságelemzési és Statisztikai Tanszék STATISZTIKA I. 12. Előadás.

Hasonló előadás


Az előadások a következő témára: "Dr. Balogh Péter docens Gazdaságelemzési és Statisztikai Tanszék STATISZTIKA I. 12. Előadás."— Előadás másolata:

1 Dr. Balogh Péter docens Gazdaságelemzési és Statisztikai Tanszék STATISZTIKA I. 12. Előadás

2 MINTAVÉTEL II.

3 Alapfogalmak  Véletlen kiválasztás olyan mintakiválasztás, ahol az egyes sokasági elemek előre meghatározott valószínűséggel kerülnek be a mintába Véletlen számok táblázata, Számítógép véletlenszám- generátora (pszeudo-véletlen számok) általában egyenletes eloszlású az eredmény, de választható más eloszlás is (normál, lognormál, exponenciális)

4 Alapfogalmak  Véletlen minta valószínűségi mintának is nevezhető  Minta a sokaság megfigyelt része, melyet azért választunk ki, hogy belőle a sokaság tulajdonságaira következtessünk

5 Alapfogalmak  A minta nagysága „n” ( a mintában lévő elemek száma).  n = 1-N-ig„N”az alapsokaság elem száma,  Egymástól független minták száma (eloszlás szimmetriája számít) nagy elemszámú minta > 30; de lehet több száz is kis elemszámú minta < 30 kiválasztási arány a minta a sokaságnak mekkora részét öleli fel néhány ezrelék 15 – 25 %

6 A mintajellemzők tulajdonságai  visszatevéses mintavétel (ismétléses),  visszatevés nélküli mintavétel (ismétlés nélküli),  Mintavételi eloszlás valamely, mintából számított mutatónak a különböző mintákon mért értékeinek eloszlása  Mintavételi szórás (Standard hiba) FAE minta esetén a mintaátlag standard hibája:

7  Központi határeloszlás tétel Kimondja, hogy elég általános (gyakran teljesülő) feltételek fennállása esetén nagy minták átlaga függetlenül attól, hogy milyen volt a mintavétel alapjául szolgáló eloszlás; közelítőleg normális eloszlást követ A mintajellemzők tulajdonságai

8 A dedukciótól az indukcióig Sokaságból minta (N n) Éppen aktuális minta lehet véletlen vagy nem véletlen Véletlen minta jellemezhető, tulajdonságai levezethetők:  Dedukció a statisztikai következtetés egyik fajtája: ismert tulajdonságú sokaságból következtetünk a belőle választott minták jellemzőire

9  Indukció a statisztikai következtetés egyik fajtája: a megfigyelt minta alapján következtetünk a sokaság jellemzőire. (eszköze a statisztikai becslés és a hipotézisvizsgálat) Statisztikai becslés az alapsokaságból vett minta alapján az alapsokaságot alkotó valószínűségi változók eloszlásának, jellemzőinek, paramétereinek becslése. Hipotézisvizsgálat az alapsokaságból vett minta alapján eldönti, hogy a sokaságra vonatkozó állítások statisztikai értelemben elfogadhatók-e. A dedukciótól az indukcióig

10 Ha feltételezzük, hogy véletlen a minta, ismerjük a minta valószínűségi tulajdonságait. A mintaelem egy valószínűségi változó. A mintaelemek függvényei is azok. Ezen változók tulajdonságai levezethetők. A dedukciótól az indukcióig

11

12

13 Lista az egész sokaság áttekintését biztosítja tényleges vagy átvitt értelemben Célsokaság az a sokaság, amelyre vizsgálatunk irányul Keretsokaság a célsokaságot többé kevésbé lefedő sokaság, amelyet meg lehet figyelni (egyszerűbb, olcsóbb) pl. lakótelep - lakóházak A dedukciótól az indukcióig

14 Homogenitás Heterogenitás a priori (mintavétel előtt) -jövedelem Segédváltozók törzs vastagság – termés nagysága Pontossági követelmény kutató választja meg vagy külső adottság Felvételi költségadatok egységköltségek, költségfüggvények, költségkeret A dedukciótól az indukcióig

15 Mintavétel típusai Véletlen minták FAE EV R Egylépcsős (1L) Többlépcsős (TL) Elemi szintű minták, LISTA Csoportos minták

16 Mintavétel típusai Nem véletlen minták (Szisztematikus) Kvóta Koncentrált Hólabda Önkényes (szubjektív)

17 Elemi szintű mintavétel – Csoportos mintavétel -a mintavétel közvetlenül azokra az elemekre irányul, amelyeket a későbbiekben megfigyelünk -elsődleges, másodlagos, …, végső egységek Független, azonos eloszlású (FAE) minta független, azonos eloszlású elemekből álló minta. Véges sokaságból, azonos valószínűségű, visszatevéses kiválasztással vagy végtelen sokaságból azonos valószínűségű kiválasztással nyert minta - tömegtermelés minőségellenőrzésekor (csavargyártó automata) Véletlen mintavételi tervek

18 Mintanagyság meghatározása Véletlen mintavételi tervek Sokasági szórásnégyzet Mintavételi szórásnégyzet

19 Egyszerű véletlen (EV) minta Véges sokaságból azonos kiválasztási valószínűséggel, visszatevés nélkül választott minta Komplett lista szükséges Minta nagyságot befolyásolja: Pontossági követelmények, sokaság szóródása, költségkeret Kiválasztás tervezett véletlen módon véletlenszám táblázat, számítógép Szisztematikus kiválasztás alkalmazása (n, N, k) hallgatók ABC sorrendje (sztochasztikus összefüggés hiánya esetén) Véletlen mintavételi tervek

20 Rétegzett minta mintán kívüli információk alapján a vizsgált jellemző szerint viszonylag homogén részsokaságokból (rétegekből) kiválasztott minta a heterogén alapsokaságot rétegekre bontjuk, és ezekből külön – külön történik a mintavétel (vállalkozói, alkalmazotti jövedelem viszonyok vizsgálatakor) Mintaelosztás (allokáció) annak meghatározása, hogy rétegzett mintavétel esetén a teljes minta mekkora részei kerülnek az egyes rétegekbe Véletlen mintavételi tervek

21 Egyenletes elosztás minden rétegbe azonos számú mintaelem kerül Véletlen mintavételi tervek

22 Arányos elosztás (önsúlyozó minta) (6_3 példa) a sokasági arányoknak megfelelő mintavétel Véletlen mintavételi tervek

23 Neyman (optimális) elosztás (6_4 példa) olyan mintaelosztás, amelyiknél az egyes rétegekbe a rétegek sokasági nagyságával és szórásával arányosan kerülnek mintaelemek. Ez az elosztás minimalizálja az átlagbecslés standard hibáját, ezért optimális elosztásnak is nevezik Véletlen mintavételi tervek

24 Csoportos minta olyan minta, ahol a mintaelemeket mintavétel előtt részsokaságokba (csoportokba) sorolják, majd a mintavétel első lépcsőjét a csoportok szintjén hajtják végre csak akkor alkalmazzuk, ha nem ismerjük az alapsokaság minden egységét (pl. árbecslés, homogén sokaság esetén), Véletlen mintavételi tervek

25 Egylépcsős minta olyan csoportos, ahol a mintába került csoportok valamennyi elemét megfigyelik Többlépcsős minta olyan csoportos minta, ahol a mintába került csoportok képzésével kettő vagy több lépésben jutnak el a megfigyelési egységekhez

26 Literary Digest (LD) közvéleménykutatása Gallup Intézet Szisztematikus kiválasztás a sokasági elemeket valamilyen (például alfabetikus) sorrendbe rakva, egymástól egyenlő távolságban lévő elemek kiválasztása Nemvéletlen mintavételi eljárások

27 Kvótás kiválasztás olyan kiválasztási mód, ahol a fontosabb ismérvek szerinti sokasági arányok betartásával választanak véletlen vagy nemvéletlen mintát. A kiválasztás módja jellemzően a felvételt végző kérdező biztos feladata k ö zv é lem é ny kutat á s, h á ztart á si statisztikai felm é r é sek, az alapsokas á got k ö rzetekre bontj á k é s ezen bel ü l ar á nyokat, kv ó t á kat hat á roznak meg Nemvéletlen mintavételi eljárások

28 Koncentrált kiválasztás a nemvéletlen kiválasztás gyakori módja: a gyakrabban előforduló elemek sokasági arányuknál nagyobb súlyt kapnak a kiválasztás során ( á rstatisztikai megfigyel é sekn é l, a legjellemzőbb t í pusok ker ü lnek a mint á ba) Hólabda kiválasztás ritka és nehezen számba vehető sokaság esetén; néhány ismert elemből indulnak ki Nemvéletlen mintavételi eljárások

29 Önkényes kiválasztás szubjektív alapon a tipikusnak vélt elemeket vonják be a mintába termésbecslés esetén (nagy szakértelem szükséges) Nemvéletlen mintavételi eljárások

30 Előzetes mintavétel Szekvenciális mintavétel Folytatólagos mintavétel Panelfelvétel olyan mintavétel, amely során egymást követő két vagy több időszakon keresztül a minta teljes mértékben vagy nagy részben állandó. Ennek következtében azonos elemek időbeli alakulására is információkat szolgáltat Teljes körű felvétel és a mintavétel összekapcsolása Kombinált és mesterséges minták

31 AdathiányNemválaszolás a teljes körű vagy mintavételes felvétel kijelölt eleme bármely oknál fogva nem szolgáltat információt (nem válaszol a feltett kérdésekre) I. csoportosítás: Lefedési hiba Nem tartózkodik otthon Nem képes válaszolni Megtagadja a választ II. csoportosítás: Teljes nemválaszolás Részleges nemválaszolás Nemválaszolások a mintában

32 Imputálás a felvétel során hiányzó adatok mesterséges pótlása Ha csak 1-1 válasz hiányzik: Deduktív imputáció Főátlag imputálás Részátlag imputálás Ha a teljes elem hiányzik: Belső módszer (hot-deck): Véletlen imputáció Szekvenciális imputáció Külső módszer(cold-deck): Regressziós becslés Többszörös imputáció Nemválaszolások a mintában

33 Átsúlyozás az adatfelvétel meghiúsulásából adódó torzításokat ellensúlyozó módszer. Lényege az, hogy a megvalósult minta olyan súlyokat kapjon, amelyek biztosítják az arra épülő becslések torzítatlanságát Nemválaszolások a mintában


Letölteni ppt "Dr. Balogh Péter docens Gazdaságelemzési és Statisztikai Tanszék STATISZTIKA I. 12. Előadás."

Hasonló előadás


Google Hirdetések