Optimális rétegzés és településrétegzési vizsgálatok a KSH lakossági felvételeiben Fraller Gergely
Mintavételi rétegzés – példa Településrétegzési vizsgálatok – az ok - allokáció Új mintavételi terv
Példa: adott 10000 elemű sokaság – x
Példa (folyt.): X értékösszeg becslése egy 99 elemű rétegzett (rétegszám=3) egyszerű véletlen mintából, arányos allokáció mellett
szórásnégyzet a rétegzés nélküli változat %-ában Példa (folyt.) értékösszegbecslés elméleti szórásnégyzete rétegzés elemszám az szórásnégyzet szórásnégyzet a rétegzés nélküli változat %-ában 1. 2. 3. rétegben nincs rétegzés 10 000 376 817 100 4. 5.
szórásnégyzet a rétegzés nélküli változat %-ában Példa (folyt.) értékösszegbecslés elméleti szórásnégyzete rétegzés elemszám az szórásnégyzet szórásnégyzet a rétegzés nélküli változat %-ában 1. 2. 3. rétegben nincs rétegzés 10 000 376 817 100 egyenlő elemszám 3 333 3 334 129 063 34 4. 5.
szórásnégyzet a rétegzés nélküli változat %-ában Példa (folyt.) értékösszegbecslés elméleti szórásnégyzete rétegzés elemszám az szórásnégyzet szórásnégyzet a rétegzés nélküli változat %-ában 1. 2. 3. rétegben nincs rétegzés 10 000 376 817 100 egyenlő elemszám 3 333 3 334 129 063 34 egyenlő súlyú x-re 5 275 2 974 1 751 93 929 25 4. 5.
szórásnégyzet a rétegzés nélküli változat %-ában Példa (folyt.) értékösszegbecslés elméleti szórásnégyzete rétegzés elemszám az szórásnégyzet szórásnégyzet a rétegzés nélküli változat %-ában 1. 2. 3. rétegben nincs rétegzés 10 000 376 817 100 egyenlő elemszám 3 333 3 334 129 063 34 egyenlő súlyú x-re 5 275 2 974 1 751 93 929 25 4 277 4 603 1 120 85 157 23 4. 5.
szórásnégyzet a rétegzés nélküli változat %-ában Példa (folyt.) értékösszegbecslés elméleti szórásnégyzete rétegzés elemszám az szórásnégyzet szórásnégyzet a rétegzés nélküli változat %-ában 1. 2. 3. rétegben nincs rétegzés 10 000 376 817 100 egyenlő elemszám 3 333 3 334 129 063 34 egyenlő súlyú x-re 5 275 2 974 1 751 93 929 25 4 277 4 603 1 120 85 157 23 4. 5 578 3 599 823 79 908 21 5.
szórásnégyzet a rétegzés nélküli változat %-ában Példa (folyt.) értékösszegbecslés elméleti szórásnégyzete rétegzés elemszám az szórásnégyzet szórásnégyzet a rétegzés nélküli változat %-ában 1. 2. 3. rétegben nincs rétegzés 10 000 376 817 100 egyenlő elemszám 3 333 3 334 129 063 34 egyenlő súlyú x-re 5 275 2 974 1 751 93 929 25 4 277 4 603 1 120 85 157 23 4. 5 578 3 599 823 79 908 21 5. 5 529 3 642 829 79 921
szórásnégyzet a rétegzés nélküli változat %-ában Példa (folyt.) értékösszegbecslés elméleti szórásnégyzete rétegzés elemszám az szórásnégyzet szórásnégyzet a rétegzés nélküli változat %-ában 1. 2. 3. rétegben nincs rétegzés 10 000 376 817 100 egyenlő elemszám 3 333 3 334 129 063 34 egyenlő súlyú x-re 5 275 2 974 1 751 93 929 25 kumulatív √f szabály 4 277 4 603 1 120 85 157 23 4. Sethi algoritmusa 5 578 3 599 823 79 908 21 5. A1-A4 algoritmus 5 529 3 642 829 79 921
Léteznek optimális rétegzési eljárások
Optimális rétegzés- egyszerű véletlen kiválasztás Számos eredmény már az ’50-es években Sethi: táblázatban optimális réteghatárok Normális és Khi-négyzet eloszlásokra különböző allokációkra különböző rétegszám mellett egyszerű algoritmusok
Optimális rétegzés- pps kiválasztás A1-A4 algoritmus (a kanadai gyakorlatból) Arányos allokáció optimális rétegzés Több változó bevonása lehetséges! A hatékonyság mérőszáma: rétegzési index (0-100) ennyi %-kal csökken az összegbecslés szórásnégyzete
Példa (folyt.) értékösszegbecslés elméleti szórásnégyzete és a rétegzési index rétegzés elemszám az szórásnégyzet a rétegzés nélküli változat %-ában rétegzési index 1. 2. 3. rétegben nincs rétegzés 10 000 100 egyenlő elemszám 3 333 3 334 34 66 egyenlő súlyú x-re 5 275 2 974 1 751 25 75 kumulatív √f szabály 4 277 4 603 1 120 23 77 4. Sethi algoritmusa 5 578 3 599 823 21 79 5. A1-A4 algoritmus 5 529 3 642 829
A településrétegzési vizsgálatok előélete 2003: új MEFés HKF 2004: LUSZ 2005: IKT és VÉKA 1135 település érintett 2008-ban 2008-9: koncentrált összeíró-hálózat 2008: a lakossági adatgyűjtések mintáinak harmonizálása projekt
A lakossági adatgyűjtések mintáinak harmonizálása – településrétegzési vizsgálatok helyzetfelmérés rétegzési technikák kutatása új rétegző változók és technikák tesztelése optimális allokáció vizsgálata konkrét településrétegzés konkrét allokáció
Új rétegző változók és technikák tesztelése – célok Milyen változókat érdemes bevonni? Milyen technikát érdemes alkalmazni? Hány réteget célszerű kialakítani?
Új rétegző változók és technikák tesztelése – módszer Nagy számú rétegzés kialakítása különböző változók bevonásával különböző módszerekkel különböző rétegszámokkal Az összehasonlítás alapja a MEF Az összehasonlítás eszköze a rétegzési index népszámlálási változókon, a MEF nem önreprezentáló településeinek sokaságán
Új rétegző változók és technikák tesztelése – néhány rétegzés
Új rétegző változók és technikák tesztelése – tanulságok az A1-A4 algoritmust célszerű használni megyénként eltérő számú réteg megyénként független rétegkialakítás a regisztrált mn. és jövedelem változók bevonása célszerű felértékelődik az optimális allokáció
Az optimális allokáció vizsgálata Képletszerű megoldások a településszámra és a településenkénti mintaelemszámokra Vizsgálatok a MEF rétegzése mellett Az összehasonlítás alapja: a munkanélküli létszám becslésének elméleti szórásnégyzete Optimális allokáció X-optimális allokáció Rétegen belüli allokáció Vizsgálatok alternatív rétegzések mellett
Optimális allokáció alternatív rétegzések mellett
Új mintavételi terv – településrétegzés Bevont változók V1 munkanélküli létszám (2001 cenzus) V2 foglakoztatott létszám (2001 cenzus) V3 felsőfokú végz. létszáma (2001 cenzus) V4-V11 regisztrált munkanélküliek 2001-2008 V12-V19 jövedelem 2001-2008 Összesen 113 réteg, megyénként 5-8
Új mintavételi terv – településrétegzés, eredmény rétegszám Országos rétegzés indexek a V1-V19 változókra V 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 alternatív rétegzés 113 77 80 73 81 82 79 78 87 89 88 MEF rétegzés 103 53 63 40 61 60 57 56 54 52 50 68 69 67 66 65
Új mintavételi terv – allokáció A MEF megyei mintaelemszámai mellett Cél: minél kevesebb település mellett nem kevésbé pontos becslések Településszám-allokáció Településenkénti mintaelemszám
Mintaelemszám és szórásnégyzet – a MEF és az új terv szerint
Településrétegzési kutatások – összefoglalás Eredményes elméleti kutatás új ismeretek az optimális rétegzés területén Gyakorlati tapasztalatok az optimális településrétegzés és allokáció területén hatékonynak tűnő újfajta mintavételi terv időbeli hatékonysága bizonytalan
Településrétegzési kutatások – jelen és jövő a projektnek vége, a kutatásnak még nem a 2011-es cenzus után ellenőrzés két népszámlálás adatai alapján válasz arra, hogy időben tud-e hatékony maradni az újfajta mintavételi terv (rétegzés)