Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA

Hasonló előadás


Az előadások a következő témára: "RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA"— Előadás másolata:

1 RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
Gazdaságstatisztika RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA 2016. október 20.

2 Részekre bontott sokaság vizsgálata
Heterogén sokaság: a vizsgált ismérv szempontjából lényegesen eltérő jellegzetességeket mutató sokaság A sokaságot célszerű részekre bontva elemezni 𝑀 (𝑀≥2) részsokaságot alakítunk ki Ehhez úgy kell csoportképző ismérvet választani, hogy megmutassa a részsokaságok közötti heterogenitást. Csoportképzés valamilyen minőségi vagy területi ismérv alapján Vegyes kapcsolat: Az egyik vizsgált változó területi vagy minőségi ismérv, a másik változó mennyiségi ismérv

3 Példa A C A B C D D Van-e kapcsolat a vonat célállomása (minőségi ismérv) és a vonaton utazók száma között (mennyiségi ismérv)? Ha igen, milyen szoros ez a kapcsolat? B

4 Fősokaság részsokaság 2. részsokaság M. részsokaság i. részsokaság

5 Rész- és főátlagok N Fősokaság részsokaság A j-edik részsokaság
értékösszege 2. részsokaság M. részsokaság N i. részsokaság

6 Teljes-, belső- és külső eltérés
Fősokaság részsokaság 2. részsokaság dij Bij Kj M. részsokaság i. részsokaság

7 Teljes-, belső- és külső eltérés
A szórásszámítás alapja: belső eltérés külső eltérés A teljes eltérés azt mutatja, hogy Yij eltérhet a főátlagtól, mert: az ismérvértékek ingadoznak a részátlag körül => belső eltérések a részátlagok ingadoznak a főátlag körül => külső eltérések Csoportképző ismérven kívüli összes egyéb tényezőnek tulajdonítható Csoportképző ismérvnek tulajdonítható

8 Teljes szórás Fősokaság részsokaság 2. részsokaság M. részsokaság
i. részsokaság

9 Részszórás Fősokaság részsokaság 2. részsokaság M. részsokaság

10 Belső szórás Fősokaság részsokaság 2. részsokaság M. részsokaság
i. részsokaság

11 A részvarianciák és a belső variancia kapcsolata
A j-edik részsokaság varianciája Ebből A belső variancia Egyes részvarianciák részsokasági elemszámmal súlyozott számtani átlaga

12 Külső szórás Fősokaság részsokaság 2. részsokaság M. részsokaság
i. részsokaság

13 Teljes-, belső- és külső szórás
Teljes eltérés-négyzetösszeg: SST Teljes szórás Részszórás: A j-edik részsokaság szórása Belső szórás A fősokaság egyes egységeihez tartozó Yij ismérvértékek átlagosan mennyivel térnek el a saját részátlaguktól – a részsokaságok összességére vonatkozik Külső szórás A részátlagok átlagosan mennyivel térnek el a főátlagtól Belső eltérés-négyzetösszeg: SSB Külső eltérés-négyzetösszeg: SSK

14 SST=SSB+SSK SST=SSB+SSK Teljes eltérés-négyzetösszeg:
Belső eltérés-négyzetösszeg: Külső eltérés-négyzetösszeg: SST=SSB+SSK

15 Bizonyítás SSB+SSK Az egyenlet bal oldalát átírva:
A számtani átlag megismert tulajdonsága: Így: SSB+SSK =0???

16 A teljes-, a belső- és a külső variancia kapcsolata

17 Az Y ismérv SST teljes eltérés-négyzetösszegének, változékonyságának
SST, SSB, SSK Az Y ismérv SST teljes eltérés-négyzetösszegének, változékonyságának SSK nagyságú része a részsokaságok képzésére használt csoportképző ismérvnek tulajdonítható, azzal magyarázható. SSK csak a külső eltérésektől függ. SSB nagyságú rész az Y ismérv szóródását előidéző más, kiemelten nem vizsgált tényezők együttes hatásának tudható be. SSB csak a belső eltérésektől függ.

18 Ismérvek közötti kapcsolat
Két ismérv, X és Y között háromféle kapcsolat lehetséges: A két ismérv független egymástól. A két ismérv között sztochasztikus kapcsolat van: nincs egyértelmű függvénykapcsolat, de egy tendencia jellegű kapcsolat van A két ismérv függvényszerű, determinisztikus kapcsolatban van: ez azt jelenti, hogy az egyik ismérv adott értékéhez a másik ismérv adott értéke tartozik. Ismérvek közötti kapcsolat elemzése: Van-e kapcsolat a vizsgált ismérvek között? Milyen szoros a kapcsolat? Hogyan lehet felhasználni az ismérvek közötti kapcsolat természetének ismeretét arra, hogy egy adott egység bizonyos ismérvek szerinti milyenségéből következtethessünk annak más ismérv szerinti hovatartozására?

19 Egyidejűleg vizsgált két ismérv közötti kapcsolat a változók mérési szintje szerint
Asszociációs kapcsolat: az egymással kapcsolatban álló ismérvek minőségi vagy területi ismérvek (mindkét változó nominális mérési szintű) Vegyes kapcsolat: az egyik vizsgált ismérv mennyiségi, a másik pedig minőségi vagy területi ismérv (az egyik változó különbségi vagy arányskálán, a másik pedig nominális skálán mérhető) Korrelációs kapcsolat: mindkét vizsgált ismérv mennyiségi ismérv (mindkét változó különbségi vagy arányskálán mérhető) Rangkorrelációs kapcsolat: mindkét változó sorrendi skálán mérhető

20 Vegyes kapcsolat szorossága, a varianciahányados
X: csoportképző minőségi ismérv Y: mennyiségi ismérv X és Y kapcsolatának szorosságát mérő mutatót H2-tel jelöljük, és varianciahányadosnak, vagy szórásnégyzet-hányadosnak nevezzük: A H2 az Y ismérv szórásnégyzetének az X ismérv által magyarázott hányada. H2=0, ha SSK=σ2k=0, vagyis az X ismérv szerint képzett osztályok részátlagai egyformák H2=1, ha σ2k= σ2T, azaz σ2B=0, vagyis az X szerint képzett csoportokon belül nem szóródik Y.

21 A vegyes kapcsolat szorosságának mérése: a szóráshányados
H a szóráshányados, ami ugyancsak 0 és 1 között mozog. H=0 értéke a vizsgált két ismérv függetlenségét jelzi, H=1 pedig az X és Y közötti függvényszerű kapcsolatra utal. Nem fejezhető ki százalékosan, hanem kizárólag a kapcsolat szorosságának megítélésére használható a 0-hoz, illetve az 1-hez való közelségét figyelembe véve.

22 Példa A Gazdaságstatisztika tantárgy 2015/2016 őszi félévének első zárthelyijén elért eredményeket vizsgáljuk. Az érintett szakokhoz kapcsolódó eredményeket foglalja össze az alábbi táblázat: Értelmezzük a táblázatban szereplő értékeket! Vizsgáljuk meg a szóródást, és számszerűsítsük, hogy a szak az elért eredmények ingadozását milyen mértékben magyarázza! Mennyire erős a kapcsolat a szak és az elért eredmény között? Szak Zh-t megírók száma (fő) átlagok Tapasztalati szórások AK 2 15 4,24 GM 116 14,98 6,25 MM 156 15,86 6,27 NG 108 16,19 Összesen 382

23 Példa Főátlag: Szak Zh-t megírók száma (fő) átlagok
Tapasztalati szórások AK 2 15 4,24 GM 116 14,98 6,25 MM 156 15,86 6,27 NG 108 16,19 Összesen 382

24 szerinti hovatartozás a pontszámok ingadozásának 0,6%-át magyarázza…
Példa Varianciahányados mutató: Szóráshányados mutató: A szak szerinti hovatartozás a pontszámok ingadozásának 0,6%-át magyarázza… Igen gyenge a kapcsolat a szak szerinti hovatartozás és az elért eredmények között.

25 Példa Ismeretes, hogy a budapesti lakótelepeken a lakásárak különböző tényezők következtében lényegesen eltérnek egymástól. Ennek illusztrálása céljából egy hirdetési újságból kigyűjtötték mindazoknak a 3+1 fél szobás lakásoknak az árát, amelyek egy adott napon az újságban Budapest III. kerületében meghirdetésre kerültek. A négy lakótelepről aznap eladásra kínált sokaságokat egy-egy részsokaságnak tekintették. Az adatokat az alábbi táblázat tartalmazza (mFt-ban):

26 Példa Első feladatunk az, hogy határozzuk meg és hasonlítsuk össze egymással az egyes részsokaságokba tartozó lakások átlagos kínálati árát, és állítsuk elő azokból az adott napon eladásra kínált 45 lakás átlagos árát.

27 Példa

28

29

30

31

32 Példa Varianciahányados: vegyes kapcsolat (mennyiségi ismérv:ár; területi ismérv: lakás elhelyezkedése) A kínálati lakásárak ingadozásának mintegy 71%-a azzal magyarázható, hogy a lakás a négy lakótelep közül melyiken található. Az ingadozás 29%-a pedig egyéb, itt külön nem vizsgált tényezőknek (pl. hányadik emeleten van a lakás, milyen a tájolása, tömegközlekedési viszonyok, a lakótelep infrastruktúrája stb.) tulajdonítható. Szóráshányados: Közepesnél erősebb kapcsolat a két ismérv között.

33 1. példa Egy vállalatnál megvizsgálják a férfiak és a nők kereseteit. Jellemezze a munkavállalók keresetének homogenitását, állapítsa meg, hogy milyen szoros a kapcsolat a munkavállaló neme és a bruttó keresete között! Megoldás: A kereset szerinti szóródást két részre kell bontani, a „Munkavállaló neme” ismérvhez kapcsolódó külső szórásra és a más tényezőkhöz (pl. tapasztalat, iskolai végzettség stb.) kapcsolható belső szóródásra az SST=SSK+SSB összefüggés alapján. Nem Bruttó kereset (ezer Ft/hó) Férfi 120, 83, 65, 190, 230, 120, 130, 190 70, 65, 90, 100, 120, 130

34 1. példa Részátlagok: Nem Bruttó kereset (ezer Ft/hó) Férfi
120, 83, 65, 190, 230, 120, 130, 190 70, 65, 90, 100, 120, 130 Részátlagok: A vizsgált férfiak átlagkeresete 141 eFt/hó A vizsgált nők átlagkeresete 95,83 eFt/hó A vizsgált vállalat esetében az átlagkereset 121,64 eFt/hó.

35 1. példa Részszórások: Nem Bruttó kereset (ezer Ft/hó) Férfi
120, 83, 65, 190, 230, 120, 130, 190 70, 65, 90, 100, 120, 130 Részszórások: a férfiak esetében az átlagkeresettől való átlagos eltérés 53,46 eFt/hó a nők esetében az átlagkeresettől való átlagos eltérés 23,88 eFt/hó

36 1. példa Belső szórás Külső szórás: Teljes szórás:
a vizsgált vállalat esetében az átlagos keresettől való átlagos eltérés (a részátlagoktól való átlagos eltérés) 43,33 eFt/hó. a nemenkénti átlagkeresetek átlagosan 22,35 eFt/hó-val térnek el a főátlagtól az egyes munkavállalók keresete átlagosan 48,76 eFt/hó-val tér el a főátlagtól

37 1. példa SST=SSK+SSB Varianciahányados: Szóráshányados:
A munkavállaló neme 21%-ban magyarázza a fizetésekben megfigyelhető szóródást. A két ismérv között gyenge közepes kapcsolat van

38 2. példa Három hallgatói csoportot vizsgálunk. Az első csoportba azok a hallgatók kerültek, akik a szüleikkel laknak, a másik csoportba pedig azok, akik kollégiumban, míg a harmadik csoportba azok kerültek, akik albérletben laknak. Az alábbi táblázat mutatja az egyes csoportokban megkérdezett hallgatók heti költéseit ezer Ft-ban. Számítsuk ki az átlagos heti kiadást a különböző lakáshelyzetű hallgatói csoportokban! Vonjunk le következtetéseket! Vizsgáljuk meg a szóródást különböző módokon! Számítsuk ki, hogy a szóródás milyen mértékben magyarázható a lakáshelyzettel! Milyen szoros a kapcsolat a lakhely és a kiadások között? Hallgató lakhelye Heti költség (eFt) Szülőknél 13, 18, 20, 20, 28, 30, 31, 40 Kollégiumban 25, 30, 30, 31, 33, 35, 38, 40, 40, 44, 50 Albérletben 40, 48, 50, 50, 52

39 2. példa Átlagos heti kiadások kiszámítása: Hallgató lakhelye
A szülőknél lakók átlagos heti kiadása 25 eFt, a kollégistáké 36 eFt, és az albérletben lakóké 48 eFt, így ez utóbbi csoport esetében a legmagasabb a heti kiadás. A megkérdezett hallgatók átlagos heti költsége 34,83 eFt. Hallgató lakhelye Heti költség (eFt) Szülőknél 13, 18, 20, 20, 28, 30, 31, 40 Kollégiumban 25, 30, 30, 31, 33, 35, 38, 40, 40, 44, 50 Albérletben 40, 48, 50, 50, 52

40 2. példa Részszórások kiszámítása: Hallgató lakhelye
Heti költség (eFt) Szülőknél 13, 18, 20, 20, 28, 30, 31, 40 Kollégiumban 25, 30, 30, 31, 33, 35, 38, 40, 40, 44, 50 Albérletben 40, 48, 50, 50, 52 A szülőknél lakók átlagos költése átlagosan 8,2 eFt-tal tér el az átlagtól, az átlagtól való átlagos eltérés 6,9 eFt a kollégistáknál és 4,2 eFt az albérletben lakóknál

41 2. példa Belső szórás: Külső szórás: Teljes szórás:
a hallgatók heti költése átlagosan 6,92 eFt-tal tér el a saját részsokaságuk (lakhely szerint számított) átlagától az egyes részsokságok költésének átlagai 8,3 eFt-tal térnek el a heti költések főátlagától Az egyes hallgatók heti költése átlagosan 10,81 eFt-tal tér el a vizsgálatba bevont hallgatók átlagos heti költségétől

42 2. példa Vegyes kapcsolat mérése Varianciahányados Szóráshányados
A heti költések ingadozását 59%-ban magyarázza a hallgató lakhelye a két ismérv (hallgató lakhelye és a heti költés) között közepesnél erősebb kapcsolat áll fenn

43 Köszönöm a figyelmet! Árva Gábor


Letölteni ppt "RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA"

Hasonló előadás


Google Hirdetések