Gazdaságelemzési és Statisztikai Tanszék STATISZTIKA I. 7. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék
KAPCSOLATVIZSGÁLAT: ASSZOCIÁCIÓ, VEGYES KAPCSOLAT, KORRELÁCIÓ, RANGKORRELÁCIÓ
Sztochasztikus kapcsolat a függetlenség és a teljes meghatározottság között foglal helyet, tendencia jelleggel érvényesülő összefüggés. Az egyik ismérv szerinti hovatartozásból csak valószínűségi jelleggel következtethetünk a másik ismérv szerinti hovatartozásra. a változók együttmozgása, vagy ok-okozati kapcsolat
Sztochasztikus kapcsolat A két ismérv közötti kapcsolat típusa lehet, ha: a két ismérv független egymástól; a két ismérv között sztochasztikus kapcsolat van; a két ismérv függvényszerű (determinisztikus) kapcsolatban van egymással.
Sztochasztikus kapcsolat A két ismérv közötti kapcsolat kérdései: Van-e kapcsolat? Milyen szoros a kapcsolat? Hogyan lehet a kapcsolatot felhasználni?
A sztochasztikus kapcsolat típusai (kapcsolatfajták) Asszociáció(s kapcsolat): nem mennyiségi ismérvek között (minőségi vagy területi ismérvek között nominális mérési szintű változók) Vegyes kapcsolat: mennyiségi és nem mennyiségi ismérvek között (különbségi vagy arány skála és nominális skála) Korreláció(s kapcsolat): mennyiségi ismérvek között (különbségi vagy arány skálán mért változók) Rangkorreláció(s kapcsolat): ordinális skálán mért változók között
Az asszociációs kapcsolat elemzési eszközei 1. Feltételes és feltétel nélküli megoszlás összehasonlítása megoszlási viszonyszámok azonos megoszlás – függetlenség rész- és összetett viszonyszámok b) mérőszám 2. Asszociációs együttható pl. Cramer együttható
Az asszociációs kapcsolat elemzési eszközei Kombinációs (kontingencia) tábla Y feltétel nélküli megoszlása: a fősokaság Y szerinti megoszlása Y feltételes megoszlása: a j-edik rész-sokaság Y szerinti megoszlása plusz feladat : 3.5. példa a CD-n
Az asszociációs kapcsolat elemzési eszközei kontingenciatábla
Az asszociációs kapcsolat elemzési eszközei 1. a) Viszonyszámok Feltételes és feltétel nélküli megoszlás összehasonlítása megoszlási viszonyszámokkal (rész-, összetett-) függetlenség: függetlenség feltételezése melletti gyakoriság plusz feladat : 3.6. példa a CD-n
1. b) A számítása ahol: f = tényleges gyakoriság f* = függetlenség feltételezésével számított gyakoriság N-el osztva a négyzetes kontingenciát kapjuk
Asszociációs együttható Cramer-féle együttható:
Példa asszociációra Közlekedésbiztonsági szervek 1000 személyi sérüléses közúti balesetet vizsgáltak meg aszerint, hogy milyen súlyos volt a baleset és a baleset alkalmával a sérült viselt-e biztonsági övet. A kapott eredmények az alábbiak voltak: Feladat: a) Számítsa ki a Cramer mérőszámot és értékelje az eredményt!
Példa asszociációra
Látható, hogy a két ismérv független egymástól… Példa asszociációra Látható, hogy a két ismérv független egymástól… plusz feladat : 3.7. példa a CD-n
Vegyes kapcsolat PRE (Proportional Reduction of Errors – relatív hibacsökkenés) eljárás azt méri, hogy az X ismérv szerinti hovatartozás ismerete, mennyi többlet-információt ad az Y ismérv szerinti hovatartozás meghatározásához E1 az Y ismérv szerinti hovatartozást a feltétel nélküli eloszlásból határozzuk meg E2 az Y ismérv szerinti hovatartozást a feltételes megoszlásból (X ismerete alapján) határozzuk meg függetlenség függvényszerű kapcsolat
Vegyes kapcsolat Szorossági mérőszám PRE-eljárás alapján: E1 teljes eltérésnégyzetösszeg (SST) E2 belső eltérésnégyzetösszeg (SSB)
Vegyes kapcsolat Eltérésnégyzet-összegek összefüggése: E1 E2 E1 -E2
Vegyes kapcsolat E1 teljes eltérésnégyzetösszeg (SST) E2 belső eltérésnégyzetösszeg (SSB) azaz H2 neve: variancia-hányados (szórásnégyzethányados)
Vegyes kapcsolat H2 jelentése: a csoportosító ismérv az Y ismérv szóródását milyen hányadban magyarázza (%-osan értelmezhető, megoszlási viszonyszám jellegű mérőszám). a csoportosító ismérv milyen hányadban csökkenti az Y ismérv hovatartozására való következtetés bizonytalanságát (PRE). H (szóráshányados) az ismérvek közötti kapcsolat szorosságát méri plusz feladat : 3.8. példa a CD-n
Példa a vegyes kapcsolatra Az előző előadás vízfogyasztás példája: ebből: azaz: A lakásméret 26,6%-ban magyarázza a vízfogyasztás szóródását. A lakásméret és a vízfogyasztás nagysága között közepesen szoros kapcsolat van.
A korrelációs kapcsolat elemzése kiinduló adatok: értékpárok elemzési eszközök: pontdiagram szorossági mérőszámok regressziós függvény (empirikus, analitikus)
Pontdiagram
Empirikus regressziófüggvény részátlagokkal definiált sorozat Készítése: X szerint csoportosítunk és az egyes Xi osztályokhoz tartozó Y értékekből átlagot számítunk
Korreláció: szorossági mérőszámok Determinációs hányados: a vegyes kapcsolat variancia-hányadosának analógiája az empirikus regressziófüggvény alapján: X és Y változók kapcsolata nem szimmetrikus nagysága függ a csoportosítás finomságától megoszlási viszonyszám jellegű, lehet százalékosan értelmezni PRE mérőszám plusz feladat : 3.9. példa a CD-n
Extrém példa Adatpárok:
Extrém példa 1. csoportosítás σK=0, azaz η2=1
Extrém példa 2. csoportosítás σB=0, azaz η2=0
Extrém példa A determinációs hányadosok értéke mindig függ az osztályozás konkrét módjától!!!!!!!!!
Korreláció: szorossági mérőszámok Kovariancia – lineáris kapcsolat szorosságot mér • ha C > 0 pozitív korreláció • ha C = 0 lineáris korreláció hiánya • ha C < 0 negatív korreláció
Korreláció: szorossági mérőszámok LINEÁRIS korrelációs együttható (Pearson) determinációs együttható:
Extrém példa újra r=0 Ha kettébontjuk az adatokat az X=1,2,3 és az X=4,5,6 részekre, akkor r=+1 és r=-1 a két részben
Rangkorreláció Változók: rangszámok Szorossági mérőszám: Spearman-féle rangkorrelációs együttható PRE-mutató