Korrelációszámítás 1. hét
Két változó közötti kapcsolat Független (az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az Y szerinti hovatartozásról az Y szerinti feltétlen megoszláshoz képest). Sztochasztikus (egyik ismérv hatással van ugyan a másikra, de nem határozza meg egyértelműen annak értékeit/változatait). Függvényszerű – determinisztikus (a vizsgált egységek X szerinti hovatartozásának ismeretében teljes egyértelműséggel megmondható azok Y szerinti hovatartozása is).
A kapcsolat mérőszámai Két nominális változó közötti kapcsolatot az asszociációs mérőszámokkal jellemezzük . Ordinális típusú változók összefüggését a különböző rangkorrelációs mutatók mérik. Arány skála típusú változók összefüggését korreláció- és regresszió-analízissel mutathatjuk ki.
Sztochasztikus kapcsolatok fajtái Asszociáció (mindkét ismérv minőségi/területi ismérv, nominális skálán mérve). Vegyes (egyik ismérv mennyiségi, másik területi/minőségi, intervallum/arány és nominális skálán mérve. Korreláció (mindkét ismérv mennyiségi, intervallum/arány skálán mérve). Rangkorreláció (mindkét változó sorrendi skálán mérhető).
Alapfogalmak I. A mennyiségi ismérvek közötti kapcsolatot korrelációnak nevezzük. A korrelációszámítás: a mennyiségi ismérvek közötti kapcsolat szorosságának mérése. A regressziószámítás: a mennyiségi ismérvek egymásra gyakorolt hatásának számszerűsítésével, e hatások irányának és mértékének megállapításával foglalkozik.
Alapfogalmak II. Ha a korreláció mögött egyirányú okozati összefüggés állapítható meg: az ok szerepét betöltő ismérvet tényező-változónak (X), az okozat szerepét játszó ismérvet pedig eredményváltozónak (Y) nevezzük.
A korreláció fontosabb típusai
Korreláció hiánya A korreláció hiánya A regresszió-függvény bármely X helyen azonos (illetve közel azonos) értéket vesz fel, tehát a függvény képe vízszintes vonal lesz. E jelenség magyarázata elsősorban az lehet, hogy Y független X-től, más szóval X nem befolyásolja Y értékét
A korreláció hiánya
Függvényszerű kapcsolat A korreláció hiányának logikai ellentéte a tökéletes függvényszerű kapcsolat. Ebben az esetben egy adott X értékhez csupán egyetlen Y érték tartozhat. Ilyenkor a pontdiagram pontjai a regresszió-vonalhoz illeszkednek, azaz a regresszió-vonal körül nincs szóródás.
Függvényszerű kapcsolat
Pozitív korreláció A regresszió-görbe körül van szóródás. A regresszió-görbe alakja a korreláció tartalmát fejezi ki. Ha nagyobb X értékekhez általában nagyobb Y értékek tartoznak, vagyis a tényezőváltozó növelése az eredményváltozó nagyságát növeli.
Pozitív korreláció P o z i t í v k r e l á c ó R S q = 6 . 5 % Y 8 E + 3 2 1 - P o z i t í v k r e l á c ó R S q = 6 . 5 % Y 8 E + 9 X
Negatív korreláció N e g a t í v k o r l á c i ó Y = 5 . 7 E 6 4 8 X R - 3 2 1 N e g a t í v k o r l á c i ó Y = 5 . 7 E 6 4 8 X R S q 9 %
Görbevonalú kapcsolat A lineáristól eltérő típust görbevonalú (nemlineáris) kapcsolatnak nevezzük. A nemlineáris kapcsolatok egy részénél továbbra is van értelme pozitív, vagy negatív irányzatról beszélni, feltéve, hogy a görbe monoton növekvő, illetve csökkenő irányzatot mutat az értelmezési tartományon belül. Nem lehet azonban pozitív vagy negatív irányról beszélni, ha a regresszió irányt változtat.
Görbevonalú kapcsolat
A kapcsolat szorosságának mérőszámai
Sztochasztikus kapcsolat A sztochasztikus kapcsolat az összefüggés hiánya és a funkcionális kapcsolat között helyezkedik el. Nem lehet közömbös, hogy a vizsgált kapcsolat milyen következetességgel érvényesül, azaz melyik szélsőséges esethez áll közelebb: Laza, a függetlenséghez közel álló kapcsolat esetén pl. helytelen lenne a kapcsolatra alapozva gazdasági döntéseket hozni. Az eredményeket ilyenkor fenntartással fogadjuk és kellő óvatossággal kezeljük. Funkcionális jellegű korrelációra viszont bátran építhetünk, tehát X változása vagy változtatása esetén Y változása a regresszió által kijelölt törvényszerűség szerint fog bekövetkezni. A gazdasági döntések megalapozásához mindenképp szükségünk van a kapcsolat szorosságának mérésére, azaz a korrelációszámításra.
Kovariancia Az X és Y mennyiségi változók közötti kapcsolat irányát mutatja meg. A megfelelő átlagtól vett ( ) és ( ) eltéréseken alapszik. Az azonos előjelű eltérések szorzata pozitív, az eltérő előjelűeké pedig negatív, a szorzat előjele megadja a kapcsolat irányát. Ha az eltérésszorzatokat összegezzük vagy átlagoljuk, akkor az összeg vagy átlag előjele megmutatja, hogy a sokaság egészében a pozitív vagy a negatív kapcsolatra jellemző értékpárok dominálnak-e
Kovariancia tulajdonságai A kovariancia nulla, ha a pozitív és a negatív előjelű eltérésszorzatok összege kiegyenlíti egymást. Kovariancia előjele a kapcsolat irányát mutatja. A kovariancia abszolút mértékének nincs határozott felső korlátja. A kovariancia a két változóban szimmetrikus, X és Y szerepe a formulában felcserélhető.
Egy vállalat dolgozóinak keresete és havi megtakarítása Bér (Ft/fő) Havi megtakarítás (Ft/hó) 1 120000 13000 2 90000 10000 3 220000 35000 4 150000 18000 5 100000 12000 6 115000 12500 7 160000 20000 8 130000 13800 9 145000 14000 10 11800 Összesen 1330000 160100 dx -13000 -43000 87000 17000 -33000 -18000 27000 -3000 12000 dy -3010 -6010 18990 1990 -4010 -3510 3990 -2210 -2010 -4210 dxdy 39130000 258430000 1652130000 33830000 132330000 63180000 107730000 6630000 -24120000 138930000 2408200000 dx2 169000000 1849000000 7569000000 289000000 1089000000 324000000 729000000 9000000 144000000 13260000000 dy2 9060100 36120100 360620100 3960100 16080100 12320100 15920100 4884100 4040100 17724100 480729000
Kovariancia Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú.
A korrelációs együttható A korrelációs együttható a lineáris korreláció szorosságának legfontosabb mérőszáma. A kapcsolat hiányát (korrelálatlanság) az r = 0 érték jelzi. Az r előjele a korreláció irányát mutatja. Tökéletes (függvényszerű) lineáris kapcsolatnak - az iránytól függően - az r = +1, illetve r = -1 értékek felelnek meg. A szélsőséges helyzetek között az együttható abszolút értéke a kapcsolat szorosságáról tájékoztat.
Korrelációs együttható
Korrelációs együttható Dolgozó Bér (Ft/fő) Havi megtakarítás (Ft/hó) dx dy dxdy dx2 dy2 Összesen 1330000 160100 2408200000 13260000000 480729000 Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú és erős.
Determinációs együttható A determinációs együttható megmutatja, hogy a magyarázóváltozó hány %-ban befolyásolja az eredményváltozó szóródását. Jele: r2 A determinációs együttható jellemzi: A regressziós függvény illeszkedését, A modell magyarázó erejét.
Determinációs együttható Értelmezés: a dolgozók keresete 90,98%-ban befolyásolja a havi megtakarított összeg szóródását.
A rangkorreláció Létezhetnek a statisztikai sokaság egységeinek olyan kvantitatív jellegű tulajdonságai, amelyek számszerűen egyáltalán nem, vagy csak nehezen mérhetők. A mutatószám értéke r-hez hasonlóan természetesen -1 és 1 között helyezkedik el. Ha a kétféle rangsorszám rendre megegyezik, akkor = 1, ha a sorszámok a két ismérv szerint következetesen ellentétesen alakulnak, akkor = -1.
Rangkorreláció Egy régió vállalatainak gazdálkodására vonatkozó adatok Régió 1 2 3 4 5 6 7 8 9 10 Árbevétel (MFt) 34 30 25 22 21 12 31 20 Nyereség (MFt) 16 10,5 11 x 10 8 7 6 5 2 3 1 9 4 y d -1 -3 -4 d2 16 Értelmezés: a vállalatok árbevétele és nyeresége között közepesnél szorosabb, pozitív irányú kapcsolat van.
A korrelációs hányados A görbevonalú kapcsolatok szorosságának mérőszáma. A mutatószám kialakításának gondolatmenete: csoportosítjuk a megfigyelt értékeket a tényezőváltozó értékei vagy osztályközei szerint, és kiszámítjuk az eredményváltozó részátlagait az egyes csoportokban.
A korrelációs hányados A korrelációs hányados négyzetét definiáltuk, mivel az csupán a kapcsolat intenzitását jelzi, irányát nem. Megoszlási viszonyszám jellegénél fogva a korrelációs hányados négyzete mindig nulla és egy közé esik. Előjelét nem értelmezzük, megállapodásszerűen pozitív számként kezeljük. A korrelációs hányadost nem szokták százalékos formában kifejezni. Általában y/x x/y tehát nem szimmetrikus az X és Y változókban. X csupán mint csoportképző ismérv szerepel .
Köszönöm a figyelmet