Dr. Varga Beatrix egyetemi docens Korreláció-számítás Dr. Varga Beatrix egyetemi docens
Két változó közötti kapcsolat Függetlenség: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az Y szerinti hovatartozásról. Sztochasztikus: Az egyik ismérv hatással van a másikra, de nem határozza meg egyértelműen annak értékeit/változatait. Függvényszerű (determinisztikus): A vizsgált egységek X szerinti hovatartozásának ismeretében egyértelműen megmondható azok Y szerinti hovatartozása is. 2
A kapcsolat mérőszámai Két nominális változó közötti kapcsolatot az asszociációs mérőszámokkal jellemezzük. (Y, T, C) Ordinális típusú változók összefüggését a rangkorrelációs mutatók mérik. (ρ) Intervallum/Arány skála típusú változók összefüggését korrelációs mérőszámokkal elemezzük. Intervallum/arány és nominális skálán mért változók közötti kapcsolatot H; H2 3
Korrelációs kapcsolat elemzése esetén a következő kérdésekre keressük a választ Van- e valamilyen összefüggés az ismérvek között? Milyen irányú az összefüggés Mennyire szoros a kapcsolat? Az egyik ismérv változása milyen hatással van a másik ismérv változására?
A korrelációszámítás: a mennyiségi ismérvek közötti kapcsolat szorosságának mérése. A regresszió-számítás: a mennyiségi ismérvek egymásra gyakorolt hatásának számszerűsítésével, e hatások irányának és mértékének megállapításával foglalkozik. 5
Ha a korrelációs kapcsolat mögött egyirányú okozati összefüggés van akkor: az ok szerepét betöltő ismérv a tényezőváltozó, (magyarázóváltozó), jele: x az okozat szerepét betöltő ismérv az eredményváltozó, jele: y
A korrelációs kapcsolat mérőszámai Covariancia ( C ) Lineáris korrelációs együttható ( r ) Determinációs együttható ( r2 ) Rangkorrelációs együttható ( ρ ) 7
1. Kovariancia Az eltérésszorzatok számtani átlaga:
Kovariancia tulajdonságai A kovariancia nulla, ha a pozitív és a negatív előjelű eltérésszorzatok összege kiegyenlíti egymást. (X és Y függetlenek) Kovariancia előjele a kapcsolat irányát mutatja. A kovariancia abszolút mértékének nincs határozott felső korlátja. A kovariancia a két változóban szimmetrikus, X és Y szerepe a formulában felcserélhető. Nem méri a kapcsolat szorosságát!!!!!
Lineáris korrelációs együttható (Pearson) A lineáris korreláció szorosságának legfontosabb mérőszáma. A kapcsolat hiányát (korrelálatlanság) az r = 0 érték jelzi. Előjele a korreláció irányát mutatja. Függvényszerű lineáris kapcsolatnak, az iránytól függően, az r = +1, ill. r = -1 értékek felelnek meg. Abszolút értéke a kapcsolat szorosságáról tájékoztat.
A Pearson féle lineáris korrelációs együttható alkalmazásának feltételei Intervallum vagy arányskálán mért változók A változók közötti lineáris kapcsolat Érzékeny a kiugró értékekre A változók megközelítőleg normális eloszlásúak legyenek
Lineáris korrelációs együttható
Determinációs együttható Megmutatja, hogy a magyarázóváltozó hány %-ban befolyásolja az eredményváltozó szóródását. Jele: r2 A determinációs együttható jellemzi: A regressziós függvény illeszkedését, A modell magyarázó erejét.
Spearman rangkorrelációs együttható = 1, ha a kétféle rangsorszám rendre megegyezik, = -1 ha a sorszámok a két ismérv szerint következetesen ellentétesen alakulnak.
Egy vállalat dolgozóinak keresete és havi megtakarítása
Kovariancia Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú.
Lineáris korrelációs együttható Dolgozó Bér (Ft/fő) Havi megtakarítás (Ft/hó) dx dy dxdy dx2 dy2 Összesen 1330 160,1 2408,2 13260 480,729 Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú és erős.
Determinációs együttható Értelmezés: a dolgozók keresete 90,98%-ban befolyásolja a havi megtakarított összeg szóródását.
Rangkorreláció Egy régió vállalatainak gazdálkodására vonatkozó adatok Régió 1 2 3 4 5 6 7 8 9 10 Árbevétel (MFt) 34 30 25 22 21 12 31 20 Nyereség (MFt) 16 10,5 11 x 10 8 7 6 5 2 3 1 9 4 y d -1 -3 -4 d2 16 15 Értelmezés: a vállalatok árbevétele és nyeresége között közepesnél szorosabb, pozitív irányú kapcsolat van.