Korrelációs kapcsolatok elemzése

Slides:



Advertisements
Hasonló előadás
4. előadás Összehasonlítás standardizálással és indexszámítással.
Advertisements

Kvantitatív Módszerek
TÁRSADALOMSTATISZTIKA III. Sztochasztikus kapcsolatok I. Előadó: Prof. Dr. Besenyei Lajos.
Statisztika I. VI. Dr. Szalka Éva, Ph.D..
Kvantitatív módszerek
Gazdaságelemzési és Statisztikai Tanszék
Földrajzi összefüggések elemzése
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Összefüggés vizsgálatok
Gazdaságelemzési és Statisztikai Tanszék
Gazdaságelemzési és Statisztikai Tanszék
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Regresszió és korreláció
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VIII.. Dr. Szalka Éva, Ph.D.2 Többváltozós korreláció és regresszióanalízis.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Asszociáció.
III. előadás.
Lineáris korreláció és lineáris regresszió. A probléma felvetése y = 1,138x + 80,778r = 0,8962.
Regresszióanalízis 10. gyakorlat.
SPSS többváltozós (lineáris) regresszió (4. fejezet)
SPSS többváltozós regresszió
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Kvantitatív módszerek
Asszociációs együtthatók
Egytényezős variancia-analízis
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
STATISZTIKA II. 7. Előadás
3. előadás Heterogén sokaságok Szórásnégyzet-felbontás
Matematikai statisztika Készítették: Miskoltzy Judit Sántha Szabina Szabó Brigitta Tóth Szabolcs Török Tamás Marketing Msc I. évf., I. félév, levelező.
Matematikai statisztika Készítették: Miskoltzy Judit Sántha Szabina Szabó Brigitta Tóth Szabolcs Török Tamás Marketing Msc I. évf., I. félév, levelező.
Kvantitatív Módszerek
Dr. Varga Beatrix egyetemi docens
RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Következtető statisztika 9.
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Lineáris regresszió.
Két kvantitatív változó kapcsolatának vizsgálata
TÁRSADALOMSTATISZTIKA Sztochasztikus kapcsolatok II.
6. előadás.
Sztochasztikus kapcsolatok
A kombinációs táblák (sztochasztikus kapcsolatok) elemzése
Bevezetés a Korreláció & Regressziószámításba
Regresszió-számítás 2. hét.
Korrelációszámítás 1. hét.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Többdimenziós valószínűségi eloszlások
3. hét Asszociáció.
Korreláció-számítás.
A számítógépes elemzés alapjai
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
2. előadás Gyakorisági sorok
A számítógépes elemzés alapjai
Korreláció, regresszió
Lineáris regressziós modellek
Részekre bontott sokaság vizsgálata, gyakorló feladatok
Gazdaságstatisztika Konzultáció a korreláció- és regressziószámítás, idősorok elemzése témakörökből.
III. előadás.
2. előadás Viszonyszámok
Sztochasztikus kapcsolatok I. Asszociáció
Dr. Varga Beatrix egyetemi docens
2. előadás Gyakorisági sorok, Grafikus ábrázolás
A leíró statisztikák alapelemei
Rangsoroláson és pontozáson alapuló komplex mutatók
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Mérési skálák, adatsorok típusai
Dr. Varga Beatrix egyetemi docens
Előadás másolata:

Korrelációs kapcsolatok elemzése 1. előadás

Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az Y szerinti hovatartozásról. Sztochasztikus: Az egyik ismérv hatással van a másikra, de nem határozza meg egyértelműen annak értékeit/változatait. Függvényszerű (determinisztikus): A vizsgált egységek X szerinti hovatartozásának ismeretében egyértelműen megmondható azok Y szerinti hovatartozása is.

A kapcsolat mérőszámai Két nominális változó közötti kapcsolatot az asszociációs mérőszámokkal jellemezzük . Ordinális típusú változók összefüggését a rangkorrelációs mutatók mérik. Arány skála típusú változók összefüggését korreláció- és regresszió-analízissel elemezzük. Intervallum/arány és nominális skálán mért változók közötti összefüggést H;

Sztochasztikus kapcsolatok fajtái Asszociáció (mindkét ismérv minőségi/területi ismérv, nominális skálán mérve). Vegyes (egyik ismérv mennyiségi, másik területi/minőségi, intervallum/arány és nominális skálán mérve. Korreláció (mindkét ismérv mennyiségi, intervallum/arány skálán mérve). Rangkorreláció (mindkét változó sorrendi skálán mérhető).

Korrelációs kapcsolat elemzése Van-e összefüggés az ismérvek között? Milyen irányú az összefüggés? Mennyire szoros a kapcsolat? Az egyik ismérv változása milyen hatással van a másik ismérv változására?

Alapfogalmak I. A mennyiségi ismérvek közötti kapcsolatot korrelációnak nevezzük. A korrelációszámítás: a mennyiségi ismérvek közötti kapcsolat szorosságának mérése. A regressziószámítás: a mennyiségi ismérvek egymásra gyakorolt hatásának számszerűsítésével, e hatások irányának és mértékének megállapításával foglalkozik.

Alapfogalmak II. Ha a korreláció mögött egyirányú okozati összefüggés állapítható meg: az ok szerepét betöltő ismérvet tényező-változónak, eredményváltozónak (X), az okozat szerepét játszó ismérvet pedig eredményváltozónak (Y) nevezzük.

A korreláció fontosabb típusai

Korreláció hiánya A függvény képe vízszintes vonal. A regresszió-függvény bármely X helyen azonos (közel azonos) értéket vesz fel. A függvény képe vízszintes vonal. ( Y független X-től, X nem befolyásolja Y értékét.)

A korreláció hiánya N i n c s k o r e l á ó Y = 7 . 4 E + 8 X R S q % - 2 1 3 N i n c s k o r e l á ó Y = 7 . 4 E + 8 X R S q %

Függvényszerű kapcsolat A korreláció hiányának logikai ellentéte a függvényszerű kapcsolat. Egy adott X értékhez csupán egyetlen Y érték tartozhat. Ilyenkor a pontdiagram pontjai a regresszió-vonalhoz illeszkednek, azaz a regresszió-vonal körül nincs szóródás.

Pozitív korreláció Általában a regressziógörbe körül van szóródás. A regressziógörbe alakja a korreláció tartalmát fejezi ki. Ha nagyobb X értékekhez általában nagyobb Y értékek tartoznak, vagyis a tényezőváltozó növelése az eredményváltozó nagyságát növeli.

Pozitív korreláció P o z i t í v k r e l á c ó R S q = 6 . 5 % Y 8 E + 3 2 1 - P o z i t í v k r e l á c ó R S q = 6 . 5 % Y 8 E + 9 X

Negatív korreláció Az előbbi kapcsolat ellentéte természetesen a negatív korreláció, amelyet a regressziófüggvény ugyancsak szemléletesen jelez.

Negatív korreláció N e g a t í v k o r l á c i ó Y = 5 . 7 E 6 4 8 X R - 3 2 1 N e g a t í v k o r l á c i ó Y = 5 . 7 E 6 4 8 X R S q 9 %

Görbevonalú kapcsolat A lineáristól eltérő típust görbevonalú (nemlineáris) kapcsolatnak nevezzük. A nemlineáris kapcsolatok egy részénél továbbra is van értelme pozitív, vagy negatív irányzatról beszélni, feltéve, hogy a görbe monoton növekvő, illetve csökkenő irányzatot mutat az értelmezési tartományon belül. Nem lehet azonban pozitív vagy negatív irányról beszélni, ha a regresszió irányt változtat.

Görbevonalú kapcsolat - 3 2 1 4 N e m l i n á r s k o c ó Y = . 9 5 8 + 6 7 X * R S q %

A kapcsolat szorosságának mérőszámai

A kovariancia Az X és Y mennyiségi változók közötti kapcsolat irányát mutatja meg. A megfelelő átlagtól vett ( ) és ( ) eltéréseken alapszik.

Kovariancia tulajdonságai A kovariancia nulla, ha a pozitív és a negatív előjelű eltérésszorzatok összege kiegyenlíti egymást. Kovariancia előjele a kapcsolat irányát mutatja. A kovariancia abszolút mértékének nincs határozott felső korlátja. A kovariancia a két változóban szimmetrikus, X és Y szerepe a formulában felcserélhető.

Egy vállalat dolgozóinak keresete és havi megtakarítása Bér (Ft/fő) Havi megtakarítás (Ft/hó) 1 120000 13000 2 90000 10000 3 220000 35000 4 150000 18000 5 100000 12000 6 115000 12500 7 160000 20000 8 130000 13800 9 145000 14000 10 11800 Összesen 1330000 160100 dx -13000 -43000 87000 17000 -33000 -18000 27000 -3000 12000 dy -3010 -6010 18990 1990 -4010 -3510 3990 -2210 -2010 -4210 dxdy 39130000 258430000 1652130000 33830000 132330000 63180000 107730000 6630000 -24120000 138930000 2408200000 dx2 169000000 1849000000 7569000000 289000000 1089000000 324000000 729000000 9000000 144000000 13260000000 dy2 9060100 36120100 360620100 3960100 16080100 12320100 15920100 4884100 4040100 17724100 480729000

Kovariancia Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú.

A korrelációs együttható A korrelációs együttható a lineáris korreláció szorosságának legfontosabb mérőszáma. A kapcsolat hiányát (korrelálatlanság) az r = 0 érték jelzi. Az r előjele a korreláció irányát mutatja. Tökéletes (függvényszerű) lineáris kapcsolatnak - az iránytól függően - az r = +1, illetve r = -1 értékek felelnek meg. A szélsőséges helyzetek között az együttható abszolút értéke a kapcsolat szorosságáról tájékoztat.

Korrelációs együttható

Korrelációs együttható Dolgozó Bér (Ft/fő) Havi megtakarítás (Ft/hó) dx dy dxdy dx2 dy2 Összesen 1330000 160100 2408200000 13260000000 480729000 Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú és erős.

Determinációs együttható A determinációs együttható megmutatja, hogy a magyarázóváltozó hány %-ban befolyásolja az eredményváltozó szóródását. Jele: r2 A determinációs együttható jellemzi: A regressziós függvény illeszkedését, A modell magyarázó erejét.

Determinációs együttható Értelmezés: a dolgozók keresete 90,98%-ban befolyásolja a havi megtakarított összeg szóródását.

A rangkorreláció Létezhetnek a statisztikai sokaság egységeinek olyan kvantitatív jellegű tulajdonságai, amelyek számszerűen egyáltalán nem, vagy csak nehezen mérhetők. A mutatószám értéke r-hez hasonlóan természetesen -1 és 1 között helyezkedik el. Ha a kétféle rangsorszám rendre megegyezik, akkor  = 1, ha a sorszámok a két ismérv szerint következetesen ellentétesen alakulnak, akkor  = -1.

Rangkorreláció Egy régió vállalatainak gazdálkodására vonatkozó adatok Régió 1 2 3 4 5 6 7 8 9 10 Árbevétel (MFt) 34 30 25 22 21 12 31 20 Nyereség (MFt) 16 10,5 11 x 10 8 7 6 5 2 3 1 9 4 y d -1 -3 -4 d2 16 15 Értelmezés: a vállalatok árbevétele és nyeresége között közepesnél szorosabb, pozitív irányú kapcsolat van.

A korrelációs hányados A görbevonalú kapcsolatok szorosságának mérőszáma. A mutatószám kialakításának gondolatmenete: csoportosítjuk a megfigyelt értékeket a tényezőváltozó értékei vagy osztályközei szerint, és kiszámítjuk az eredményváltozó részátlagait az egyes csoportokban.

A korrelációs hányados A korrelációs hányados négyzetét definiáltuk, mivel az csupán a kapcsolat intenzitását jelzi, irányát nem. Megoszlási viszonyszám jellegénél fogva a korrelációs hányados négyzete mindig nulla és egy közé esik. Előjelét nem értelmezzük, megállapodásszerűen pozitív számként kezeljük. A korrelációs hányadost nem szokták százalékos formában kifejezni. Általában y/x  x/y tehát nem szimmetrikus az X és Y változókban. X csupán mint csoportképző ismérv szerepel .

Köszönöm a figyelmet