Korrelációszámítás 1. hét.

Slides:



Advertisements
Hasonló előadás
4. előadás Összehasonlítás standardizálással és indexszámítással.
Advertisements

Kvantitatív Módszerek
TÁRSADALOMSTATISZTIKA III. Sztochasztikus kapcsolatok I. Előadó: Prof. Dr. Besenyei Lajos.
Statisztika I. VI. Dr. Szalka Éva, Ph.D..
Kvantitatív módszerek
Gazdaságelemzési és Statisztikai Tanszék
Földrajzi összefüggések elemzése
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Összefüggés vizsgálatok
Gazdaságelemzési és Statisztikai Tanszék
Gazdaságelemzési és Statisztikai Tanszék
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Regresszió és korreláció
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VIII.. Dr. Szalka Éva, Ph.D.2 Többváltozós korreláció és regresszióanalízis.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Asszociáció.
Lineáris korreláció és lineáris regresszió. A probléma felvetése y = 1,138x + 80,778r = 0,8962.
Regresszióanalízis 10. gyakorlat.
SPSS többváltozós (lineáris) regresszió (4. fejezet)
SPSS többváltozós regresszió
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Kvantitatív módszerek
Asszociációs együtthatók
Egytényezős variancia-analízis
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
STATISZTIKA II. 7. Előadás
3. előadás Heterogén sokaságok Szórásnégyzet-felbontás
Matematikai statisztika Készítették: Miskoltzy Judit Sántha Szabina Szabó Brigitta Tóth Szabolcs Török Tamás Marketing Msc I. évf., I. félév, levelező.
Matematikai statisztika Készítették: Miskoltzy Judit Sántha Szabina Szabó Brigitta Tóth Szabolcs Török Tamás Marketing Msc I. évf., I. félév, levelező.
Kvantitatív Módszerek
Dr. Varga Beatrix egyetemi docens
RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
Többváltozós adatelemzés
Többváltozós adatelemzés
Következtető statisztika 9.
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Lineáris regresszió.
Két kvantitatív változó kapcsolatának vizsgálata
TÁRSADALOMSTATISZTIKA Sztochasztikus kapcsolatok II.
6. előadás.
Sztochasztikus kapcsolatok
A kombinációs táblák (sztochasztikus kapcsolatok) elemzése
Viszonyszámok A viszonyszám két egymással logikai kapcsolatban álló statisztikai adat hányadosa V= A/B V: a viszonyszám A:a viszonyítás alapját képező.
Bevezetés a Korreláció & Regressziószámításba
Regresszió-számítás 2. hét.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Korrelációs kapcsolatok elemzése
Többdimenziós valószínűségi eloszlások
3. hét Asszociáció.
Korreláció-számítás.
A számítógépes elemzés alapjai
Munka, energia teljesítmény.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
2. előadás Gyakorisági sorok
A számítógépes elemzés alapjai
Korreláció, regresszió
Lineáris regressziós modellek
Részekre bontott sokaság vizsgálata, gyakorló feladatok
Gazdaságstatisztika Konzultáció a korreláció- és regressziószámítás, idősorok elemzése témakörökből.
III. előadás.
2. előadás Viszonyszámok
Sztochasztikus kapcsolatok I. Asszociáció
Dr. Varga Beatrix egyetemi docens
2. előadás Gyakorisági sorok, Grafikus ábrázolás
A leíró statisztikák alapelemei
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Mérési skálák, adatsorok típusai
Dr. Varga Beatrix egyetemi docens
Előadás másolata:

Korrelációszámítás 1. hét

Két változó közötti kapcsolat Független (az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az Y szerinti hovatartozásról az Y szerinti feltétlen megoszláshoz képest). Sztochasztikus (egyik ismérv hatással van ugyan a másikra, de nem határozza meg egyértelműen annak értékeit/változatait). Függvényszerű – determinisztikus (a vizsgált egységek X szerinti hovatartozásának ismeretében teljes egyértelműséggel megmondható azok Y szerinti hovatartozása is).

A kapcsolat mérőszámai Két nominális változó közötti kapcsolatot az asszociációs mérőszámokkal jellemezzük . Ordinális típusú változók összefüggését a különböző rangkorrelációs mutatók mérik. Arány skála típusú változók összefüggését korreláció- és regresszió-analízissel mutathatjuk ki.

Sztochasztikus kapcsolatok fajtái Asszociáció (mindkét ismérv minőségi/területi ismérv, nominális skálán mérve). Vegyes (egyik ismérv mennyiségi, másik területi/minőségi, intervallum/arány és nominális skálán mérve. Korreláció (mindkét ismérv mennyiségi, intervallum/arány skálán mérve). Rangkorreláció (mindkét változó sorrendi skálán mérhető).

Alapfogalmak I. A mennyiségi ismérvek közötti kapcsolatot korrelációnak nevezzük. A korrelációszámítás: a mennyiségi ismérvek közötti kapcsolat szorosságának mérése. A regressziószámítás: a mennyiségi ismérvek egymásra gyakorolt hatásának számszerűsítésével, e hatások irányának és mértékének megállapításával foglalkozik.

Alapfogalmak II. Ha a korreláció mögött egyirányú okozati összefüggés állapítható meg: az ok szerepét betöltő ismérvet tényező-változónak (X), az okozat szerepét játszó ismérvet pedig eredményváltozónak (Y) nevezzük.

A korreláció fontosabb típusai

Korreláció hiánya A korreláció hiánya A regresszió-függvény bármely X helyen azonos (illetve közel azonos) értéket vesz fel, tehát a függvény képe vízszintes vonal lesz. E jelenség magyarázata elsősorban az lehet, hogy Y független X-től, más szóval X nem befolyásolja Y értékét

A korreláció hiánya

Függvényszerű kapcsolat A korreláció hiányának logikai ellentéte a tökéletes függvényszerű kapcsolat. Ebben az esetben egy adott X értékhez csupán egyetlen Y érték tartozhat. Ilyenkor a pontdiagram pontjai a regresszió-vonalhoz illeszkednek, azaz a regresszió-vonal körül nincs szóródás.

Függvényszerű kapcsolat

Pozitív korreláció A regresszió-görbe körül van szóródás. A regresszió-görbe alakja a korreláció tartalmát fejezi ki. Ha nagyobb X értékekhez általában nagyobb Y értékek tartoznak, vagyis a tényezőváltozó növelése az eredményváltozó nagyságát növeli.

Pozitív korreláció P o z i t í v k r e l á c ó R S q = 6 . 5 % Y 8 E + 3 2 1 - P o z i t í v k r e l á c ó R S q = 6 . 5 % Y 8 E + 9 X

Negatív korreláció N e g a t í v k o r l á c i ó Y = 5 . 7 E 6 4 8 X R - 3 2 1 N e g a t í v k o r l á c i ó Y = 5 . 7 E 6 4 8 X R S q 9 %

Görbevonalú kapcsolat A lineáristól eltérő típust görbevonalú (nemlineáris) kapcsolatnak nevezzük. A nemlineáris kapcsolatok egy részénél továbbra is van értelme pozitív, vagy negatív irányzatról beszélni, feltéve, hogy a görbe monoton növekvő, illetve csökkenő irányzatot mutat az értelmezési tartományon belül. Nem lehet azonban pozitív vagy negatív irányról beszélni, ha a regresszió irányt változtat.

Görbevonalú kapcsolat

A kapcsolat szorosságának mérőszámai

Sztochasztikus kapcsolat A sztochasztikus kapcsolat az összefüggés hiánya és a funkcionális kapcsolat között helyezkedik el. Nem lehet közömbös, hogy a vizsgált kapcsolat milyen következetességgel érvényesül, azaz melyik szélsőséges esethez áll közelebb: Laza, a függetlenséghez közel álló kapcsolat esetén pl. helytelen lenne a kapcsolatra alapozva gazdasági döntéseket hozni. Az eredményeket ilyenkor fenntartással fogadjuk és kellő óvatossággal kezeljük. Funkcionális jellegű korrelációra viszont bátran építhetünk, tehát X változása vagy változtatása esetén Y változása a regresszió által kijelölt törvényszerűség szerint fog bekövetkezni. A gazdasági döntések megalapozásához mindenképp szükségünk van a kapcsolat szorosságának mérésére, azaz a korrelációszámításra.

Kovariancia Az X és Y mennyiségi változók közötti kapcsolat irányát mutatja meg. A megfelelő átlagtól vett ( ) és ( ) eltéréseken alapszik. Az azonos előjelű eltérések szorzata pozitív, az eltérő előjelűeké pedig negatív, a szorzat előjele megadja a kapcsolat irányát. Ha az eltérésszorzatokat összegezzük vagy átlagoljuk, akkor az összeg vagy átlag előjele megmutatja, hogy a sokaság egészében a pozitív vagy a negatív kapcsolatra jellemző értékpárok dominálnak-e

Kovariancia tulajdonságai A kovariancia nulla, ha a pozitív és a negatív előjelű eltérésszorzatok összege kiegyenlíti egymást. Kovariancia előjele a kapcsolat irányát mutatja. A kovariancia abszolút mértékének nincs határozott felső korlátja. A kovariancia a két változóban szimmetrikus, X és Y szerepe a formulában felcserélhető.

Egy vállalat dolgozóinak keresete és havi megtakarítása Bér (Ft/fő) Havi megtakarítás (Ft/hó) 1 120000 13000 2 90000 10000 3 220000 35000 4 150000 18000 5 100000 12000 6 115000 12500 7 160000 20000 8 130000 13800 9 145000 14000 10 11800 Összesen 1330000 160100 dx -13000 -43000 87000 17000 -33000 -18000 27000 -3000 12000 dy -3010 -6010 18990 1990 -4010 -3510 3990 -2210 -2010 -4210 dxdy 39130000 258430000 1652130000 33830000 132330000 63180000 107730000 6630000 -24120000 138930000 2408200000 dx2 169000000 1849000000 7569000000 289000000 1089000000 324000000 729000000 9000000 144000000 13260000000 dy2 9060100 36120100 360620100 3960100 16080100 12320100 15920100 4884100 4040100 17724100 480729000

Kovariancia Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú.

A korrelációs együttható A korrelációs együttható a lineáris korreláció szorosságának legfontosabb mérőszáma. A kapcsolat hiányát (korrelálatlanság) az r = 0 érték jelzi. Az r előjele a korreláció irányát mutatja. Tökéletes (függvényszerű) lineáris kapcsolatnak - az iránytól függően - az r = +1, illetve r = -1 értékek felelnek meg. A szélsőséges helyzetek között az együttható abszolút értéke a kapcsolat szorosságáról tájékoztat.

Korrelációs együttható

Korrelációs együttható Dolgozó Bér (Ft/fő) Havi megtakarítás (Ft/hó) dx dy dxdy dx2 dy2 Összesen 1330000 160100 2408200000 13260000000 480729000 Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú és erős.

Determinációs együttható A determinációs együttható megmutatja, hogy a magyarázóváltozó hány %-ban befolyásolja az eredményváltozó szóródását. Jele: r2 A determinációs együttható jellemzi: A regressziós függvény illeszkedését, A modell magyarázó erejét.

Determinációs együttható Értelmezés: a dolgozók keresete 90,98%-ban befolyásolja a havi megtakarított összeg szóródását.

A rangkorreláció Létezhetnek a statisztikai sokaság egységeinek olyan kvantitatív jellegű tulajdonságai, amelyek számszerűen egyáltalán nem, vagy csak nehezen mérhetők. A mutatószám értéke r-hez hasonlóan természetesen -1 és 1 között helyezkedik el. Ha a kétféle rangsorszám rendre megegyezik, akkor  = 1, ha a sorszámok a két ismérv szerint következetesen ellentétesen alakulnak, akkor  = -1.

Rangkorreláció Egy régió vállalatainak gazdálkodására vonatkozó adatok Régió 1 2 3 4 5 6 7 8 9 10 Árbevétel (MFt) 34 30 25 22 21 12 31 20 Nyereség (MFt) 16 10,5 11 x 10 8 7 6 5 2 3 1 9 4 y d -1 -3 -4 d2 16 Értelmezés: a vállalatok árbevétele és nyeresége között közepesnél szorosabb, pozitív irányú kapcsolat van.

A korrelációs hányados A görbevonalú kapcsolatok szorosságának mérőszáma. A mutatószám kialakításának gondolatmenete: csoportosítjuk a megfigyelt értékeket a tényezőváltozó értékei vagy osztályközei szerint, és kiszámítjuk az eredményváltozó részátlagait az egyes csoportokban.

A korrelációs hányados A korrelációs hányados négyzetét definiáltuk, mivel az csupán a kapcsolat intenzitását jelzi, irányát nem. Megoszlási viszonyszám jellegénél fogva a korrelációs hányados négyzete mindig nulla és egy közé esik. Előjelét nem értelmezzük, megállapodásszerűen pozitív számként kezeljük. A korrelációs hányadost nem szokták százalékos formában kifejezni. Általában y/x  x/y tehát nem szimmetrikus az X és Y változókban. X csupán mint csoportképző ismérv szerepel .

Köszönöm a figyelmet