Potenciális feladattípusok

Slides:



Advertisements
Hasonló előadás
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Advertisements

Kvantitatív módszerek
Gazdasági informatika
Többváltozós standard lineáris regresszió.
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Feladat Egy új kísérleti készítmény hatását szeretnék vizsgálni egereken. 5 féle dózist adnak be 5 vizsgált egérnek, de nem sikerült mindegyik egérnek.
Földrajzi összefüggések elemzése
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Általános lineáris modellek
Összefüggés vizsgálatok
Becsléselméleti ismétlés
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. V. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VIII.. Dr. Szalka Éva, Ph.D.2 Többváltozós korreláció és regresszióanalízis.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Lineáris korreláció és lineáris regresszió. A probléma felvetése y = 1,138x + 80,778r = 0,8962.
PTE PMMK Matematika Tanszék dr. Klincsik Mihály Valószínűségszámítás és statisztika előadások Gépész-Villamosmérnök szak BSc MANB030, MALB030 Bevezető.
Növényökológia terepgyakorlat Fajok asszociáltságának vizsgálata I.) Az egyes esetek TAPASZTALT gyakorisága 1. táblázat A faj B faj+- +aba+b.
Növényökológia gyakorlat Fajok asszociáltságának vizsgálata I.) Az egyes esetek TAPASZTALT gyakorisága 1. táblázat A faj B faj+- +aba+b -cdc+d.
Regresszióanalízis 10. gyakorlat.
Varianciaanalízis 12. gyakorlat.
SPSS leíró statisztika és kereszttábla elemzés (1-2. fejezet)
SPSS többváltozós (lineáris) regresszió (4. fejezet)
SPSS többváltozós regresszió
Kovarianciaanalízis Tételezzük fel, hogy a kvalitatív tényező(k) hatásának azonosítása után megmaradó szóródás egy részének eredete ismert, és nem lehet,
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Kvantitatív módszerek
STATISZTIKA II. 7. Előadás
3. előadás Heterogén sokaságok Szórásnégyzet-felbontás
Kvantitatív Módszerek
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
Többváltozós adatelemzés
Következtető statisztika 9.
Hipotézis-ellenőrzés (Folytatás)
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Lineáris regresszió.
Két kvantitatív változó kapcsolatának vizsgálata
SPSS 16 Ez a dia sorozat a gyakorlatok anyagának felidézését segíti.
TÁRSADALOMSTATISZTIKA Sztochasztikus kapcsolatok II.
Sztochasztikus kapcsolatok
Petrovics Petra Doktorandusz
Bevezetés a Korreláció & Regressziószámításba
Vargha András KRE és ELTE, Pszichológiai Intézet
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Parciális korreláció Petrovics Petra Doktorandusz.
Korreláció-számítás.
Az SPSS programrendszer.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
A számítógépes elemzés alapjai
Lineáris regressziós modellek
Részekre bontott sokaság vizsgálata, gyakorló feladatok
Gazdaságstatisztika Konzultáció a korreláció- és regressziószámítás, idősorok elemzése témakörökből.
III. zárthelyi dolgozat konzultáció
III. előadás.
Dr. Varga Beatrix egyetemi docens
Trendelemzés előadó: Ketskeméty László
Gazdaságinformatika MSc labor
Statisztika segédlet a Statistica programhoz Új verzióknál érdemes a View menüsor alatt a Classic menu-s verziót választani – ehhez készült a segédlet.
A Box-Jenkins féle modellek
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Dr. Varga Beatrix egyetemi docens
3. Varianciaanalízis (ANOVA)
Előadás másolata:

Potenciális feladattípusok 1. feladat (függetlenségvizsgálat, vagy idősor) 40% Függetlenségvizsgálat Elvárás: H0 megfogalmazása, khí-négyzet teszt végrehajtása, döntés H0-ról Idősorok vizsgálata (lineáris trend + szezonális eltérések) Elvárás: b0, b1, szez. eltérések értelmezése

2. feladat (varianciaanalízis, vagy regresszió számítás) 60% Elvárás: H0 megfogalmazása, előfeltétel ellenőrzése, ANOVA, vagy Welch teszt, magyarázó erő, Post Hoc teszt Lineáris korreláció- és regresszió számítás Elvárás: kimenet teljes körű értelmezése (R mátrix, többszörös korrelációs együttható, r2, reziduális szórás, ANOVA, parciális teszt, modell egyenlet felírása, paraméterek értelmezése)

Összefoglaló. lineáris korrelációs együttható lineáris determinációs együttható parciális korrelációs együttható többszörös korrelációs együttható többszörös determinációs együttható regressziós együttható

Értékelés. Korreláció: Együttmozgó ismérvek (+) Ellentétes irányban mozgó ismérvek (-) Szoros vagy gyenge kapcsolat Determináció: mekkora hányad tulajdonítható a magyarázó változó(k) hatásának. Regresszió: az egyes magyarázó változóknak az eredmény változóra gyakorolt hatását mutatja

Szoros kapcsolat --- nem független --- jól illeszkedik χ² próba: χ² nagyobb a táblázati értéknél Variancia-hányados: közel 1-hez Szóráshányados: H közel 1-hez lineáris korrelációs együttható (ryx): közel ±1-hez lineáris determinációs együttható (r²yx): közel 1-hez parciális korrelációs együttható (ryx1.x2): közel ± 1-hez többszörös determinációs együttható (r²y.x1x2): közel 1-hez többszörös korrelációs együttható (ry.x1x2): közel 1-hez

Az előző együtthatók tesztjei, ha szoros kapcsolat --- nem független --- jól illeszkedik F-próba: F nagyobb a táblázati értéknél lin. korr. e. (ryx): t nagyobb, sig.<0,05 parciális korr. e. (ryx1.x2): t nagyobb, sig.<0,05 Regr. fv.: globális F-próba F nagyobb, sig.<0,05

Gyenge kapcsolat --- független --- rosszul illeszkedik χ² próba: χ² kisebb a táblázati értéknél Variancia-hányados: közel 0-hoz Szóráshányados (H): közel 0-hoz lineáris korrelációs együttható (ryx): közel 0-hoz lineáris determinációs együttható (r²yx): közel 0-hoz parciális korrelációs együttható (ryx1.x2): közel 0-hoz többszörös determinációs együttható (r²y.x1x2): közel 0-hoz többszörös korrelációs együttható (r.yx1x2): közel 0-hoz

Az előző együtthatók tesztjei, ha gyenge kapcsolat --- független --- rosszul illeszkedik F-próba: F kisebb a táblázati értéknél lin. korr. e. (ryx): t kisebb a táblázati értéknél , sig.>0,05 parciális korr. e. (ryx1.x2): t kisebb a táblázati értéknél, sig.>0,05 regr. fv.: globális F-próba F kisebb a táblázati értéknél, sig.>0,05

5%-os szignifikancia szint: 1-α=0,95 a szabadságfok: v = (r-1) (c-1) χ² próba. a próbafüggvény: 5%-os szignifikancia szint: 1-α=0,95 a szabadságfok: v = (r-1) (c-1) (r = a sorok száma; c = az oszlopok száma)

χ² próba (SPSS) 1. Az Analyze menün belül a Descriptive Statistics almenü Crosstabs gombra kattintunk 2. A megjelenő ablakban: a Row cellába és a Column cellába tesszük az ismérveket. 3. A Statistics gomb megnyomásakor felugró ablakban bejelöljük a Chi-square (Khi-négyzet) próbát. Utána megnyomjuk a Continue gombot, majd OK-t nyomunk.

χ² próba (SPSS)

F-próba A próbafüggvény: Szabadságfok: v1= M – 1 (a részsokaságok száma mínusz 1) v2= n – M (a teljes minta elemszáma mínusz a részsokaságok száma)

F-próba (SPSS) Az Analyze menün belül a Compare means almenü One-way-ANOVA gombra kattintunk A megjelenő ablakban: a Dependent list cellába a függő ismérvet; a Factor cellába a magyarázó ismérvet tesszük. Az Option gomb megnyomása utána a felugró ablakban a következő statisztikákat jelöljük be: Descriptive (leíró statisztikát ad a csoportokra) Homogenity of variance test (a csoportok varianciáinak egyezőségét teszteli) Utána megnyomjuk a Continue gombot, majd OK. A második tábla a csoportok varianciájának egyezőségét mutatja, ha sig kisebb mint 0,05, a varianciák nem tekinthetők azonosnak, ezért az ANOVA táblázatot nem tudjuk használni.

Ha az ANOVA táblázatot nem tudjuk használni. Visszamegyünk az adat ablakba, és az Analyze menün belül a Compare means almenü One-way-ANOVA gombra kattintunk Az Option gomb megnyomása utána a felugró ablakban bejelöljük a Welch (a csoportátlagok egyezőségét vizsgálja F teszttel, ha a varianciák különböznek) A többi jelölést kivesszük. Utána megnyomjuk a Continue gombot, majd OK-t nyomunk. Az ANOVA táblát újra megkapjuk. A második tábla a Welch teszt eredményét mutatja: ha sig. kisebb, mint 0,05, a csoportátlagok nem tekinthetők azonosnak

ANOVA tábla magyarázó erő: SSK/SST=1,52/2,21=0,69

Welch teszt

Ha a csoportátlagok nem tekinthetők azonosnak Visszamegyünk az adatablakba, és megismételve az előző lépéseket A Post hoc gombra kattintunk, és a felugró ablakban „Az equal variances not assumed” mezőben a Tamhane’ T2-t jelöljük be (t-teszttel hasonlítja össze páronként a csoportátlagokat). Utána megnyomjuk a Continue gombot, majd OK-t nyomunk.

Post hoc

Regresszió: Normálegyenletek Lineáris: y = n 0 + 1 x x y = 0 x + 1 x² Exponenciális: Hatványkitevős: log y= n log0 + 1 log x log x log y= log 0 log x + 1 log²x

A 1 paraméter (regressziós együttható) értelmezései: Lineáris regresszió: „x” egységnyi változásával „y” változásának mértéke 1 –nyi. 1 fő létszámnövekedés 3,8 millió forinttal növeli a kibocsátást. Exponenciális regresszió: x” egységnyi növekedése 1 –szeresére változtatja „y” értékét. Ha az egységárat egy egységgel növeljük, akkor a termelés 1,05-szorosára nő. Hatványkitevős regresszió: az „x” egy százaléknyi változása 1 százaléknyi változást eredményez az „y” értékében. 1%-os beruházási növekedés 0,5%-os kibocsátás növekedést eredményez.

Rugalmassági együttható (elaszticitás): A „x” értékének egy adott szintről történő 1 százalékos növekedése esetén az „y” értéke átlagosan E százalékkal változik Lineáris regressziónál: (minden x értékre más és más értéket kapunk) Exponenciális regressziónál: . Hatványkitevős regressziónál:

A korrelációs mátrix inverze. A páronkénti korrelációs együtthatók korrelációs mátrixba rendezhetők. Háromváltozós korreláció esetén: A korrelációs mátrix inverze. 23 23

A parciális korrelációs együttható kiszűri a többi változón keresztül gyakorolt közvetett hatást. Például az y és az x1 közötti közvetlen kapcsolatra (a pont után a kizárt változó) számított parciális korrelációs együttható: 24 24

A többszörös determinációs együttható az összes magyarázó változó együttes hatását méri. Az eredményváltozó szórásnégyzetéből mekkora hányad tulajdonítható a magyarázó változók szórásának. A többszörös korrelációs együttható a többszörös determinációs együttható négyzetgyöke. 25 25

Teszt-képletek.

Vizsgálja meg a modell illeszkedésének jóságát (azaz tesztelje a többszörös korrelációs együtthatót)!

a teljes eltérés-négyzetösszeg a teljes eltérés-négyzetösszegből a regressziós függvény által magyarázott rész a teljes eltérés-négyzetösszegből a hibataggal magyarázott rész A modell illeszkedése az SSR arányának nagyságával tesztelhető. A nagyobb arány jobb illeszkedést jelent. 28 28

Számítsa ki és értelmezze a reziduális szórást! SSE= 0,0039 A profit értéke átlagosan 19 ezer forinttal tér el a becsült profit-értéktől.

SPSS : Korreláció Lépések: Analyse – Correlate – Bivariate A felugró ablakban az összes változót átvisszük a „variables” mezőbe, majd OK Eredményül a korrelációs mátrixot és a korrelációs együtthatók t-tesztjét kapjuk

SPSS : Regresszió Lépések: Analyze – Regression – Linear A felugró ablakban a Dependent mezőbe tesszük a profit ismérvet az Independent mezőbe tesszük a másik 3 ismérvet A statistics menüben a part and partial correlation menüpontot jelöljük be, majd Continue és utána OK. Eredményül 4 táblát kapunk

A regr. egyenlet: y= -0,023+0,05x1+0,236x2-0,027x3 A magyarázó ismérvek (x) egységnyi változása mekkora változást eredményez az eredmény változóban (y) A regressziós egyenes paramétereinek (β) értelmezése: Ha semmi nem változik -0.023 millió USD a profit változása Ha 1 millió USD-vel nő az á.eszk. 0.050 millió USD a profitváltozás Ha 1 millió USD-vel nő a bér 0.236 millió USD a profit változása Ha 1 millió USD-vel nő a hitel -0.027 millió USD a profit változása

Nemlineáris regresszió SPSS-ben Az Analyze menü Regression almenüben a Curve Estimation menüpontot választjuk. A Dependents mezőbe a hőmérséklet változót tesszük. Az Independent variable mezőbe az eltelt_idő változót tesszük. A Models mezőben a Linear és az Exponential opciót választjuk Jelöljük be a Display ANOVA table opciót is.

R: korrelációs együttható R2: determinációs együttható A becslésstandard hibája Az ANOVA tábla a modell illeszkedésének jóságát teszteli. Sig<0,05, 5%-os szignifikancia szint mellett a modell illeszkedése elfogadható β0=106,265 lnβ1= -0,019 β1=0,981 y=106,25*0,981x