Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Diszkriminancia-analízis az SPSS-ben Petrovics Petra Doktorandusz.

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Petrovics Petra Doktorandusz
Nem hierarchikus klaszterelemzés az SPSS-ben
Kvantitatív Módszerek
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Összefoglalás - Faktor- és klaszteranalízis - Petrovics Petra.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Klaszterelemzés az SPSS-ben
A statisztika alapjai - Bevezetés az SPSS-be -
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Lineáris és nemlineáris regressziók, logisztikus regresszió
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Ozsváth Károly NYME ACSJK Testnevelési Tanszék. A diszkriminanciaanalízis (DSC, DISCRIMINANT) /{ DA, MDA }/ csoportok közti különbségek (különbözőségek),
A középérték mérőszámai
Regresszióanalízis 10. gyakorlat.
Varianciaanalízis 12. gyakorlat.
SPSS leíró statisztika és kereszttábla elemzés (1-2. fejezet)
SPSS többváltozós (lineáris) regresszió (4. fejezet)
Diszkriminancia analízis
SPSS többváltozós regresszió
Diszkriminancia analízis
Főkomponens és faktor analízis
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Kvantitatív módszerek
Adatmodellek A modellezés statisztikai alapjai. Statisztikai modell??? cél: feltárni, hogy bizonyos jelenségek között létezik-e az általunk feltételezett.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Egytényezős variancia-analízis
STATISZTIKA II. 7. Előadás
Matematikai statisztika Készítették: Miskoltzy Judit Sántha Szabina Szabó Brigitta Tóth Szabolcs Török Tamás Marketing Msc I. évf., I. félév, levelező.
Biostatisztika, MS Excel
Kvantitatív Módszerek
II. Demográfia Népesség összetételének vizsgálata
7. Csoportok és változók sztochasztikus összehasonlítása (összehasonlítások ordinális függő változók esetén)
Hipotézis vizsgálat (2)
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Következtető statisztika 9.
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Lineáris regresszió.
t A kétoldalú statisztikai próba alapfogalmai
Két kvantitatív változó kapcsolatának vizsgálata
Faktoranalízis az SPSS-ben
Sztochasztikus kapcsolatok
Petrovics Petra Doktorandusz
Bevezetés a Korreláció & Regressziószámításba
Vargha András KRE és ELTE, Pszichológiai Intézet
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Többváltozós lineáris regressziós modell feltételeinek tesztelése.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Parciális korreláció Petrovics Petra Doktorandusz.
A számítógépes elemzés alapjai
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
Pedagógiai hozzáadott érték „Őrült beszéd, de van benne rendszer” Nahalka István
A számítógépes elemzés alapjai
Korreláció, regresszió
Lineáris regressziós modellek

Többváltozós lineáris regresszió
Szabályozott és képes termékek/szolgáltatások, folyamatok, rendszerek
Dr. Varga Beatrix egyetemi docens
Bevezetés a kvantitatív kutatásba
A leíró statisztikák alapelemei
Statisztika segédlet a Statistica programhoz Új verzióknál érdemes a View menüsor alatt a Classic menu-s verziót választani – ehhez készült a segédlet.
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Dr. Varga Beatrix egyetemi docens
Előadás másolata:

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Diszkriminancia-analízis az SPSS-ben Petrovics Petra Doktorandusz

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Diszkriminancia-analízis folyamata 1. Cél, probléma 2 Az elemzés feltételeinek vizsgálata 3. A dikriminanciafüggvény meghatározása 4. Az eredmények értelmezése 5. Érvényesség értékelése

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Feladat Megnyitás: Employee_data.sav Milyen tényezőktől függ a dolgozók beosztása? Független változó (x) Nem metrikusMetrikus Függő változó (y) Nem metrikus Kereszttábla elemzés Diszkriminancia-analízis, Logisztikus regresszió Metrikus Varianciaanalízis Korreláció- és regresszióelemzés 1. Probléma

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 1.Adatok, változók X: Metrikus változók / Dummy változók (age, education level, current salary, beginning salary, month since hire, previous experience, minority classification) Adatok kizárólagossága : Pl. aki vezető, az nem hivatalnok Mindenki valamelyik csoport tagja, stb 2. Feltételek vizsgálata

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 2.Normális eloszlás Graph / Histogram Nonparametric Tests / 1-Sample K-S Test 2. Feltételek vizsgálata Stb. n Mahalanobis távolság

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 3. Multikollinearitás (vagy Pooled Within-Groups Matrices) 2. Feltételek vizsgálata Faktoranalízis (?)

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 4. Outlier: Mahalanobis távolság 5. Homoszkedaszticitás: Box’s M Analyze / Classify / Discriminant… 2. Feltételek vizsgálata Elemzés lefuttatásával

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Változók bevonása: milyen mértékben csökken a Wilks’ λ Milyen mértékben csökken a nem magyarázott variancia Kisebb M-távolság Legnagyobb F-érték Rao’s V értékének növekedése Multikollinearitás (r) Homoszkedaszticitás: nemcsak variancia állandóság, de variancia- kovariancia mátrixok egyezősége is feltétel Outlier Normál eloszlás

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet mert nem ugyanannyi menedzser van, mint pl. hivatalnok 5. Érvényesség vizsgálat

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output Magas F érték, alacsony Wilks’ Lambda !!! A kevés diszkriminatív értékkel bíró változók a stepwise diszkriminanciaelemzés segítségével eltávolíthatók. Megmutatja, hogy vannak-e különbségek a csoportosító változó által kialakított csoportok átlagai között: ha a csoportosító változó a varianciának nagy részét magyarázza, akkor a csoportok átlagai között szignifikáns eltérés mutatkozik, és a mutató értéke 0-hoz közelít. Így az egyes változók az alapján kerülhetnek bevonásra a diszkriminanciaelemzésbe, hogy milyen mértékben képesek a Wilks’ λ értékét csökkenteni. -Month since hire -Minority -Age (?) STEPWISE

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output Stepwise Statistics: 1.Education Level 2.Previous Experience 3.Current Salary 4.Age 5.Beginning Salary

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Group Statistics Employment CategoryMeanStd. Deviation Valid N (listwise) UnweightedWeighted ClericalEducational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age CustodialEducational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age ManagerEducational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age TotalEducational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age Output

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output Vs.

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output Egyező log determinánsok (nagyon alacsony log determinánssal rendelkező csoportokat célszerű törölni, ha M szignifikáns – minél magasabb kritikus p-érték) H 0 : homoszkedasztikus (egyező kovariancia mátrixok) H 1 : heteroszkedasztikus p<0.000 szignifikancia-szinten fogadjuk el, hogy homoszkedasztikus (nagy mintaelemszámnál a szignifikancia eredménye kevésbé jelentős)

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Kevésbé járul a magyarázó erő növekedéséhez Nő a magyarázó erő Output 3. Diszkriminancia függvény Szignifikáns diszkriminancia függvény p=0.000 λ=22,3% a nem magyarázott variancia (≈ ANOVA H 2 inverze) KANONIKUS DISZKRIMINANCIA FÜGGVÉNY Stepwise: Min {p;Y kategóriáinak száma-1} = 2 A különbözőség azon része, amit a DF 1 nem foglal magába

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output Többszörös korreláció a magyarázó változók és a diszkriminancia fv. között H komplementere 1 fv. esetében a négyzete ≈R 2 (modell illeszkedés) A DF 1 0,826 2 =68,23%-ban magyarázza a csoportosító változó varianciáját DF külső szórásnégyzet DF belső szórásnégyzet DF által magyarázott különbözőség DF által nem magyarázott különbözőség DF-k a magyarázott különbözőség hány %-t magyarázzák (∑100%) Az DF 1 83,4%-ban járul hozzá a különbözőség magyarázatához, míg a DF 2 csak 16,6%-ban.

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output 3-4. DF, Értelmezés Diszkrimináló hatás értelmezése → DF elnevezése DF-k és a magyarázó változók közötti korreláció Változók relatív fontossága (a korreláció abszolút mértékének sorrendjében) ≈ faktor loading (határ: >0,3 fontos) Változók fontossága Kapcsolat iránya ≈ β együtthatók (parciális) Pl. DF 1 -t a leginkább a jelenlegi fizetés, míg DF 2 -t a korábbi munkatapasztalat határozza meg

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output b i együtthatók Diszkriminancia függvény paraméterei: b: a változók parciális hozzájárulása a DF-ekhez (a többi változó változatlansága mellett) Dummy változók használata esetén: elemzés a használatuk nélkül → használatukkal (a kanonikus korreláció négyzetében mért különbség a Dummy változók magyarázó ereje) (A mértékegységek különbözősége miatt nem látszik a jelentősége, de ezek is diszkriminálnak)

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Átlagos D értékek Output Egy egyed ahhoz a csoporthoz tartozik, amely csoport centroidjához a legközelebb esik a diszkriminancia értéke (discriminant score) (Mahalanobis távolság alapján) Pl: 1. személy: manager Discriminant score Predicted group membership

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output 5. Érvényesség vizsgálat Találati arány Helyes kategorizálás Új dolgozó: abba csoportba tartozik, amelyik centroidjától a kiszámított Mahalanobis távolság értéke a legalacsonyabb

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Köszönöm a figyelmet!