Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Diszkriminancia-analízis az SPSS-ben Petrovics Petra Doktorandusz
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Diszkriminancia-analízis folyamata 1. Cél, probléma 2 Az elemzés feltételeinek vizsgálata 3. A dikriminanciafüggvény meghatározása 4. Az eredmények értelmezése 5. Érvényesség értékelése
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Feladat Megnyitás: Employee_data.sav Milyen tényezőktől függ a dolgozók beosztása? Független változó (x) Nem metrikusMetrikus Függő változó (y) Nem metrikus Kereszttábla elemzés Diszkriminancia-analízis, Logisztikus regresszió Metrikus Varianciaanalízis Korreláció- és regresszióelemzés 1. Probléma
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 1.Adatok, változók X: Metrikus változók / Dummy változók (age, education level, current salary, beginning salary, month since hire, previous experience, minority classification) Adatok kizárólagossága : Pl. aki vezető, az nem hivatalnok Mindenki valamelyik csoport tagja, stb 2. Feltételek vizsgálata
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 2.Normális eloszlás Graph / Histogram Nonparametric Tests / 1-Sample K-S Test 2. Feltételek vizsgálata Stb. n Mahalanobis távolság
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 3. Multikollinearitás (vagy Pooled Within-Groups Matrices) 2. Feltételek vizsgálata Faktoranalízis (?)
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet 4. Outlier: Mahalanobis távolság 5. Homoszkedaszticitás: Box’s M Analyze / Classify / Discriminant… 2. Feltételek vizsgálata Elemzés lefuttatásával
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Változók bevonása: milyen mértékben csökken a Wilks’ λ Milyen mértékben csökken a nem magyarázott variancia Kisebb M-távolság Legnagyobb F-érték Rao’s V értékének növekedése Multikollinearitás (r) Homoszkedaszticitás: nemcsak variancia állandóság, de variancia- kovariancia mátrixok egyezősége is feltétel Outlier Normál eloszlás
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet mert nem ugyanannyi menedzser van, mint pl. hivatalnok 5. Érvényesség vizsgálat
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output Magas F érték, alacsony Wilks’ Lambda !!! A kevés diszkriminatív értékkel bíró változók a stepwise diszkriminanciaelemzés segítségével eltávolíthatók. Megmutatja, hogy vannak-e különbségek a csoportosító változó által kialakított csoportok átlagai között: ha a csoportosító változó a varianciának nagy részét magyarázza, akkor a csoportok átlagai között szignifikáns eltérés mutatkozik, és a mutató értéke 0-hoz közelít. Így az egyes változók az alapján kerülhetnek bevonásra a diszkriminanciaelemzésbe, hogy milyen mértékben képesek a Wilks’ λ értékét csökkenteni. -Month since hire -Minority -Age (?) STEPWISE
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output Stepwise Statistics: 1.Education Level 2.Previous Experience 3.Current Salary 4.Age 5.Beginning Salary
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Group Statistics Employment CategoryMeanStd. Deviation Valid N (listwise) UnweightedWeighted ClericalEducational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age CustodialEducational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age ManagerEducational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age TotalEducational Level (years) Current Salary Beginning Salary Months since Hire Previous Experience (months) Minority Classification age Output
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output Vs.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output Egyező log determinánsok (nagyon alacsony log determinánssal rendelkező csoportokat célszerű törölni, ha M szignifikáns – minél magasabb kritikus p-érték) H 0 : homoszkedasztikus (egyező kovariancia mátrixok) H 1 : heteroszkedasztikus p<0.000 szignifikancia-szinten fogadjuk el, hogy homoszkedasztikus (nagy mintaelemszámnál a szignifikancia eredménye kevésbé jelentős)
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Kevésbé járul a magyarázó erő növekedéséhez Nő a magyarázó erő Output 3. Diszkriminancia függvény Szignifikáns diszkriminancia függvény p=0.000 λ=22,3% a nem magyarázott variancia (≈ ANOVA H 2 inverze) KANONIKUS DISZKRIMINANCIA FÜGGVÉNY Stepwise: Min {p;Y kategóriáinak száma-1} = 2 A különbözőség azon része, amit a DF 1 nem foglal magába
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output Többszörös korreláció a magyarázó változók és a diszkriminancia fv. között H komplementere 1 fv. esetében a négyzete ≈R 2 (modell illeszkedés) A DF 1 0,826 2 =68,23%-ban magyarázza a csoportosító változó varianciáját DF külső szórásnégyzet DF belső szórásnégyzet DF által magyarázott különbözőség DF által nem magyarázott különbözőség DF-k a magyarázott különbözőség hány %-t magyarázzák (∑100%) Az DF 1 83,4%-ban járul hozzá a különbözőség magyarázatához, míg a DF 2 csak 16,6%-ban.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output 3-4. DF, Értelmezés Diszkrimináló hatás értelmezése → DF elnevezése DF-k és a magyarázó változók közötti korreláció Változók relatív fontossága (a korreláció abszolút mértékének sorrendjében) ≈ faktor loading (határ: >0,3 fontos) Változók fontossága Kapcsolat iránya ≈ β együtthatók (parciális) Pl. DF 1 -t a leginkább a jelenlegi fizetés, míg DF 2 -t a korábbi munkatapasztalat határozza meg
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output b i együtthatók Diszkriminancia függvény paraméterei: b: a változók parciális hozzájárulása a DF-ekhez (a többi változó változatlansága mellett) Dummy változók használata esetén: elemzés a használatuk nélkül → használatukkal (a kanonikus korreláció négyzetében mért különbség a Dummy változók magyarázó ereje) (A mértékegységek különbözősége miatt nem látszik a jelentősége, de ezek is diszkriminálnak)
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Átlagos D értékek Output Egy egyed ahhoz a csoporthoz tartozik, amely csoport centroidjához a legközelebb esik a diszkriminancia értéke (discriminant score) (Mahalanobis távolság alapján) Pl: 1. személy: manager Discriminant score Predicted group membership
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Output 5. Érvényesség vizsgálat Találati arány Helyes kategorizálás Új dolgozó: abba csoportba tartozik, amelyik centroidjától a kiszámított Mahalanobis távolság értéke a legalacsonyabb
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Köszönöm a figyelmet!