Többváltozós adatelemzés 1. előadás
A tantárgy előadója Ágoston Kolos Csaba Egyetemi adjunktus Operációkutatás Tanszék Operációkutatás, Aktuárius szakirány tárgyai, Pénzügyi adatok elemzése
A tantárgy célja Elsajátítani a többváltozós adatelemzés legismertebb módszereit Megismerni és készség szinten használni az SPSS programcsomagot
Számonkérés Minimumteszt: géptermi vizsga 30 perc időtartamban. A félévben tanultakhoz kapcsolódóan 7 kérdés. A kérdésekre papíron kell válaszolni. Aki a 7 kérdésből 5-re helyes választ adott mehet vizsgázni. A minimumteszt eredménye nem számít be a vizsga eredményébe. Az Operációkutatás Tanszék honlapján található korábbi minimumteszt (más tárgyból).
Számonkérés Szóbeli vizsga: 15-20 perc időtartamban. A hallgatónak egy általa választott adatbázison többváltozós módszerekkel egy elemzést kell elvégeznie. Ennek az eredményeit prezentálja a szóbeli vizsgán. A vizsgához szempontokat az Operációkutatás Tanszék honlapján talál.
Mérési szintek Nominális: a változó értékei fel vannak sorolva, semmilyen viszony nincs köztük. Pl.:nem, Magyarország megyéi. Ordinális: a változó értékei rangsort jelentenek, de nem tudunk távolságot értelmezni. Pl.: iskolai végzettség, érdemjegyek. Nem mondhatjuk, hogy a ‘8 általános’ és ‘szakmunkás’ között ugyanakkora a különbség, mint a ‘főiskola’ és ‘egyetem’ között.
Mérési szintek - 2 Intervallum skála: a változó értékei között tudok távolságot mérni, de nem tudok arányt értelmezni (nincs természetes 0 pont). Pl.: hőmérséklet. Arány skála: a változó értéke esetén tudok arányt értelmezni. Pl. jövedelem, életkor. Értelmes azt mondani, hogy Antal annyival keres többet Bélánál, amennyivel Béla Csillánál. Értelmes az is, hogy Antal kétszer annyit keres, mint Béla.
Mérési szintek - 3 Az intervallum skála (de nem arány skála) ritkán fordul elő. Ezt a programcsomagok (az SPSS is) egy kategóriának kezeli. Az intervallum- vagy arány skálán mért változókkal több féle elemzést lehet elvégezni. A nominális és ordinális mérési szinten mért változók jellemzően kategória változók, a skálán mért változók jellemzően folytonos változók.
Mutatószámok Nominális változók esetén valószínűség eloszlást tudunk csak készíteni. Ilyen változók esetén csak módusz létezik.
Adatbázis Az előadásokon használt adatbázis egy a magyar iskolákban elvégzett kutatásból származik. A kutatás részletei és az adatbázis letölthető az Internetről: http://www.oki.hu/oldal.php?tipus=cikk&kod=adatbazisok-valaszol
Nominális változók
Mutatószámok - 2 Ordinális változók esetén a módusz mellett értelmezni lehet a mediánt is, továbbá kvartiliseket, deciliseket, percentiliseket is.
Ordinális változók
Mutatószámok Legalább intervallum skálán mért változók esetén már távolságot tudunk értelmezni, a változó jellemzésére alkalmas mutatószámok száma megnövekszik: átlag, variancia, szórás, ferdeség, csúcsosság, stb ….
Születés éve
Helyben lakók aránya az 1-4 évfolyamon
Működési kiadás összesen 2001-ben
Mutatószámok
Az átlag érzékeny a szélső értékekre A működési költségeket tartalmazó változóból vett 3 különböző 10%-os minta
Az átlag érzékeny a szélső értékekre A működési költségeket tartalmazó változóból vett 3 különböző 10%-os minta
Az eloszlás ferdesége Több mutatószám létezik, mi az ún. ‘skewness’ mutatót használjuk: Ha mintából becsüljük: Ahol a korrigált tapasztalati szórás
Az eloszlás ferdesége Pozitív és negatív ferdeségről beszélünk. Szimmetrikus eloszlások esetén a ferdeség értéke 0.
Eloszlás csúcsossága Több mutatószám létezik, mi a kurtózist használjuk: Ha mintából becsüljük:
Az eloszlás csúcsossága A kurtózis mutató értéke csak pozítív lehet, normális eloszlás esetén 3 az értéke. A SPSS az ún. kurtózis meghaladás értékét mutatja (de kurtózisnak hívja), ami a kurtózisból levonja a 3 értéket, így lehet negatív is.
Az eloszlás csúcsossága A normális eloszlásnál csúcsosabb eloszlás két dolgot mutathat: Az átlag környékén több érték található, mint normális eloszlás esetén vagy Az eloszlás szélein több megfigyelés található, mint normális eloszlás esetén
3 elszlás csúcsossága Sztenderd normális (a,b) intervallumon egyenletes Két szembefordított exponenciális
3 eloszlás csúcsossága
3 eloszlás csúcsossága
Változók transzformálása Amennyiben valamelyik változó eloszlása jelentősen eltér a normális eloszlástól, és/vagy nagy egyedi kiugró értékek vannak meg lehet próbálni valamilyen transzformációval közelebb hozni a normális eloszláshoz Legáltalánosabb transzformálás a logaritmálás. Akkor célszerű alkalmazni, amikor a változóra inkább valamilyen arányszerű változás a jellemző
Működési költség illetve annak logaritmáltja
Működési költség illetve annak logaritmáltja
Működési költség illetve annak logaritmáltja