Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Többváltozós adatelemzés

Hasonló előadás


Az előadások a következő témára: "Többváltozós adatelemzés"— Előadás másolata:

1 Többváltozós adatelemzés
1. előadás

2 A tantárgy előadója Ágoston Kolos Csaba Egyetemi adjunktus
Operációkutatás Tanszék Operációkutatás, Aktuárius szakirány tárgyai, Pénzügyi adatok elemzése

3 A tantárgy célja Elsajátítani a többváltozós adatelemzés legismertebb módszereit Megismerni és készség szinten használni az SPSS programcsomagot

4 Számonkérés Minimumteszt: géptermi vizsga 30 perc időtartamban. A félévben tanultakhoz kapcsolódóan 7 kérdés. A kérdésekre papíron kell válaszolni. Aki a 7 kérdésből 5-re helyes választ adott mehet vizsgázni. A minimumteszt eredménye nem számít be a vizsga eredményébe. Az Operációkutatás Tanszék honlapján található korábbi minimumteszt (más tárgyból).

5 Számonkérés Szóbeli vizsga: perc időtartamban. A hallgatónak egy általa választott adatbázison többváltozós módszerekkel egy elemzést kell elvégeznie. Ennek az eredményeit prezentálja a szóbeli vizsgán. A vizsgához szempontokat az Operációkutatás Tanszék honlapján talál.

6 Mérési szintek Nominális: a változó értékei fel vannak sorolva, semmilyen viszony nincs köztük. Pl.:nem, Magyarország megyéi. Ordinális: a változó értékei rangsort jelentenek, de nem tudunk távolságot értelmezni. Pl.: iskolai végzettség, érdemjegyek. Nem mondhatjuk, hogy a ‘8 általános’ és ‘szakmunkás’ között ugyanakkora a különbség, mint a ‘főiskola’ és ‘egyetem’ között.

7 Mérési szintek - 2 Intervallum skála: a változó értékei között tudok távolságot mérni, de nem tudok arányt értelmezni (nincs természetes 0 pont). Pl.: hőmérséklet. Arány skála: a változó értéke esetén tudok arányt értelmezni. Pl. jövedelem, életkor. Értelmes azt mondani, hogy Antal annyival keres többet Bélánál, amennyivel Béla Csillánál. Értelmes az is, hogy Antal kétszer annyit keres, mint Béla.

8 Mérési szintek - 3 Az intervallum skála (de nem arány skála) ritkán fordul elő. Ezt a programcsomagok (az SPSS is) egy kategóriának kezeli. Az intervallum- vagy arány skálán mért változókkal több féle elemzést lehet elvégezni. A nominális és ordinális mérési szinten mért változók jellemzően kategória változók, a skálán mért változók jellemzően folytonos változók.

9 Mutatószámok Nominális változók esetén valószínűség eloszlást tudunk csak készíteni. Ilyen változók esetén csak módusz létezik.

10 Adatbázis Az előadásokon használt adatbázis egy a magyar iskolákban elvégzett kutatásból származik. A kutatás részletei és az adatbázis letölthető az Internetről:

11 Nominális változók

12 Mutatószámok - 2 Ordinális változók esetén a módusz mellett értelmezni lehet a mediánt is, továbbá kvartiliseket, deciliseket, percentiliseket is.

13 Ordinális változók

14 Mutatószámok Legalább intervallum skálán mért változók esetén már távolságot tudunk értelmezni, a változó jellemzésére alkalmas mutatószámok száma megnövekszik: átlag, variancia, szórás, ferdeség, csúcsosság, stb ….

15 Születés éve

16 Helyben lakók aránya az 1-4 évfolyamon

17 Működési kiadás összesen 2001-ben

18 Mutatószámok

19 Az átlag érzékeny a szélső értékekre
A működési költségeket tartalmazó változóból vett 3 különböző 10%-os minta

20 Az átlag érzékeny a szélső értékekre
A működési költségeket tartalmazó változóból vett 3 különböző 10%-os minta

21 Az eloszlás ferdesége Több mutatószám létezik, mi az ún. ‘skewness’ mutatót használjuk: Ha mintából becsüljük: Ahol a korrigált tapasztalati szórás

22 Az eloszlás ferdesége Pozitív és negatív ferdeségről beszélünk.
Szimmetrikus eloszlások esetén a ferdeség értéke 0.

23 Eloszlás csúcsossága Több mutatószám létezik, mi a kurtózist használjuk: Ha mintából becsüljük:

24 Az eloszlás csúcsossága
A kurtózis mutató értéke csak pozítív lehet, normális eloszlás esetén 3 az értéke. A SPSS az ún. kurtózis meghaladás értékét mutatja (de kurtózisnak hívja), ami a kurtózisból levonja a 3 értéket, így lehet negatív is.

25 Az eloszlás csúcsossága
A normális eloszlásnál csúcsosabb eloszlás két dolgot mutathat: Az átlag környékén több érték található, mint normális eloszlás esetén vagy Az eloszlás szélein több megfigyelés található, mint normális eloszlás esetén

26 3 elszlás csúcsossága Sztenderd normális
(a,b) intervallumon egyenletes Két szembefordított exponenciális

27 3 eloszlás csúcsossága

28 3 eloszlás csúcsossága

29 Változók transzformálása
Amennyiben valamelyik változó eloszlása jelentősen eltér a normális eloszlástól, és/vagy nagy egyedi kiugró értékek vannak meg lehet próbálni valamilyen transzformációval közelebb hozni a normális eloszláshoz Legáltalánosabb transzformálás a logaritmálás. Akkor célszerű alkalmazni, amikor a változóra inkább valamilyen arányszerű változás a jellemző

30 Működési költség illetve annak logaritmáltja

31 Működési költség illetve annak logaritmáltja

32 Működési költség illetve annak logaritmáltja


Letölteni ppt "Többváltozós adatelemzés"

Hasonló előadás


Google Hirdetések