Többváltozós adatelemzés

Slides:



Advertisements
Hasonló előadás
Események formális leírása, műveletek
Advertisements

2. előadás.
I. előadás.
Petrovics Petra Doktorandusz
Nemzetközi gazdaságstatisztika
STATISZTIKA II. 1. Előadás

Rangszám statisztikák
Gazdaságelemzési és Statisztikai Tanszék
Adattípusok, adatsorok jellegadó értékei
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Összefüggés vizsgálatok
Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék STATISZTIKA I. 11. Előadás.
Gazdaságelemzési és Statisztikai Tanszék
Közlekedésstatisztika
4. előadás.
III. előadás.
A középérték mérőszámai
Az élővilág kutatásának matematikai, statisztikai eszköztára
SPSS leíró statisztika és kereszttábla elemzés (1-2. fejezet)
Nem-paraméteres eljárások, több csoport összehasonlítása
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
Matematikai alapok és valószínűségszámítás
Matematikai alapok és valószínűségszámítás
Nemparaméteres próbák Statisztika II., 5. alkalom.
Térkép. Mi az adat? Minden információ, amit tárolni kell. Minden információ, amit tárolni kell.  szám  szöveg  dátum  hang  kép, stb.
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
A normális eloszlás mint modell
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
STATISZTIKA II. 3. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika.
Valószínűségszámítás
Statisztikai módszerek áttekintése módszerválasztási tanácsok Makara Gábor.
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Alapfogalmak.
Lineáris regresszió.
Adatleírás.
Egyetemes értékek az egyetemen Lovasné Avató Judit A kutatás módszertana.
Dr Gunther Tibor PhD II/2.
Paleobiológiai módszerek és modellek 4. hét
I. előadás.
Statisztikai alapfogalmak
Ábramagyarázat az Országos Kompetenciamérés iskolajelentéséhez
A kombinációs táblák (sztochasztikus kapcsolatok) elemzése
Vargha András KRE és ELTE, Pszichológiai Intézet
4. előadás.
A számítógépes elemzés alapjai
Konzultáció – Leíró statisztika október 22. Gazdaságstatisztika.
Tanulmányi Átlagok 2010/2011 tanév őszi félévéig Korrigált Kreditindex (KKI) Súlyozott Tanulmányi Átlag 2010/2011 tanév tavaszi félévétől Ösztöndíj Index.
A számítógépes elemzés alapjai
Leíró statisztika gyakorló feladatok október 15.
Adatelemzési gyakorlatok
I. Előadás bgk. uni-obuda
Dr. Varga Beatrix egyetemi docens
Speciális szóródás: Koncentráció
Bevezetés a kvantitatív kutatásba
Valószínűségi változó, eloszlásfüggvény
Adatsorok típusai, jellegadó értékei
5. előadás.
Gazdaságinformatikus MSc
A leíró statisztikák alapelemei
Mérések adatfeldolgozási gyakorlata vegyész technikusok számára
Rangsoroláson és pontozáson alapuló komplex mutatók
Mérések adatfeldolgozási gyakorlata vegyész technikusok számára
4. előadás.
Mérési skálák, adatsorok típusai
Előadás másolata:

Többváltozós adatelemzés 1. előadás

A tantárgy előadója Ágoston Kolos Csaba Egyetemi adjunktus Operációkutatás Tanszék Operációkutatás, Aktuárius szakirány tárgyai, Pénzügyi adatok elemzése

A tantárgy célja Elsajátítani a többváltozós adatelemzés legismertebb módszereit Megismerni és készség szinten használni az SPSS programcsomagot

Számonkérés Minimumteszt: géptermi vizsga 30 perc időtartamban. A félévben tanultakhoz kapcsolódóan 7 kérdés. A kérdésekre papíron kell válaszolni. Aki a 7 kérdésből 5-re helyes választ adott mehet vizsgázni. A minimumteszt eredménye nem számít be a vizsga eredményébe. Az Operációkutatás Tanszék honlapján található korábbi minimumteszt (más tárgyból).

Számonkérés Szóbeli vizsga: 15-20 perc időtartamban. A hallgatónak egy általa választott adatbázison többváltozós módszerekkel egy elemzést kell elvégeznie. Ennek az eredményeit prezentálja a szóbeli vizsgán. A vizsgához szempontokat az Operációkutatás Tanszék honlapján talál.

Mérési szintek Nominális: a változó értékei fel vannak sorolva, semmilyen viszony nincs köztük. Pl.:nem, Magyarország megyéi. Ordinális: a változó értékei rangsort jelentenek, de nem tudunk távolságot értelmezni. Pl.: iskolai végzettség, érdemjegyek. Nem mondhatjuk, hogy a ‘8 általános’ és ‘szakmunkás’ között ugyanakkora a különbség, mint a ‘főiskola’ és ‘egyetem’ között.

Mérési szintek - 2 Intervallum skála: a változó értékei között tudok távolságot mérni, de nem tudok arányt értelmezni (nincs természetes 0 pont). Pl.: hőmérséklet. Arány skála: a változó értéke esetén tudok arányt értelmezni. Pl. jövedelem, életkor. Értelmes azt mondani, hogy Antal annyival keres többet Bélánál, amennyivel Béla Csillánál. Értelmes az is, hogy Antal kétszer annyit keres, mint Béla.

Mérési szintek - 3 Az intervallum skála (de nem arány skála) ritkán fordul elő. Ezt a programcsomagok (az SPSS is) egy kategóriának kezeli. Az intervallum- vagy arány skálán mért változókkal több féle elemzést lehet elvégezni. A nominális és ordinális mérési szinten mért változók jellemzően kategória változók, a skálán mért változók jellemzően folytonos változók.

Mutatószámok Nominális változók esetén valószínűség eloszlást tudunk csak készíteni. Ilyen változók esetén csak módusz létezik.

Adatbázis Az előadásokon használt adatbázis egy a magyar iskolákban elvégzett kutatásból származik. A kutatás részletei és az adatbázis letölthető az Internetről: http://www.oki.hu/oldal.php?tipus=cikk&kod=adatbazisok-valaszol

Nominális változók

Mutatószámok - 2 Ordinális változók esetén a módusz mellett értelmezni lehet a mediánt is, továbbá kvartiliseket, deciliseket, percentiliseket is.

Ordinális változók

Mutatószámok Legalább intervallum skálán mért változók esetén már távolságot tudunk értelmezni, a változó jellemzésére alkalmas mutatószámok száma megnövekszik: átlag, variancia, szórás, ferdeség, csúcsosság, stb ….

Születés éve

Helyben lakók aránya az 1-4 évfolyamon

Működési kiadás összesen 2001-ben

Mutatószámok

Az átlag érzékeny a szélső értékekre A működési költségeket tartalmazó változóból vett 3 különböző 10%-os minta

Az átlag érzékeny a szélső értékekre A működési költségeket tartalmazó változóból vett 3 különböző 10%-os minta

Az eloszlás ferdesége Több mutatószám létezik, mi az ún. ‘skewness’ mutatót használjuk: Ha mintából becsüljük: Ahol a korrigált tapasztalati szórás

Az eloszlás ferdesége Pozitív és negatív ferdeségről beszélünk. Szimmetrikus eloszlások esetén a ferdeség értéke 0.

Eloszlás csúcsossága Több mutatószám létezik, mi a kurtózist használjuk: Ha mintából becsüljük:

Az eloszlás csúcsossága A kurtózis mutató értéke csak pozítív lehet, normális eloszlás esetén 3 az értéke. A SPSS az ún. kurtózis meghaladás értékét mutatja (de kurtózisnak hívja), ami a kurtózisból levonja a 3 értéket, így lehet negatív is.

Az eloszlás csúcsossága A normális eloszlásnál csúcsosabb eloszlás két dolgot mutathat: Az átlag környékén több érték található, mint normális eloszlás esetén vagy Az eloszlás szélein több megfigyelés található, mint normális eloszlás esetén

3 elszlás csúcsossága Sztenderd normális (a,b) intervallumon egyenletes Két szembefordított exponenciális

3 eloszlás csúcsossága

3 eloszlás csúcsossága

Változók transzformálása Amennyiben valamelyik változó eloszlása jelentősen eltér a normális eloszlástól, és/vagy nagy egyedi kiugró értékek vannak meg lehet próbálni valamilyen transzformációval közelebb hozni a normális eloszláshoz Legáltalánosabb transzformálás a logaritmálás. Akkor célszerű alkalmazni, amikor a változóra inkább valamilyen arányszerű változás a jellemző

Működési költség illetve annak logaritmáltja

Működési költség illetve annak logaritmáltja

Működési költség illetve annak logaritmáltja