Az IBM SPSS Statistics programrendszer

Slides:



Advertisements
Hasonló előadás
I. előadás.
Advertisements

Petrovics Petra Doktorandusz
IBM SPSS Statistics Regressziós elemzések Informatikai Tudományok Doktori Iskola.
A statisztika alapjai - Bevezetés az SPSS-be -
Rangszám statisztikák
Geodéziai mérések feldolgozása a GeoCalc programmal
Grafikonok Statisztika labor.
Az IBM SPSS Statistics programrendszer Gazdaságinformatikus MsC.
Az adatok rendezése. Rendezzük át az állományt a kor szerint növekvő sorrendbe!
Műveletek az adatmátrixon 2. labor. Az adatok szűrése.
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Földrajzi összefüggések elemzése
Excel: A diagramvarázsló használata
Összefüggés vizsgálatok
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Gazdaságelemzési és Statisztikai Tanszék
Közlekedésstatisztika
III. előadás.
Regresszióanalízis 10. gyakorlat.
III. Sz. Belgyógyászati Klinika
SPSS bevezetés.
SPSS leíró statisztika és kereszttábla elemzés (1-2. fejezet)
Microsoft Excel Függvények VIII.
Nem-paraméteres eljárások, több csoport összehasonlítása
Térkép. Mi az adat? Minden információ, amit tárolni kell. Minden információ, amit tárolni kell.  szám  szöveg  dátum  hang  kép, stb.
Az F-próba szignifikáns
A normális eloszlás mint modell
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Statisztikai módszerek a pedagógiai kutatásban
Többváltozós adatelemzés
Alapsokaság (populáció)
Alapfogalmak.
Adatleírás.
Diszkrét változók vizsgálata
Copyright 2007, SPSS Hungary. 1 SPSS 16 újdonságok.
Visual Basic 2008 Express Edition
Paleobiológiai módszerek és modellek 4. hét
SPSS 16 Ez a dia sorozat a gyakorlatok anyagának felidézését segíti.
I. előadás.
Turócziné Kiscsatári Nóra
Vargha András KRE és ELTE, Pszichológiai Intézet
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
A gyakorisági sorok grafikus ábrázolása
A számítógépes elemzés alapjai
Az SPSS programrendszer.
BIOLÓGUS INFORMATIKA 2008 – 2009 (1. évfolyam/1.félév) 6.
A számítógépes elemzés alapjai
SAS Base bevezetés Csicsman József
Házi feladat megoldása
II. előadás.
Adatelemzési gyakorlatok
Gazdaságinformatikus MSc
I. Előadás bgk. uni-obuda
Trendelemzés előadó: Ketskeméty László
Táblázatok A táblázat megadása a tag használatával lehetséges. A és tageken belül: a és tagek között adhatjuk meg a.
Az IBM SPSS Statistics programrendszer
Valószínűségi változó, eloszlásfüggvény
Nemparaméteres próbák
Gazdaságinformatikus MSc
Valószínűségi változók együttes eloszlása
Valószínűségi törvények
Gazdaságinformatikus MSc
A leíró statisztikák alapelemei
Gazdaságinformatika MSc labor
Statisztika segédlet a Statistica programhoz Új verzióknál érdemes a View menüsor alatt a Classic menu-s verziót választani – ehhez készült a segédlet.
Leíró statisztikák SPSS labor előadás.
A Box-Jenkins féle modellek
Az IBM SPSS Statistics programrendszer
A normális eloszlásból származó eloszlások
Előadás másolata:

Az IBM SPSS Statistics programrendszer Gazdaságinformatikus MSc

A termék nevének eredete Statistical Package for Social Scientics Statistical Product and Service Solutions SPSS PASW IBM SPSS Statistics 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics 2018.09.18. Ketskeméty László IBM SPSS Statistics

IBM SPSS Data Collection IBM SPSS Statistics IBM SPSS Modeller Core System Statistics Base Statistics 13 Text Mining for Clementine Custom Tables Advanced Statistics Web Mining for Clementine Regression SPSS Server Exact Tests Predictive Claims Bootstapping Clementine Server SamplePower Predictive Call Center Categories SmartReader SmartViewer Web Server Forecasting Predictive Marketing Conjoint SPSS WebApp Framework Decision Trees IBM SPSS Deployment Neural Networks Report Writer Direct Marketing SamplePower Missing Values Predictive Enterprise Services Enterprise Manager Enterprise Repository Data Entry Data Preparation Amos Víz Designer Complex Samples Programmability Extension IBM SPSS Data Collection mrInterview mrPaper Desktop Author mrStudio mrDialer mrTranslate mrScan mrTables Desktop Reporter 2018.09.18. Ketskeméty László IBM SPSS Statistics Copyright 2010, SPSS Hungary. 4

Ketskeméty László IBM SPSS Statistics Data View üzemmód 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Az adatmátrix 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics A mátrix egy adott sora (esete) a többváltozós minta egy eleme 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics A mátrix minden oszlopa (változója) statisztikai minta-realizáció, vagy egy idősor realizációja 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics A Variable View üzemmód 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics A változó típusa (type) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics A változó címkéje (label) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Értékcímkék megadása I. 2018.09.18. Ketskeméty László IBM SPSS Statistics

Értékcímkék megadása II. (value labels) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Hiányzó adatok definiálása 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Hiányzó adatok definiálása 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics A hiányzó adat I. 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics A hiányzó adat II. 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics A mérési szint I. 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Mérési szintek II. 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Adatok beolvasása: File/Open/Data 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Adatok beolvasása 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Adatok beolvasása 2018.09.18. Ketskeméty László IBM SPSS Statistics

Output szerkesztő ablak (Viewer) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Pozícionáló fa 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Output elemek  log 2018.09.18. Ketskeméty László IBM SPSS Statistics

Output elemek  diagrammok, ábrák oszlopdiagramm boxplot-ábra tortadiagramm 2018.09.18. Ketskeméty László IBM SPSS Statistics

Output elemek  diagrammok, ábrák szóródás ábra hisztogramm P-P grafikon 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Output elemek  táblázatok Jelentés a feldolgozott változókról 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Output elemek  táblázatok 2018.09.18. Kereszt-gyakoriság táblázat Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Output elemek  táblázatok Statisztikák listája 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Output elemek  táblázatok Gyakoriságtáblázat 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Az adatok rendezése 2018.09.18. Ketskeméty László IBM SPSS Statistics

Az adatok rendezése Rendezzük át az állományt a kor szerint növekvő sorrendbe! 2018.09.18. Ketskeméty László IBM SPSS Statistics

Az adatok rendezése Növekvő sorrendet állítunk be 2018.09.18. Ketskeméty László IBM SPSS Statistics

Az adatok rendezése A legfiatalabb esettel kezdődik a felsorolás. 2018.09.18. Ketskeméty László IBM SPSS Statistics

Új változók létrehozása Új változó számítása (compute variable) Átkódolás (recode into same variable) Átkódolás más változóba (recode into different variable) Automatikus átkódolás (automatic recode) Kategorizálás (binning) Rangszámképzés (rank cases) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Új változók számítása 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Kiszámítjuk az egy főre eső jövedelmet, ami egy új változó lesz (target variable). income= a családi jövedelem (ezer dollár) reside= az egy családban élők száma 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics A kifejezés képletének megadásakor használhatjuk a kalkulátort és a változó listát. „Direktben” is megadhatjuk a képletet a klaviatúráról. 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics A képletekhez függvényeket is felhasználhatunk egy listából. 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics A kiszámításhoz feltételeket is beállíthatunk: csak azoknál az eseteknél számol, aminél a beállított feltétel „igaz” értéket vesz fel. 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Függvény csoportok • Arithmetic Functions • Statistical Functions • String Functions • String/Numeric Conversion Functions • Date and Time Functions • Random Variable and Distribution Functions • Missing Value Functions • Logical Functions • LAG Function • VALUELABEL Function Scoring Expressions (PASW Statistics Server) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Átkódolás (recode into same variable) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Átkódolás (recode into same variable) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Átkódolás (recode into same variable) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Átkódolás más változóba 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Átkódolás más változóba 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Átkódolás más változóba 2018.09.18. Ketskeméty László IBM SPSS Statistics

Automatikus átkódolás 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Automatikus átkódolás Pl. 4  1 7  2 11  3 215  4 2018.09.18. Ketskeméty László IBM SPSS Statistics

Kategorizálás (binning) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Kategorizálás (binning) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Kategorizálás (binning) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Kategorizálás (binning) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Kategorizálás (binning) 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Rangszámképzés 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Rangszámképzés 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Rangszámképzés 2018.09.18. Ketskeméty László IBM SPSS Statistics

Ketskeméty László IBM SPSS Statistics Rangszámképzés 2018.09.18. Ketskeméty László IBM SPSS Statistics

Az adatok szűrése

Nincs szűrés, mindegyik esettel számolni akarunk Az adatok szűrése Nincs szűrés, mindegyik esettel számolni akarunk

Feltételtől függő szűrést aktivizálunk Az adatok szűrése Feltételtől függő szűrést aktivizálunk

Csak a férfiak (m=male) eseteivel akarunk számolni Az adatok feltételes szűrése Csak a férfiak (m=male) eseteivel akarunk számolni

Véletlentől függő szűrést aktivizálunk Az adatok szűrése Véletlentől függő szűrést aktivizálunk

Az esetek véletlenszerűen kiválasztott negyedével akarunk foglalkozni Az adatok véletlenszerű szűrése Az esetek véletlenszerűen kiválasztott negyedével akarunk foglalkozni

Az adatok csak egy kijelölt szeletét akarjuk vizsgálni Az adatok szűrése Az adatok csak egy kijelölt szeletét akarjuk vizsgálni

Csak az 50. esettől a 250. esetig számolunk Az adatok egy részének kijelölése Csak az 50. esettől a 250. esetig számolunk

Az adatok szűrése Szűrőváltozót alkalmazunk. Azokat az eseteket hagyjuk el, ahol a szűrőváltozó 0-s, vagy hiányzó adat.

Alul is kapunk figyelmeztetést, hogy az állományt szűrtük! Az adatok szűrése Alul is kapunk figyelmeztetést, hogy az állományt szűrtük!

Csak szűrünk, de az adatok a mátrixban maradnak. Az adatok szűrése Csak szűrünk, de az adatok a mátrixban maradnak.

A kiszűrt állományt elmenthetjük Az adatok szűrése A kiszűrt állományt elmenthetjük

Az adatok szűrése A kiszelektált eseteket törölhetjük az adatmátrixból. Ezek az adatok elvesznek.

Leíró statisztikák lehívása

Leíró statisztikák lehívása A diszkrét (kategória) változókat vegyük fel a listába! Gyakoriság táblázatot is kérünk. (Ez az alapértelmezett.)

Leíró statisztikák lehívása

A statisztikák táblázata

Gyakoriságtáblázat

Grafikonok kérése

Oszlopdiagramm

Tortadiagramm

A táblázatok beállítása

Folytonos változók esete Elmenthetjük új változókba a standardizáltakat

Folytonos változók esete

Folytonos változók esete

Két új változó keletkezett, a standardizált változók

Az EXPLORE parancsdoboz

Az EXPLORE parancsdoboz

EXPLORE táblázatok

EXPLORE táblázatok

EXPLORE táblázatok

EXPLORE táblázatok

EXPLORE táblázatok

EXPLORE grafikonok hisztogrammok

EXPLORE grafikonok P-P grafikonok

EXPLORE grafikonok dobozdiagramm

Kereszttáblázat

Kereszttáblázat

Kereszttáblázat

Kereszttáblázat

Kereszttáblázat

Kereszttáblázat

Aránystatisztikák

Aránystatisztikák

Az adatok centrális helyzetét leíró statisztikák mode a változó esetei közül a leggyakrabban előforduló érték. Ha több ilyen is van az adatban, azok közül a legkisebb. Ordinális és intervallum-skálás típusú adatoknál nem mindig van értelme. Tipikusan diszkrét változók centrumára jellemző statisztikáról van szó.

Az adatok centrális helyzetét leíró statisztikák

Az adatok centrális helyzetét leíró statisztikák

Az adatok centrális helyzetét leíró statisztikák

A szóródás mértékei

A szóródás mértékei

Ferdeség (skewness)

Csúcsosság (kurtosis)

Kvartilisek

Szár-és-levél ábra

Kontingencia-táblázat crosstabulation (kontingencia-táblázat, kereszttábla) Ez egy olyan táblázat, amelynek sorai egy változó (a sorváltozó) értékeihez, az oszlopai egy másik változó (az oszlopváltozó) értékeihez tartoznak. A táblázat egy eleme (cellája) a megfelelő sorváltozó érték és oszlopváltozó érték együttes előfordulási gyakoriságát jelenti az adott mintában. Tehát ha az rxs -es táblázat (i,j) cellájában k érték van, az azt jelenti, hogy a mintában éppen k db olyan eset van, ahol a sorváltozó az értékkészletének i-edik, az oszlopváltozó pedig j-edik elemét veszi fel.

Kontingencia-táblázat Két diszkrét (kategória) változó közötti összefüggés jellemzésére használt gyakoriság-táblázat: Az ij gyakiráság megmutatja, hogy az (yi, xj) párból hány van az adatmátrixban.

Kontingencia-táblázat 35 menedzser tanult 16 évig

Kontingencia-táblázat Ennyi lenne a gyakoriság, ha a változók függetlenek lennének!

Kontingencia-táblázat A sor % azt jelenti, hogy a tartalmazott gyakoriság a sor celláiban található össz-gyakoriság hány %-a. Az oszlop % a gyakoriságot a cellával egy oszlopban lévő gyakoriságösszeghez arányítja. A teljes % a cellagyakoriság és a mintanagyság hányadosa. A cellákban álló teljes %-ok összege a táblázatban 100%.

Kontingencia-táblázat A menedzserek a 16 évig tanuló dolgozók 59,3%-át teszik ki (sor %) A menedzserek 41,7%-a tanul 16 évig (oszlop %) A teljes állomány 7,4 %-át teszik ki a 16 évig tanuló menedzserek teljes %)

Kontingencia-táblázat

Kontingencia-táblázat

Kontingencia-táblázat

2-próba Pearson-féle 2 -statisztika a táblázat (i,j) cellájának gyakorisága,

2-próba A sor és oszlopváltozók nem lehetnek függetlenek a kicsi szignifikancia szint miatt

A többi teszt is elutasítja a függetlenséget! Egyéb függetlenségi tesztek A többi teszt is elutasítja a függetlenséget!

Grafikus illeszkedésvizsgálat A lehetséges eloszlások: béta, Chi-négyzet , exponenciális, gamma, fél-normális, Laplace, Logisztikus, Lognormál, normális, pareto, Student-féle t,, Weibull, és egyenletes. A P-P ábrán az elméleti eloszlásfüggvény és az empirikus eloszlásfüggvény van összehasonlítva. A Q-Q ábrán látható pontok vízszintes tengelyhez tartozó koordinátái a változó tapasztalati kvantilisei, a függőleges tengelyen pedig a tesztelt eloszlás kvantilisei állnak. A jó illeszkedés esetén a pontok közel szóródnak az ábrán meghúzott egyenes körül!

Grafikus illeszkedésvizsgálat

Grafikus illeszkedésvizsgálat

Grafikus illeszkedésvizsgálat

Grafikus illeszkedésvizsgálat

Grafikus illeszkedésvizsgálat

Grafikus illeszkedésvizsgálat

Illeszkedésvizsgálat próbával

Az illeszkedés nem fogadható el! Illeszkedésvizsgálat próbával Az illeszkedés nem fogadható el!

A táblázatok formázása Az eredeti, alapértelmezett formázású kereszttábla

Az egér jobb gombjával tehetjük szerkesztő módba a táblázatot.

A táblázatok formázása A „gyári” beállításokat itt érjük el.

A táblázatok formázása A listából kiválasztunk egy megfelelő formázatot.

A táblázatok formázása

A táblázatok formázása A táblázat feliratait átírhatjuk

A grafikonok típusai

Oszlopdiagrammok Az egyszerű oszlopdiagrammok három típusa: A: Summaries for groups of cases B: Summaries of separate variables C: Values of individual cases

Háztartási eszközök gyakoriságainak A gépkocsi típusok gyakoriságai Háztartási eszközök gyakoriságainak összehasonlítása CD eladásai hetenként

Oszlopdiagrammok A csoportosított oszlopdiagrammoknak is három típusa van. A: Summaries for groups of cases B: Summaries os separate variables C: Values of individual cases

Oszlopdiagrammok Gépkocsi típusok gyakoriságai az alkalmazás időtartama szerint A PC és PDA előfordulás összehasonlítása az alkalmazás időtartama szerint A CD reklámújságjainak heti száma és a webes letöltések heti száma

Oszlopdiagrammok A ragasztott oszlopdiagrammoknak is három típusa van. A: Summaries for groups of cases B: Summaries os separate variables C: Values of individual cases

Oszlopdiagrammok Gépkocsi típusok az alkalmazás hosszának függvényében A PC-k és PDA-ák összehasonlítása Az alkalmazás hossza szerint A szórólapok száma és a webes letöltések száma hetenként

3D oszlopdiagrammok

var1=salary, var2=salbegin, var3=jobcat szereposztásban 3D oszlopdiagrammok B tipusú grafikon, var1=salary, var2=salbegin, var3=jobcat szereposztásban

Vonaldiagrammok

Vonaldiagrammok A kilenc különböző vonalgrafikon típus, amit elő lehet állítani

Vonaldiagrammok A CD eladások hetenként

Terület diagrammok

Terület diagrammok A hat lehetséges terület grafikon tipus

Tortadiagrammok A három tortaábra tipus

Tortadiagrammok (pie charts) A gépkocsi típusok összehasonlítása tortadiagrammon

Terjedelem ábrák

Terjedelem ábrák Az átlag és medián különbségek High-Low grafikon a kezdőfizetés és a fizetés különbségének szemléltetésére beosztásonként Az átlag és medián különbségek grafikonja a fizetés és kezdőfizetés esetén, beosztások szerint

Terjedelem ábrák Terület-differencia ábrák három alaptípusa Egyszerű oszlop-differencia ábratípusok

Dobozábrák

Dobozábrák Dobozábra alaptipusok

A dobozábra értelmezése

A fizetés és kezdeti fizetés dobozábrái beosztásonként

Populáció piramis ábra Populáció-piramis grafikon Oszlopdiagrammok összekapcsolása Hisztogrammok összekapcsolása

Szóródás vagy pontfelhő ábrák

Szóródás vagy pontfelhő ábrák Szóródás- és pontábrák

Mátrix szóródás ábrák

3D szóródás ábrák A gépkocsik súlya, fogyasztása és gyorsulása egy 3D pontdiagrammon

Hisztogrammok Az emberek koreloszlása a normális sűrűségfüggvénnyel

Hisztogrammok A fizetések hisztogramja exponenciális sűrűségfüggvénnyel

Hisztogrammok A fizetések hisztogrammjai beosztásonként külön a nőknél és a férfiaknál haranggörbékkel