Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Az IBM SPSS Statistics programrendszer

Hasonló előadás


Az előadások a következő témára: "Az IBM SPSS Statistics programrendszer"— Előadás másolata:

1 Az IBM SPSS Statistics programrendszer
Gazdaságinformatikus MSc

2 A termék nevének eredete
Statistical Package for Social Scientics Statistical Product and Service Solutions SPSS PASW IBM SPSS Statistics Ketskeméty László IBM SPSS Statistics

3 Ketskeméty László IBM SPSS Statistics
Ketskeméty László IBM SPSS Statistics

4 IBM SPSS Data Collection
IBM SPSS Statistics IBM SPSS Modeller Core System Statistics Base Statistics 13 Text Mining for Clementine Custom Tables Advanced Statistics Web Mining for Clementine Regression SPSS Server Exact Tests Predictive Claims Bootstapping Clementine Server SamplePower Predictive Call Center Categories SmartReader SmartViewer Web Server Forecasting Predictive Marketing Conjoint SPSS WebApp Framework Decision Trees IBM SPSS Deployment Neural Networks Report Writer Direct Marketing SamplePower Missing Values Predictive Enterprise Services Enterprise Manager Enterprise Repository Data Entry Data Preparation Amos Víz Designer Complex Samples Programmability Extension IBM SPSS Data Collection mrInterview mrPaper Desktop Author mrStudio mrDialer mrTranslate mrScan mrTables Desktop Reporter Ketskeméty László IBM SPSS Statistics Copyright 2010, SPSS Hungary. 4

5 Ketskeméty László IBM SPSS Statistics
Data View üzemmód Ketskeméty László IBM SPSS Statistics

6 Ketskeméty László IBM SPSS Statistics
Az adatmátrix Ketskeméty László IBM SPSS Statistics

7 Ketskeméty László IBM SPSS Statistics
A mátrix egy adott sora (esete) a többváltozós minta egy eleme Ketskeméty László IBM SPSS Statistics

8 Ketskeméty László IBM SPSS Statistics
A mátrix minden oszlopa (változója) statisztikai minta-realizáció, vagy egy idősor realizációja Ketskeméty László IBM SPSS Statistics

9 Ketskeméty László IBM SPSS Statistics
Ketskeméty László IBM SPSS Statistics

10 Ketskeméty László IBM SPSS Statistics
A Variable View üzemmód Ketskeméty László IBM SPSS Statistics

11 Ketskeméty László IBM SPSS Statistics
A változó típusa (type) Ketskeméty László IBM SPSS Statistics

12 Ketskeméty László IBM SPSS Statistics
A változó címkéje (label) Ketskeméty László IBM SPSS Statistics

13 Ketskeméty László IBM SPSS Statistics
Értékcímkék megadása I. Ketskeméty László IBM SPSS Statistics

14 Értékcímkék megadása II.
(value labels) Ketskeméty László IBM SPSS Statistics

15 Ketskeméty László IBM SPSS Statistics
Hiányzó adatok definiálása Ketskeméty László IBM SPSS Statistics

16 Ketskeméty László IBM SPSS Statistics
Hiányzó adatok definiálása Ketskeméty László IBM SPSS Statistics

17 Ketskeméty László IBM SPSS Statistics
A hiányzó adat I. Ketskeméty László IBM SPSS Statistics

18 Ketskeméty László IBM SPSS Statistics
A hiányzó adat II. Ketskeméty László IBM SPSS Statistics

19 Ketskeméty László IBM SPSS Statistics
Ketskeméty László IBM SPSS Statistics

20 Ketskeméty László IBM SPSS Statistics
Ketskeméty László IBM SPSS Statistics

21 Ketskeméty László IBM SPSS Statistics
A mérési szint I. Ketskeméty László IBM SPSS Statistics

22 Ketskeméty László IBM SPSS Statistics
Mérési szintek II. Ketskeméty László IBM SPSS Statistics

23 Ketskeméty László IBM SPSS Statistics
Ketskeméty László IBM SPSS Statistics

24 Ketskeméty László IBM SPSS Statistics
Ketskeméty László IBM SPSS Statistics

25 Ketskeméty László IBM SPSS Statistics
Adatok beolvasása: File/Open/Data Ketskeméty László IBM SPSS Statistics

26 Ketskeméty László IBM SPSS Statistics
Adatok beolvasása Ketskeméty László IBM SPSS Statistics

27 Ketskeméty László IBM SPSS Statistics
Adatok beolvasása Ketskeméty László IBM SPSS Statistics

28 Output szerkesztő ablak (Viewer)
Ketskeméty László IBM SPSS Statistics

29 Ketskeméty László IBM SPSS Statistics
Pozícionáló fa Ketskeméty László IBM SPSS Statistics

30 Ketskeméty László IBM SPSS Statistics
Output elemek  log Ketskeméty László IBM SPSS Statistics

31 Output elemek  diagrammok, ábrák
oszlopdiagramm boxplot-ábra tortadiagramm Ketskeméty László IBM SPSS Statistics

32 Output elemek  diagrammok, ábrák
szóródás ábra hisztogramm P-P grafikon Ketskeméty László IBM SPSS Statistics

33 Ketskeméty László IBM SPSS Statistics
Output elemek  táblázatok Jelentés a feldolgozott változókról Ketskeméty László IBM SPSS Statistics

34 Ketskeméty László IBM SPSS Statistics
Output elemek  táblázatok Kereszt-gyakoriság táblázat Ketskeméty László IBM SPSS Statistics

35 Ketskeméty László IBM SPSS Statistics
Output elemek  táblázatok Statisztikák listája Ketskeméty László IBM SPSS Statistics

36 Ketskeméty László IBM SPSS Statistics
Output elemek  táblázatok Gyakoriságtáblázat Ketskeméty László IBM SPSS Statistics

37 Ketskeméty László IBM SPSS Statistics
Az adatok rendezése Ketskeméty László IBM SPSS Statistics

38 Az adatok rendezése Rendezzük át az állományt a kor szerint növekvő sorrendbe! Ketskeméty László IBM SPSS Statistics

39 Az adatok rendezése Növekvő sorrendet állítunk be 2018.09.18.
Ketskeméty László IBM SPSS Statistics

40 Az adatok rendezése A legfiatalabb esettel kezdődik a felsorolás.
Ketskeméty László IBM SPSS Statistics

41 Új változók létrehozása
Új változó számítása (compute variable) Átkódolás (recode into same variable) Átkódolás más változóba (recode into different variable) Automatikus átkódolás (automatic recode) Kategorizálás (binning) Rangszámképzés (rank cases) Ketskeméty László IBM SPSS Statistics

42 Ketskeméty László IBM SPSS Statistics
Új változók számítása Ketskeméty László IBM SPSS Statistics

43 Ketskeméty László IBM SPSS Statistics
Kiszámítjuk az egy főre eső jövedelmet, ami egy új változó lesz (target variable). income= a családi jövedelem (ezer dollár) reside= az egy családban élők száma Ketskeméty László IBM SPSS Statistics

44 Ketskeméty László IBM SPSS Statistics
A kifejezés képletének megadásakor használhatjuk a kalkulátort és a változó listát. „Direktben” is megadhatjuk a képletet a klaviatúráról. Ketskeméty László IBM SPSS Statistics

45 Ketskeméty László IBM SPSS Statistics
A képletekhez függvényeket is felhasználhatunk egy listából. Ketskeméty László IBM SPSS Statistics

46 Ketskeméty László IBM SPSS Statistics
A kiszámításhoz feltételeket is beállíthatunk: csak azoknál az eseteknél számol, aminél a beállított feltétel „igaz” értéket vesz fel. Ketskeméty László IBM SPSS Statistics

47 Ketskeméty László IBM SPSS Statistics
Függvény csoportok • Arithmetic Functions • Statistical Functions • String Functions • String/Numeric Conversion Functions • Date and Time Functions • Random Variable and Distribution Functions • Missing Value Functions • Logical Functions • LAG Function • VALUELABEL Function Scoring Expressions (PASW Statistics Server) Ketskeméty László IBM SPSS Statistics

48 Átkódolás (recode into same variable)
Ketskeméty László IBM SPSS Statistics

49 Ketskeméty László IBM SPSS Statistics
Átkódolás (recode into same variable) Ketskeméty László IBM SPSS Statistics

50 Ketskeméty László IBM SPSS Statistics
Átkódolás (recode into same variable) Ketskeméty László IBM SPSS Statistics

51 Átkódolás más változóba
Ketskeméty László IBM SPSS Statistics

52 Ketskeméty László IBM SPSS Statistics
Átkódolás más változóba Ketskeméty László IBM SPSS Statistics

53 Ketskeméty László IBM SPSS Statistics
Átkódolás más változóba Ketskeméty László IBM SPSS Statistics

54 Automatikus átkódolás
Ketskeméty László IBM SPSS Statistics

55 Ketskeméty László IBM SPSS Statistics
Automatikus átkódolás Pl. 4  1 7  2 11  3 215  4 Ketskeméty László IBM SPSS Statistics

56 Kategorizálás (binning)
Ketskeméty László IBM SPSS Statistics

57 Ketskeméty László IBM SPSS Statistics
Kategorizálás (binning) Ketskeméty László IBM SPSS Statistics

58 Ketskeméty László IBM SPSS Statistics
Kategorizálás (binning) Ketskeméty László IBM SPSS Statistics

59 Ketskeméty László IBM SPSS Statistics
Kategorizálás (binning) Ketskeméty László IBM SPSS Statistics

60 Ketskeméty László IBM SPSS Statistics
Kategorizálás (binning) Ketskeméty László IBM SPSS Statistics

61 Ketskeméty László IBM SPSS Statistics
Rangszámképzés Ketskeméty László IBM SPSS Statistics

62 Ketskeméty László IBM SPSS Statistics
Rangszámképzés Ketskeméty László IBM SPSS Statistics

63 Ketskeméty László IBM SPSS Statistics
Rangszámképzés Ketskeméty László IBM SPSS Statistics

64 Ketskeméty László IBM SPSS Statistics
Rangszámképzés Ketskeméty László IBM SPSS Statistics

65 Az adatok szűrése

66 Nincs szűrés, mindegyik esettel számolni akarunk
Az adatok szűrése Nincs szűrés, mindegyik esettel számolni akarunk

67 Feltételtől függő szűrést aktivizálunk
Az adatok szűrése Feltételtől függő szűrést aktivizálunk

68 Csak a férfiak (m=male) eseteivel akarunk számolni
Az adatok feltételes szűrése Csak a férfiak (m=male) eseteivel akarunk számolni

69 Véletlentől függő szűrést aktivizálunk
Az adatok szűrése Véletlentől függő szűrést aktivizálunk

70 Az esetek véletlenszerűen kiválasztott negyedével akarunk foglalkozni
Az adatok véletlenszerű szűrése Az esetek véletlenszerűen kiválasztott negyedével akarunk foglalkozni

71 Az adatok csak egy kijelölt szeletét akarjuk vizsgálni
Az adatok szűrése Az adatok csak egy kijelölt szeletét akarjuk vizsgálni

72 Csak az 50. esettől a 250. esetig számolunk
Az adatok egy részének kijelölése Csak az 50. esettől a 250. esetig számolunk

73 Az adatok szűrése Szűrőváltozót alkalmazunk. Azokat az eseteket hagyjuk el, ahol a szűrőváltozó 0-s, vagy hiányzó adat.

74 Alul is kapunk figyelmeztetést, hogy az állományt szűrtük!
Az adatok szűrése Alul is kapunk figyelmeztetést, hogy az állományt szűrtük!

75 Csak szűrünk, de az adatok a mátrixban maradnak.
Az adatok szűrése Csak szűrünk, de az adatok a mátrixban maradnak.

76 A kiszűrt állományt elmenthetjük
Az adatok szűrése A kiszűrt állományt elmenthetjük

77 Az adatok szűrése A kiszelektált eseteket törölhetjük az adatmátrixból. Ezek az adatok elvesznek.

78 Leíró statisztikák lehívása

79 Leíró statisztikák lehívása
A diszkrét (kategória) változókat vegyük fel a listába! Gyakoriság táblázatot is kérünk. (Ez az alapértelmezett.)

80 Leíró statisztikák lehívása

81 A statisztikák táblázata

82 Gyakoriságtáblázat

83 Grafikonok kérése

84 Oszlopdiagramm

85 Tortadiagramm

86 A táblázatok beállítása

87 Folytonos változók esete
Elmenthetjük új változókba a standardizáltakat

88 Folytonos változók esete

89 Folytonos változók esete

90 Két új változó keletkezett, a standardizált változók

91 Az EXPLORE parancsdoboz

92 Az EXPLORE parancsdoboz

93 EXPLORE táblázatok

94 EXPLORE táblázatok

95 EXPLORE táblázatok

96 EXPLORE táblázatok

97 EXPLORE táblázatok

98 EXPLORE grafikonok hisztogrammok

99 EXPLORE grafikonok P-P grafikonok

100 EXPLORE grafikonok dobozdiagramm

101 Kereszttáblázat

102 Kereszttáblázat

103 Kereszttáblázat

104 Kereszttáblázat

105 Kereszttáblázat

106 Kereszttáblázat

107 Aránystatisztikák

108 Aránystatisztikák

109 Az adatok centrális helyzetét leíró statisztikák
mode a változó esetei közül a leggyakrabban előforduló érték. Ha több ilyen is van az adatban, azok közül a legkisebb. Ordinális és intervallum-skálás típusú adatoknál nem mindig van értelme. Tipikusan diszkrét változók centrumára jellemző statisztikáról van szó.

110 Az adatok centrális helyzetét leíró statisztikák

111 Az adatok centrális helyzetét leíró statisztikák

112 Az adatok centrális helyzetét leíró statisztikák

113 A szóródás mértékei

114 A szóródás mértékei

115 Ferdeség (skewness)

116 Csúcsosság (kurtosis)

117 Kvartilisek

118 Szár-és-levél ábra

119 Kontingencia-táblázat
crosstabulation (kontingencia-táblázat, kereszttábla) Ez egy olyan táblázat, amelynek sorai egy változó (a sorváltozó) értékeihez, az oszlopai egy másik változó (az oszlopváltozó) értékeihez tartoznak. A táblázat egy eleme (cellája) a megfelelő sorváltozó érték és oszlopváltozó érték együttes előfordulási gyakoriságát jelenti az adott mintában. Tehát ha az rxs -es táblázat (i,j) cellájában k érték van, az azt jelenti, hogy a mintában éppen k db olyan eset van, ahol a sorváltozó az értékkészletének i-edik, az oszlopváltozó pedig j-edik elemét veszi fel.

120 Kontingencia-táblázat
Két diszkrét (kategória) változó közötti összefüggés jellemzésére használt gyakoriság-táblázat: Az ij gyakiráság megmutatja, hogy az (yi, xj) párból hány van az adatmátrixban.

121 Kontingencia-táblázat
35 menedzser tanult 16 évig

122 Kontingencia-táblázat
Ennyi lenne a gyakoriság, ha a változók függetlenek lennének!

123 Kontingencia-táblázat
A sor % azt jelenti, hogy a tartalmazott gyakoriság a sor celláiban található össz-gyakoriság hány %-a. Az oszlop % a gyakoriságot a cellával egy oszlopban lévő gyakoriságösszeghez arányítja. A teljes % a cellagyakoriság és a mintanagyság hányadosa. A cellákban álló teljes %-ok összege a táblázatban 100%.

124 Kontingencia-táblázat
A menedzserek a 16 évig tanuló dolgozók 59,3%-át teszik ki (sor %) A menedzserek 41,7%-a tanul 16 évig (oszlop %) A teljes állomány 7,4 %-át teszik ki a 16 évig tanuló menedzserek teljes %)

125 Kontingencia-táblázat

126 Kontingencia-táblázat

127 Kontingencia-táblázat

128 2-próba Pearson-féle 2 -statisztika
a táblázat (i,j) cellájának gyakorisága,

129 2-próba A sor és oszlopváltozók nem lehetnek függetlenek a kicsi szignifikancia szint miatt

130 A többi teszt is elutasítja a függetlenséget!
Egyéb függetlenségi tesztek A többi teszt is elutasítja a függetlenséget!

131 Grafikus illeszkedésvizsgálat
A lehetséges eloszlások: béta, Chi-négyzet , exponenciális, gamma, fél-normális, Laplace, Logisztikus, Lognormál, normális, pareto, Student-féle t,, Weibull, és egyenletes. A P-P ábrán az elméleti eloszlásfüggvény és az empirikus eloszlásfüggvény van összehasonlítva. A Q-Q ábrán látható pontok vízszintes tengelyhez tartozó koordinátái a változó tapasztalati kvantilisei, a függőleges tengelyen pedig a tesztelt eloszlás kvantilisei állnak. A jó illeszkedés esetén a pontok közel szóródnak az ábrán meghúzott egyenes körül!

132 Grafikus illeszkedésvizsgálat

133 Grafikus illeszkedésvizsgálat

134 Grafikus illeszkedésvizsgálat

135 Grafikus illeszkedésvizsgálat

136 Grafikus illeszkedésvizsgálat

137 Grafikus illeszkedésvizsgálat

138 Illeszkedésvizsgálat próbával

139 Az illeszkedés nem fogadható el!
Illeszkedésvizsgálat próbával Az illeszkedés nem fogadható el!

140 A táblázatok formázása
Az eredeti, alapértelmezett formázású kereszttábla

141 Az egér jobb gombjával tehetjük szerkesztő módba a táblázatot.

142 A táblázatok formázása
A „gyári” beállításokat itt érjük el.

143 A táblázatok formázása
A listából kiválasztunk egy megfelelő formázatot.

144 A táblázatok formázása

145 A táblázatok formázása
A táblázat feliratait átírhatjuk

146 A grafikonok típusai

147 Oszlopdiagrammok Az egyszerű oszlopdiagrammok három típusa:
A: Summaries for groups of cases B: Summaries of separate variables C: Values of individual cases

148 Háztartási eszközök gyakoriságainak
A gépkocsi típusok gyakoriságai Háztartási eszközök gyakoriságainak összehasonlítása CD eladásai hetenként

149 Oszlopdiagrammok A csoportosított oszlopdiagrammoknak is három típusa van. A: Summaries for groups of cases B: Summaries os separate variables C: Values of individual cases

150 Oszlopdiagrammok Gépkocsi típusok gyakoriságai az alkalmazás
időtartama szerint A PC és PDA előfordulás összehasonlítása az alkalmazás időtartama szerint A CD reklámújságjainak heti száma és a webes letöltések heti száma

151 Oszlopdiagrammok A ragasztott oszlopdiagrammoknak is három típusa van.
A: Summaries for groups of cases B: Summaries os separate variables C: Values of individual cases

152 Oszlopdiagrammok Gépkocsi típusok az alkalmazás hosszának függvényében
A PC-k és PDA-ák összehasonlítása Az alkalmazás hossza szerint A szórólapok száma és a webes letöltések száma hetenként

153 3D oszlopdiagrammok

154 var1=salary, var2=salbegin, var3=jobcat szereposztásban
3D oszlopdiagrammok B tipusú grafikon, var1=salary, var2=salbegin, var3=jobcat szereposztásban

155 Vonaldiagrammok

156 Vonaldiagrammok A kilenc különböző vonalgrafikon típus, amit elő lehet állítani

157 Vonaldiagrammok A CD eladások hetenként

158 Terület diagrammok

159 Terület diagrammok A hat lehetséges terület grafikon tipus

160 Tortadiagrammok A három tortaábra tipus

161 Tortadiagrammok (pie charts)
A gépkocsi típusok összehasonlítása tortadiagrammon

162 Terjedelem ábrák

163 Terjedelem ábrák Az átlag és medián különbségek High-Low grafikon
a kezdőfizetés és a fizetés különbségének szemléltetésére beosztásonként Az átlag és medián különbségek grafikonja a fizetés és kezdőfizetés esetén, beosztások szerint

164 Terjedelem ábrák Terület-differencia ábrák három alaptípusa
Egyszerű oszlop-differencia ábratípusok

165 Dobozábrák

166 Dobozábrák Dobozábra alaptipusok

167 A dobozábra értelmezése

168 A fizetés és kezdeti fizetés dobozábrái beosztásonként

169 Populáció piramis ábra
Populáció-piramis grafikon Oszlopdiagrammok összekapcsolása Hisztogrammok összekapcsolása

170 Szóródás vagy pontfelhő ábrák

171 Szóródás vagy pontfelhő ábrák
Szóródás- és pontábrák

172 Mátrix szóródás ábrák

173 3D szóródás ábrák A gépkocsik súlya, fogyasztása és gyorsulása egy 3D pontdiagrammon

174 Hisztogrammok Az emberek koreloszlása a normális sűrűségfüggvénnyel

175 Hisztogrammok A fizetések hisztogramja exponenciális sűrűségfüggvénnyel

176 Hisztogrammok A fizetések hisztogrammjai beosztásonként
külön a nőknél és a férfiaknál haranggörbékkel


Letölteni ppt "Az IBM SPSS Statistics programrendszer"

Hasonló előadás


Google Hirdetések