Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Általános statisztika I.

Hasonló előadás


Az előadások a következő témára: "Általános statisztika I."— Előadás másolata:

1 Általános statisztika I.

2 Felvezető kérdések Hétköznapi ember szerint mivel foglalkozik a statisztika? Hol találkozhatunk statisztikával? Miért fontos a statisztika?

3 Felvezető gondolatok „Az adat az új olaj”
„Az adathalmaz változtassa meg a gondolkodásmódodat!” Hogyan lehet az adatot életre kelteni?

4 Célok Becslések Előrejelzések Klasszifikáció Szegmentálás
Leírás - következtetés

5 Segédanyagok Jegyzet Képletgyűjtemény Coospace
Internetes segédanyagok:

6 Elérhetőség

7 Számonkérés Gyakorlat: 2 zh+4 kis dolgozat Előadás
ütemezés: ld. Coospace Összevont zh, javító zh: 1. vizsgahét Gyak. UV: 2. vizsgahét Előadás Írásbeli vizsga

8 Bevezetés, tippek Ea-gyak kapcsolata
Statisztika-más tárgyak kapcsolata Informatika és statisztika Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! Dia, előadásanyagok≠tananyag Dia ~ kisiskolás foglalkoztató füzet (kiegészíted, felhasználod)

9 Célok Statisztikai jártasság fejlesztése Konkrét probléma esetén
Ismerd fel a statisztika alkalmazhatóságát Tudd milyen statisztikai eszközt használhatsz, illetve ennek hol nézhetsz utána A kapott eredményeket helyesen tudd értelmezni, felhasználni

10 Témakörök 1. félév bevezető félév 2. félév Alapfogalmak
Leíró statisztika Összehasonlító statisztika Idősorok vizsgálata 2. félév Mintavétel, induktív statisztika Kapcsolatvizsgálat, Magyarázó modellek

11 Alapfogalmak

12 Mi a statisztika? A statisztika tömegesen előforduló jelenségek számszerű leírásával foglalkozó gyakorlati tevékenység és tudományos módszertan. Gyakorlati tevékenység: információk gyűjtése, feldolgozása, közzététele. Tudományos módszertan általános statisztika: statisztikai fogalmak, módszerek ismerete. szakstatisztikák: speciális ismeretek információ gyűjtés, feldolgozás módszertani ismeretei. Statisztika és a többi tudományterület kapcsolata: „Se veled, se nélküled”

13 Mit szeretnénk? (ki, miért, hogyan?
Adatokat információkat gyűjteni valamiről, valakikről Mire van szükségünk? Kiket kérdezzünk meg, figyeljünk meg? Hogyan gyűjtsünk adatokat? Mire vonatkozóan gyűjtsünk adatokat? A begyűjtött adatokat rendszerezni kell Mit szeretnénk vizsgálni? Ez miből látható? Hogyan rendszerezzünk? Mi az ami informatív? Közzététel Ki a célcsoport? Mit szeretnénk megmutatni? Előzetes tervezés szükséges a vizsgálati kérdésnek megfelelően!

14 A statisztikai munka fázisai
Tervezés Mi a statisztikai feladat? Mit mérünk? Ki a célcsoport? Hogyan szerzünk adatokat? Kiket? Mivel? Adatfelvétel Adatátvétel? Megfigyelés? Teljes körű? Részleges? (reprezentatív?) Elemi adatok ellenőrzése, feldolgozása Elemzés Tájékoztatás, visszacsatolás A statisztikai munka fázisai Kiindulópont: igény, vizsgálati kérdés

15 Sokaságok A megfigyelt egységek, egyedek összességét statisztikai sokaságnak nevezzük.

16 Sokaságok nyilvántartása: regiszterek
Egy adott sokaságba tartozó azonosítható egyedek rendszerezett listája, az egyedek főbb paramétereivel. Pl. Népesség-nyilvántartás Gazdasági szervezetek regisztere Kiskereskedelmi regiszter Gépjármű-nyilvántartás Föld-nyilvántartás

17

18 Ismérvek Az egyedek tulajdonságait ismérveknek nevezzük.
Ismérvek típusai: területi ismérv: az egyedek térbeli jellemzői. időbeli ismérv: az egyedek időbeli jellemzői. mennyiségi ismérvek: az egyedek számszerű, mérhető jellemzői. minőségi ismérv:az egyedek számszerűen nem mérhető jellemzői.

19 Ismérvek értékkészlete
Ismérvváltozatok: ismérvek lehetséges kimenetelei (értékkészlet) többféle lehet csoportosítható Például: Nem: férfi, nő testtömeg 1,2,3,…,50,….kg -10; 11-20; 21-30, …

20 Ismérvek mérési szintje
Nominális Ordinális Intervallumskála Arányskála Ismérvváltozatok csak megkülönbözethetőek Ismérvváltozatok megkülönbözethetőek és rendezhetőek Különbségképzés értelmezhető Különbségképzés és hányados-képzés is értelmezhető A mérési szint fogja meghatározni, hogy milyen eljárással vizsgálhatunk egy-egy változót!

21 Mi a statisztikai adat? (Bo Sundgren )
(db,sum,átlag, stb.) Műveletek Statisztikai adat: egy sokaság számszerű jellemzője

22 Statisztikai adattábla (row data)

23 Statisztikai adatok közlésekor
Meg kell adni a megfigyelés egység és adott sokaságának megnevezését a mért tulajdonságának, ismérvének megnevezését annak értékét valamilyen mértékegységben A vonatkozási időpontot vagy időszakot.

24

25 A statisztikai adatokkal szemben három követelményt támasztunk.
Pontosság Gyorsaság Gazdaságosság Nem mintavételi hibák

26 Néhány főbb statisztikai adatforrás
KSH EUROSTAT OECD Worldbank Minisztériumok, MNB

27 Adatok összehasonlításának lehetőségei
Különbségképzés Mértékegységtartó Hányados-képzés: indexszám (viszonyszám) Azonos mértékegységű adatoknál: % Különböző mértékegységű adatoknál új egység: (Kg/fő; ezer Ft/óra) Probléma: Százalék vagy százalékpont? Példa

28 Statisztikai adatok közlése és ábrázolása
Cél: Információtömörítés, adatok, mutatószámok tömör megjelenítése Alapja: Ismérvek Eszköz: Statisztikai táblák (statisztikai adatok valamilyen felsorolása) Táblázatok (speciális eset: statisztikai sor) Grafikus ábrák

29 Fontosság Tor Norretranders modellje:

30 Történeti kitekintés

31 Adatvizualizáció (1) Vizualizáció: olyan eljárás, amelyek képek, diagramok, animációk készítésével üzeneteket közvetít. Adatvizualizáció: adatok képi, grafikus megjelenítése. Segít az adatok felfedezésében, döntéshozatalban. Információ vizualizáció: absztrakt adatok (interaktív) vizuális reprezentációja a megismerés elősegítésére. Speciális területe: vizuálanalitika

32 Adatvizualizáció (2) Érzékelés „optimalizálása” (pld. Színek, ikonok)
Új adatforrások Új eszközök, hatékony megjelenítés?

33 Táblázatok készítése ismérvek alapján
Lajstrom vagy a statisztikai sokaságot alkotó egyedek csoportosítását végezzük el. Követelmények 1.       Az osztályozás teljes legyen. 2.       Az osztályozás átfedés mentes legyen. 3. Homogenitás

34 Magyarország fontosabb adatai
Népességszám (ezer fő) január 1. 9 798 Fogyasztóiár-index (infláció) előző év azonos időszaka=100,0%) év 100,4 Munkanélküliségi ráta 2016, % 5,1 GDP (előző év =100,0%) 2016 102,0 Példák lajstrom Magyarország fontosabb adatai Forrás: letöltve:

35 Áruszállítás a forgalom jellege szerint 2000-ben
Osztályozás Példák Áruszállítás a forgalom jellege szerint 2000-ben Forrás: Magyar Statisztikai Zsebkönyv o. Megnevezés Szállított áruk tömege, ezer tonna Vasút 48 994 Közút Vízi 2 433 Légi 22 Csővezetékes 22 351 Összesen

36 Statisztikai táblák készítésének formai követelményei
Cím Oszlopok, sorok feliratai, mértékegységek Összesen Forrás Megjegyzések Kérdés Kategóriák sorrendje?

37 Fizetési kategória, ezer Ft
Példák Egy termelő vállalat munkavállalói létszáma júniusában fizetési kategóriák szerint Fizetési kategória, ezer Ft Létszám, fő – 50 20 50,1 – 80 85 80,1 – 120 24 120,1 – 200 8 200,1 – 3 Összesen 140 Forrás: fiktív adatok

38 Speciális sor: idősor Idősorok esetében valamilyen időbeli ismérv alapján kerülnek rendezésre, felsorolásra a sokaság egyedei. Az idősoroknak két fajtája van. állapotidősor, tartamidősor.

39 Vállalkozások száma, db
Idősor Állapotidősor Külföldi érdekeltségű vállalkozások számának alakulása ( ) Forrás: portal.ksh.hu Tartamidősor A kukoricatermelés alakulása Magyarországon ( ) Forrás:portal.ksh.hu Év Termelés, ezer tonna 2001 7858 2002 6121 2003 4532 2004 8332 2005 9050 2006 8282 Összesen 44175 Év Vállalkozások száma, db 2002 26796 2003 26793 2004 26475 2005 26019 2006 25800

40 A vásárlás gyakorisága hetente vagy gyakrabban
Példák A pezsgővásárlás gyakorisága lakóhely szerinti bontásban egy piackutatás adatai alapján (2009), fő Lakóhely A vásárlás gyakorisága Összesen hetente vagy gyakrabban havonta évente néhányszor ritkábban Budapest 25 32 106 17 180 Város 20 28 140 12 200 Község 15 79 14 120 57 75 325 43 500 Forrás: fiktív adatok

41 Statisztikai ábrák Pontdiagram Vonaldiagram Síkdiagramok:
oszlop diagram, hisztogram osztott oszlop diagram kör diagram Térbeli diagramok Piktogramok Kartogramok „Újabb diagramok”

42 Problémák - Elvárások (1)
sok adatot kell kis területen megjeleníteni az adatot életre kell kelteni szakszerű, de érthető legyen az ábrázolás megfelelő ábratípus nincs felesleges információ Megfelelő dizájn Adattörténet Felhasználó mit ért meg? Big data mi információ, mi nem?

43 Problémák - Elvárások (2)
Az ábrának áttekinthetőnek célorientáltnak és homogénnek egyszerűnek, könnyen értelmezhetőnek, rekonstruálhatónak optikailag semlegesnek kell lennie.

44 Elvárások - trendek Mobil, új platformok Interaktivitás Real time
Story teller Integráció 3D Kognitív ismeretek Geoadatok

45 Nappali tagozat átlagos feltöltöttsége felsőoktatási intézményekben
Forrás: saját szerkesztés

46 A 18-49 éves korcsoport megoszlása a 19. 00-22
A éves korcsoport megoszlása a között nézett TV csatorna szerint ) Forrás: R-time

47 Forrás: saját szerkesztés

48 Radar

49 Oszlop

50 Jelentkezők és felvettek száma országosan a gazdaságtudományok képzési terület alapszakjain (2010)
Forrás: saját szerkesztés

51 Szalag (sáv)

52 Kör

53 Piktogram Egy hizlalda sertésállománya (2011.09.01)
1 egység=1000 sertés Forrás: fiktív

54 Kartogram Magyarország hő térképe ( :00) °C Forrás: OMSZ

55 Forrás: Eurostat

56 Statisztikai ábrák formai követelményei
Cím Mértékegység Felirat Arányosság Egységek

57 Érdekességek Vizualizáció szerepe Infograf
Művészet:

58 Hálózatok ábrázolása

59 Mosaic plot John Hartigan, Beat Kleiner: Mosaics for contingency tables. In: Computer Science and Statistics: Proceedings of the 13th Symposium on the Interface. 1981, S. 268– 273.

60 Tableplots Unwin kutatócsoport (2006)
Tannekes et al. Visulizing and Inspecting Large datasets with tableplots Jornal of Data science 11(2013)

61

62 A világ félelem térképe

63

64 Gapminder World http://www.gapminder.org/world/

65 Regional Statistics Illustrated http://ec. europa

66 Hivatalos statisztika (1)

67 Hivatalos statisztika (3)

68 Hivatalos statisztika (4)

69 Google

70 Hibás Ábrázolások

71 Proportional Perceive

72

73

74 Source: http://www.datapine.com/blog/misleading-statistics-and-data/

75

76

77 Pie charts (1) Source: https://en.wikipedia.org/wiki/Misleading_graph
In the misleading pie chart, Item C appears to be at least as large as Item A, whereas in actuality, it is less than half as large. Source:

78

79 pICTOGRAMS Source: https://en.wikipedia.org/wiki/Misleading_graph
When using pictograms in bar graphs, they should not be scaled uniformly, as this creates a perceptually misleading comparison.[12] The area of the pictogram is interpreted instead of only its height or width.[13] This causes the scaling to make the difference appear to be squared.[13] In the improperly scaled pictogram bar graph, the image for B is actually 9 times as large as A. Source:

80 Wordcloud A greedy algorithm is an algorithmic paradigm that follows the problem solving heuristic of making the locally optimal choice at each stage with the hope of finding a global optimum. Illusion preception Source : Source: Steele & Noah: Beautiful Visualization, O Reilly, 2010 Source :


Letölteni ppt "Általános statisztika I."

Hasonló előadás


Google Hirdetések