Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Vargha András Eötvös Loránd Tudományegyetem Budapest, 2012

Hasonló előadás


Az előadások a következő témára: "Vargha András Eötvös Loránd Tudományegyetem Budapest, 2012"— Előadás másolata:

1 Vargha András Eötvös Loránd Tudományegyetem Budapest, 2012
STATISZTIKA Vargha András Eötvös Loránd Tudományegyetem Budapest, 2012

2 Kötelező irodalom a kurzushoz
Vargha András: Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal (2. kiadás). Pólya Kiadó, Budapest, 2007.

3 Nélkülözhetetlen szoftver a kurzushoz: ROPstat
Töltse le és próbálja ki a magyar nyelvű demó verziót!

4 A félév vázlata Statisztikai alapfogalmak, leíró statisztikák
A következtetési statisztika alapfogalmai Két független minta összehasonlítása Két összetartozó minta összehasonlítása Változók kapcsolatának vizsgálata Csoportok és változók összehasonlítása varianciaanalízissel Csoportok és változók sztochasztikus összehasonlítása Gyakorisági táblázatok elemzése

5 1. Statisztikai alapfogalmak, leíró statisztikák

6 Tartalom Statisztikai alapfogalmak (adatok, adattáblázat, esetek, változók) Populáció és minta Változók és típusaik Leíró statisztika alapfogalmai Középértékek és szóródási mutatók Standardizálás Normális eloszlás

7 Vágjunk bele!

8 Piaci szavak Tök Karalábé Paprika Lilahagyma Dinnye Padlizsán
Cukkini Sárgarépa Tök Paprika Dinnye Jégsaláta Póréhagyma

9 Memóriajáték

10 Írja be a füzetébe, hogy milyen szavak fordultak elő az iménti dián!

11 Mely szavakra emlékezett helyesen?
Karalábé Lilahagyma Padlizsán Cukkini Sárgarépa Tök Paprika Dinnye Jégsaláta Póréhagyma

12 Egy személlyel kapcsolatban mi érdekelhet bennünket?
Emlékezeti teljesítmény Helyesen megjegyzett szavak száma Más? Egyéb jellemzők Személy neme

13 Pszichológiai változók
Pszichológusok által vizsgált egyedek, személyek, házaspárok (megfigyelési egységek) egyedi jellemzői GYAK

14 Példák változókra (megfigyelési egység = egy házaspár)
Mióta házasok Mióta járnak együtt Férj életkora Feleség életkora Korkülönbség Gyerekeik száma IQ(férj) - IQ(feleség) GYAK

15 Más példák (megfigyelési egység = egy személy)
Nem Életkor MAWI-IQ Diagnózis Iskolázottsági szint Végzett osztályok száma GYAK

16 Mit várunk el egy pszichológiai változó meghatározásakor?
Egyértelműen definiált értékkészlet Minden esetnél egyértelműen eldönthető érték GYAK

17 Mi a statisztika? Akkor fordulunk hozzá, ha sok egyedünk van és mindenkit ugyanazon változó (vagy változók) segítségével jellemzünk

18 Emberek, gyümölcsök

19 Virágok

20 Kavicsok

21 A statisztika segítségével
Jellemezhetünk – leírhatunk – egy egész csoportot, mintát. Hogyan? Különböző csoportokat összehasonlít-hatunk (pl. férfiak és nők memóriája) Változók között összefüggéseket kereshetünk (pl. van-e kapcsolat a kor és az emlékezeti teljesítmény között?) Stb.

22 Hogy kell a statisztikai adatfeldolgozáshoz (elemzéshez) előkészíteni az adatokat?
Elsődlegesen egy személyek és változók szerint rendezett adattáblázatot (statisztikai adatállományt) kell létrehozni Ennek neve: eset-változó adattáblázat (adatmátrix) ROPstat illusztráció GYAK

23 Eset-változó adattáblázat
Nem (X1) Életkor (X2) Magasság (X3) 1. 18 170 2. Férfi 21 178 3. 19 155

24 Példák más adatállományokra

25 Pszichológia szakra jelentkezők, 1981

26 Gyerekek antropometriai adatai, 1993

27 Problémás és normál családok, 2005

28 A változóról Eseteket (személyeket stb.) jellemzi
Értékei vannak (pl. a személy neme változó értékei mik? Kor, testmagasság, szemszín, érettségi matek jegye értékei?) Ha egy változónak véges számú (2, 3, 4, …) különböző értéke van, diszkrét változónak nevezzük. Példa? Folytonos változók. Mi folytonos ezeknél? GYAK

29 Pszichometriai skálatípusok
Osztályozás szempontja: milyen logikai, illetve számtani műveletek végezhetők értelmesen a változó értékeivel? Nominális skála Ordinális skála Intervallum-skála Arányskála Példák: GYAK

30 Kvantitatív és kvalitatív változók
Nominális és ordinális skálájú változók Hangsúly: az értékek kategóriáján Kvantitatív változók Intervallum- és arányskálájú változók Hangsúly: az értékek nagyságán

31 A változók eloszlása Azt tudjuk meg a változó eloszlásából, hogy milyen értékből mennyi (% , darab) van. Ha ismerjük egy változó eloszlását, ebből már minden jellemzőjét (pl. az átlagot is) ki lehet számítani, illetve meg lehet határozni. GYAK

32

33 Hogy tetszik?

34

35

36

37 Az iskolai végzettség eloszlása
Alsófokú végzettség Középfokú végzettség Felsőfokú végzettség 29% 40% 31%

38 Statisztikai alapfogalmak
Megfigyelési egységek (esetek) személyek, egyedek, házaspárok Változók (megfigyelési egységek jellemzői) IQ, Nem, Kor, Megtanult tételek száma, Házasság időtartama Populáció (sokaság): esetek elvi (elméleti) összessége Minta: a populáció kiválasztott része

39 Populáció és minta A populáció nagyon nagy, ezért csak egy kis részét vizsgáljuk meg. Ez a MINTA (pl. 50 vagy 100 vagy 35 személy).

40 Minta Megfigyelési egységek csoportja, akiket bizonyos változók segítségével egy vizsgálat, kísérlet vagy megfigyelés során konkréten megvizsgálunk és adatokkal jellemzünk. E minta alapján nyert adatok együttese: az adatminta

41 Egy adatminta 1. Nő 18 170 2. Férfi 21 178 3. 19 155 személy Nem
Életkor Magasság 1. 18 170 2. Férfi 21 178 3. 19 155

42 Statisztikai elemzések két fő típusa
Leíró statisztika Fókusz a konkrét mintán: milyen ez a minta? (Pl. mi itt a fiúk és a lányok aránya?) Következtetési statisztika Következtetés a mintáról a populációra. Fókusz a populáción. (Pl. ha a minta 20%-a fiú, akkor mekkora lehet az arányuk a populációban? Kijelenthető-e, hogy a fiúk a populációban is kisebbségben vannak?)

43 Kiknek jobb a verbális memóriája, a fiúknak, vagy a lányoknak?

44 Leíró statisztika Milyen ez az évfolyam az emlékezeti vizsgálat változói szempontjából? Az elemzést lehet változónként, változópáronként, vagy ennél is bonyolultabb változómintázatok segítségével végezni. Nemi megoszlás Emlékezeti teljesítmény eloszlása

45 Leíró statisztikai elemzések
Gyakorisági eloszlás Középértékek Szóródási mutatók Az eloszlás alakja Ferdeség Csúcsosság GYAK

46 Az iskolázottság gyakorisági eloszlása (n = 277)
Érték Gyak % Kum% 3 1 0,4 11 18 6,5 41,2 4 2 0,7 1,1 12 68 24,5 65,7 5 2,2 13 9 3,2 69,0 6 20 7,2 9,4 14 5,1 74,0 7 1,8 11,2 15 74,4 8 47 17 28,2 16 36 87,4 28,9 32 11,6 98,9 10 5,8 34,7 100

47 Mi olvasható ki a gyakorisági eloszlásból?
Minimum, maximum Milyen értékből mennyi van? Relatív gyakoriság (százalékos) Milyen értékből van a legtöbb? (módusz) Kumulatív gyakoriság GYAK

48 Kvantilisek A mintát adott arányban két részre osztó pontok
Felezőpont: medián Negyedelő pontok: kvartilisek K1: alsó 25%-ot levágó osztópont K3: alsó 75%-ot levágó osztópont Percentilisek (centilisek): C1, C1, …, C100. Med = C50, K1 = C25, K3 = C75, GYAK

49 A kvantilisekről A kum% segítségével határozhatók meg a legkönnyebben.
Folytonos változók esetén lehet leginkább használni őket, mert a meghatározásuk itt a legtisztább. GYAK

50 14 12 10 8 6 50% 4 25% 2 25% K1 K3

51 Itt mi az alsó és a felső kvartilis?
Érték Gyak % Kum% 3 1 0,4 11 18 6,5 41,2 4 2 0,7 1,1 12 68 24,5 65,7 5 2,2 13 9 3,2 69,0 6 20 7,2 9,4 14 5,1 74,0 7 1,8 11,2 15 74,4 8 47 17 28,2 16 36 87,4 28,9 32 11,6 98,9 10 5,8 34,7 100 GYAK

52 Középértékek

53 Egy változó nagyságának jellemzése egyetlen adattal
Legtipikusabb érték: Módusz Eloszlás centruma: Átlag Eloszlás közepe: C50 = Medián

54 Medián = ? GYAK Érték Gyak % Kum% 3 1 0,4 11 18 6,5 41,2 4 2 0,7 1,1
3 1 0,4 11 18 6,5 41,2 4 2 0,7 1,1 12 68 24,5 65,7 5 2,2 13 9 3,2 69,0 6 20 7,2 9,4 14 5,1 74,0 7 1,8 11,2 15 74,4 8 47 17 28,2 16 36 87,4 28,9 32 11,6 98,9 10 5,8 34,7 100 GYAK

55 Mi az IQ mediánja? 70 85 100 115 130

56 Az IQ mediánja = 100 50% 50% 70 85 100 115 130

57 Mintajellemzők n-elemű minta: (x1, x2, x3, ..., xn)
Mintaátlag: x = (xi)/n = (x1+x2+x3+...+xn)/n Mintamedián: Adatok növekvő sorában a középső  vagy a középső kettő átlaga Minta: 2 < 4 < 5 < 7 < 8 Medián: M = 5

58 Férfiak és nők testsúlyátlagai különböző életkori szinteken
év

59 Szóródási mutatók

60 Miben különbözik az alábbi két minta?
4 5 6 2 4 5 6 8

61 Három bizonyítvány Magatartás 3 5 2 Szorgalom 3 1 4
Magyar irodalom 3 5 2 Magyar nyelvtan 3 1 4 Matematika Történelem ÁTLAG:

62 Mennyire szóródnak az adatok az átlag körül?
Átlagtól való négyzetes eltérés egyetlen személy esetén: Pl. IQ = 105 esetén (  = 25 IQ = 80 esetén (  = 400 Ezen négyzetes eltérések átlaga: variancia (Var) A variancia négyzetgyöke: szórás (s, s)

63 Mintabeli szóródási mutatók
Négyzetes összeg: Q = xi -x)2 Variancia (korrigált): Var = Q/(n - 1) Szórás = a variancia négyzetgyöke: s = Var = Q/(n-1) Szabadságfok: f = n - 1 GYAK

64 Szokásos jelölések Mintabeli (tapasztalati) átlag: x (ejtsd: x-vonás)
Populációbeli (elméleti) átlag: μ (ejtsd: mű) Mintabeli (tapasztalati) szórás: s Populációbeli (elméleti) szórás: σ (ejtsd: szigma)

65 Relatív szórás = Variációs együttható
Cél: dimenziómentes szóródási mutató Mintában: VE = s/x Populációban: VE = s/m Feltétel: X arányskálájú Pl.: Ha s = 3 kg, x = 5 kg, akkor VE = 3kg/5kg = 0,60 = 60% GYAK

66 Adatok nagysága Milyen nagy egy 210 cm-es testmagasság (150-es IQ, 160-as vérnyomás)? Milyen kicsi egy 145 cm-es testmagasság (65-ös IQ, 80-as vérnyomás)? GYAK

67 Standard érték Az X változó x értékének standard értéke (z) azt mutatja meg, hogy x hány szórásnyi távolságra van az átlagtól: z = (x – átlag)/szórás Pl. 10-es átlag és 2-es szórás esetén 15 z-értéke mennyi? A standard értékeknek mi a mértékegysége? GYAK

68 Standardizálás Mintában: zx = (x – x)/s
Mi lesz az átlag standard értéke? Mi lesz a standard értékek szórása? A nagy hibák standard értéke kiugróan nagy (vö. ROPstat)

69 Példák az IQ-val m = E(IQ) = 100, s = D(IQ) = 15 Ha IQ = 130, z = ?
Ha z = -1, IQ =? GYAK

70 Hogyan határozza meg az eloszlás alakját a ferdeség és a csúcsosság?

71 Szimmetrikus, átlagos csúcsosságú eloszlás

72 Szimmetrikus, átlagosnál nagyobb csúcsosságú eloszlás

73 Hogy nézhet ki egy átlagosnál kisebb csúcsosságú (pl. lapos) eloszlás?

74 Folytonos egyenletes eloszlás

75 Pozitív ferdeségű eloszlás

76 Negatív ferdeségű eloszlás

77 Szimmetrikus, kétcsúcsú (bimodális) eloszlás

78 Ferdeség és csúcsosság mérése
Ferdeségi együttható (skewness): E(z3) Csúcsossági együttható (kurtosis): E(z4) – 3 A normális eloszlás ferdeségi és csúcsossági együtthatója 0

79 A normális eloszlástípus

80

81 Milyen változó normális eloszlású?
Például a fejek száma dobásból Sok apró hasonló, de független mennyiség összegeződése Egy véletlen minta átlaga (vö. ROPstat) Kis minta? Nagy minta? GYAK

82 Változó: fejek száma 50 dobásból (gyakorisági eloszlás, n = 15000)

83 A normális eloszlás kiterjedtsége

84 A normális eloszlás kiterjedtsége
68%     95% 99,8%

85 Például  = 100 és  = 15 esetén 68% 95% 99,8%  70 85 100 115 130
2 99,8% 3 GYAK

86 Példák normális és nem normális eloszlású változókra
Hisztogram és kum% megtekintése az alábbi adatfájlok változóira Antr500.msw Új fájl 1000 esettel random normál változóval GYAK


Letölteni ppt "Vargha András Eötvös Loránd Tudományegyetem Budapest, 2012"

Hasonló előadás


Google Hirdetések