Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Vargha András Eötvös Loránd Tudományegyetem Budapest, 2012.

Hasonló előadás


Az előadások a következő témára: "Vargha András Eötvös Loránd Tudományegyetem Budapest, 2012."— Előadás másolata:

1 Vargha András Eötvös Loránd Tudományegyetem Budapest, 2012

2 2 Kötelező irodalom a kurzushoz Vargha András: Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal (2. kiadás). Pólya Kiadó, Budapest, 2007.

3 3 Nélkülözhetetlen szoftver a kurzushoz: ROPstat Töltse le és próbálja ki a magyar nyelvű demó verziót!

4 4 A félév vázlata 1) Statisztikai alapfogalmak, leíró statisztikák 2) A következtetési statisztika alapfogalmai 3) Két független minta összehasonlítása 4) Két összetartozó minta összehasonlítása 5) Változók kapcsolatának vizsgálata 6) Csoportok és változók összehasonlítása varianciaanalízissel 7) Csoportok és változók sztochasztikus összehasonlítása 8) Gyakorisági táblázatok elemzése

5 5 1. Statisztikai alapfogalmak, leíró statisztikák

6 6 Tartalom  Statisztikai alapfogalmak (adatok, adattáblázat, esetek, változók)  Populáció és minta  Változók és típusaik  Leíró statisztika alapfogalmai  Középértékek és szóródási mutatók  Standardizálás  Normális eloszlás

7 7 Vágjunk bele!

8 8 Piaci szavak  Karalábé  Lilahagyma  Padlizsán  Cukkini  Sárgarépa  Tök  Paprika  Dinnye  Jégsaláta  Póréhagyma

9 Memóriajáték

10 Írja be a füzetébe, hogy milyen szavak fordultak elő az iménti dián!

11 Mely szavakra emlékezett helyesen? 1.Karalábé 2.Lilahagyma 3.Padlizsán 4.Cukkini 5.Sárgarépa 6.Tök 7.Paprika 8.Dinnye 9.Jégsaláta 10. Póréhagyma

12 Egy személlyel kapcsolatban mi érdekelhet bennünket? Emlékezeti teljesítmény  Helyesen megjegyzett szavak száma  Más? Egyéb jellemzők  Személy neme  Más?

13 Pszichológiai változók Pszichológusok által vizsgált egyedek, személyek, házaspárok (megfigyelési egységek) egyedi jellemzői GYAK

14 Példák változókra (megfigyelési egység = egy házaspár) Mióta házasok Mióta járnak együtt Férj életkora Feleség életkora Korkülönbség Gyerekeik száma IQ(férj) - IQ(feleség) GYAK

15 Más példák (megfigyelési egység = egy személy) Nem Életkor MAWI-IQ Diagnózis Iskolázottsági szint Végzett osztályok száma GYAK

16 Mit várunk el egy pszichológiai változó meghatározásakor? Egyértelműen definiált értékkészlet Minden esetnél egyértelműen eldönthető érték GYAK

17 Mi a statisztika? Akkor fordulunk hozzá, ha sok egyedünk van és mindenkit ugyanazon változó (vagy változók) segítségével jellemzünk

18 Emberek, gyümölcsök

19 Virágok

20 Kavicsok

21 A statisztika segítségével Jellemezhetünk – leírhatunk – egy egész csoportot, mintát. Hogyan? Különböző csoportokat összehasonlít- hatunk (pl. férfiak és nők memóriája) Változók között összefüggéseket kereshetünk (pl. van-e kapcsolat a kor és az emlékezeti teljesítmény között?) Stb.

22 Hogy kell a statisztikai adatfeldolgozáshoz (elemzéshez) előkészíteni az adatokat? Elsődlegesen egy személyek és változók szerint rendezett adattáblázatot (statisztikai adatállományt) kell létrehozni Ennek neve: eset-változó adattáblázat (adatmátrix) ROPstat illusztráció GYAK

23 23 Eset-változó adattáblázat Eset Nem ( X 1 ) Életkor ( X 2 ) Magasság ( X 3 ) … 1.Nő Férfi Nő19155 …

24 Példák más adatállományokra

25 25 Pszichológia szakra jelentkezők, 1981

26 26 Gyerekek antropometriai adatai, 1993

27 27 Problémás és normál családok, 2005

28 A változóról Eseteket (személyeket stb.) jellemzi Értékei vannak (pl. a személy neme változó értékei mik? Kor, testmagasság, szemszín, érettségi matek jegye értékei?) Ha egy változónak véges számú (2, 3, 4, …) különböző értéke van, diszkrét változónak nevezzük. Példa? Folytonos változók. Mi folytonos ezeknél? GYAK

29 29 Pszichometriai skálatípusok  Osztályozás szempontja: milyen logikai, illetve számtani műveletek végezhetők értelmesen a változó értékeivel?  Nominális skála  Ordinális skála  Intervallum-skála  Arányskála l Példák: GYAK

30 30 Kvantitatív és kvalitatív változók Kvalitatív változók l Nominális és ordinális skálájú változók –Hangsúly: az értékek kategóriáján Kvantitatív változók l Intervallum- és arányskálájú változók –Hangsúly: az értékek nagyságán

31 31 A változók eloszlása Azt tudjuk meg a változó eloszlásából, hogy milyen értékből mennyi (%, darab) van. Ha ismerjük egy változó eloszlását, ebből már minden jellemzőjét (pl. az átlagot is) ki lehet számítani, illetve meg lehet határozni. GYAK

32 32

33 33 Hogy tetszik?

34 34

35 35

36 36

37 37 Az iskolai végzettség eloszlása Alsófokú végzettség Középfokú végzettség Felsőfokú végzettség 29%40%31%

38 38 Statisztikai alapfogalmak o Megfigyelési egységek (esetek) –személyek, egyedek, házaspárok o Változók (megfigyelési egységek jellemzői) –IQ, Nem, Kor, Megtanult tételek száma, Házasság időtartama o Populáció (sokaság): esetek elvi (elméleti) összessége o Minta: a populáció kiválasztott része

39 39 Populáció és minta o A populáció nagyon nagy, ezért csak egy kis részét vizsgáljuk meg. Ez a MINTA (pl. 50 vagy 100 vagy 35 személy).

40 40 Minta o Megfigyelési egységek csoportja, akiket bizonyos változók segítségével egy vizsgálat, kísérlet vagy megfigyelés során konkréten megvizsgálunk és adatokkal jellemzünk. o E minta alapján nyert adatok együttese: az adatminta

41 41 Egy adatminta személy NemÉletkor Magasság … 1.Nő Férfi Nő19155 …

42 42 Statisztikai elemzések két fő típusa Leíró statisztika oFókusz a konkrét mintán: milyen ez a minta? (Pl. mi itt a fiúk és a lányok aránya?) Következtetési statisztika oKövetkeztetés a mintáról a populációra. Fókusz a populáción. (Pl. ha a minta 20%-a fiú, akkor mekkora lehet az arányuk a populációban? Kijelenthető-e, hogy a fiúk a populációban is kisebbségben vannak?)

43 Kiknek jobb a verbális memóriája, a fiúknak, vagy a lányoknak?

44 44 Leíró statisztika o Milyen ez az évfolyam az emlékezeti vizsgálat változói szempontjából? o Az elemzést lehet változónként, változópáronként, vagy ennél is bonyolultabb változómintázatok segítségével végezni. oNemi megoszlás oEmlékezeti teljesítmény eloszlása

45 45 Leíró statisztikai elemzések o Gyakorisági eloszlás o Középértékek o Szóródási mutatók o Az eloszlás alakja oFerdeség oCsúcsosság GYAK

46 46 ÉrtékGyak%Kum% ÉrtékGyak%Kum% 310, ,541,2 420,71, ,565,7 531,12,2 1393,269,0 6207,29,4 14 5,174,0 751,811,2 1510,474, , ,4 920,728, ,698, ,834,7 1831,1100 Az iskolázottság gyakorisági eloszlása (n = 277)

47 47 Mi olvasható ki a gyakorisági eloszlásból? o Minimum, maximum o Milyen értékből mennyi van? o Relatív gyakoriság (százalékos) o Milyen értékből van a legtöbb? (módusz) o Kumulatív gyakoriság GYAK

48 48 Kvantilisek l A mintát adott arányban két részre osztó pontok –Felezőpont: medián –Negyedelő pontok: kvartilisek –K 1 : alsó 25%-ot levágó osztópont –K 3 : alsó 75%-ot levágó osztópont  Percentilisek (centilisek): C 1, C 1, …, C Med = C 50, K 1 = C 25, K 3 = C 75, GYAK

49 49 A kvantilisekről l A kum% segítségével határozhatók meg a legkönnyebben. l Folytonos változók esetén lehet leginkább használni őket, mert a meghatározásuk itt a legtisztább. GYAK

50 % K3K3 K1K1 50% 25%

51 51 ÉrtékGyak%Kum% ÉrtékGyak%Kum% 310, ,541,2 420,71, ,565,7 531,12,2 1393,269,0 6207,29,4 14 5,174,0 751,811,2 1510,474, , ,4 920,728, ,698, ,834,7 1831,1100 Itt mi az alsó és a felső kvartilis? GYAK

52 52 Középértékek

53 53 Egy változó nagyságának jellemzése egyetlen adattal l Legtipikusabb érték: Módusz l Eloszlás centruma: Átlag l Eloszlás közepe: C 50 = Medián

54 54 ÉrtékGyak%Kum% ÉrtékGyak%Kum% 310, ,541,2 420,71, ,565,7 531,12,2 1393,269,0 6207,29,4 14 5,174,0 751,811,2 1510,474, , ,4 920,728, ,698, ,834,7 1831,1100 Medián = ? GYAK

55 55 Mi az IQ mediánja? 

56 56 Az IQ mediánja = 100  50%

57 57 Mintajellemzők n-elemű minta: (x 1, x 2, x 3,..., x n ) Mintaátlag: x = (  x i )/n = (x 1 +x 2 +x x n )/n Mintamedián: Adatok növekvő sorában a középső  vagy a középső kettő átlaga Minta: 2 < 4 < 5 < 7 < 8 Medián: M = 5

58 58 Férfiak és nők testsúlyátlagai különböző életkori szinteken év

59 59 Szóródási mutatók

60 60 Miben különbözik az alábbi két minta?

61 61 Három bizonyítvány –Magatartás352 –Szorgalom314 –Magyar irodalom352 –Magyar nyelvtan314 –Matematika352 –Történelem314 –ÁTLAG:333

62 62 Mennyire szóródnak az adatok az átlag körül? Átlagtól való négyzetes eltérés egyetlen személy esetén: –Pl. IQ = 105 esetén (105 -    –IQ = 80 esetén (80 -    l Ezen négyzetes eltérések átlaga: variancia (Var) A variancia négyzetgyöke: szórás ( , s)

63 63 Mintabeli szóródási mutatók Négyzetes összeg: Q =  x i -x ) 2 Variancia (korrigált): Var = Q/(n - 1) Szórás = a variancia négyzetgyöke: s = Var = Q/(n-1) –Szabadságfok: f = n - 1 GYAK

64 64 Szokásos jelölések l Mintabeli (tapasztalati) átlag: x (ejtsd: x-vonás) l Populációbeli (elméleti) átlag: μ (ejtsd: mű) l Mintabeli (tapasztalati) szórás: s l Populációbeli (elméleti) szórás: σ (ejtsd: szigma)

65 65 Relatív szórás = Variációs együttható l Cél: dimenziómentes szóródási mutató l Mintában: VE = s/x Populációban: VE =  /  l Feltétel: X arányskálájú l Pl.: Ha s = 3 kg, x = 5 kg, akkor VE = 3kg/5kg = 0,60 = 60% GYAK

66 66 Adatok nagysága l Milyen nagy egy 210 cm-es testmagasság (150-es IQ, 160-as vérnyomás)? l Milyen kicsi egy 145 cm-es testmagasság (65-ös IQ, 80-as vérnyomás)? GYAK

67 67 Standard érték  Az X változó x értékének standard értéke (z) azt mutatja meg, hogy x hány szórásnyi távolságra van az átlagtól: z = (x – átlag)/szórás  Pl. 10-es átlag és 2-es szórás esetén 15 z-értéke mennyi?  A standard értékeknek mi a mértékegysége? GYAK

68 68 Standardizálás  Mintában: z x = (x – x)/s  Mi lesz az átlag standard értéke?  Mi lesz a standard értékek szórása?  A nagy hibák standard értéke kiugróan nagy (vö. ROPstat)

69 69 Példák az IQ-val  = E(IQ) = 100,  = D(IQ) = 15  Ha IQ = 130, z = ?  Ha z = - 1, IQ =? GYAK

70 70 Hogyan határozza meg az eloszlás alakját a ferdeség és a csúcsosság?

71 71 Szimmetrikus, átlagos csúcsosságú eloszlás

72 72 Szimmetrikus, átlagosnál nagyobb csúcsosságú eloszlás

73 73 Hogy nézhet ki egy átlagosnál kisebb csúcsosságú (pl. lapos) eloszlás? ?

74 74 Folytonos egyenletes eloszlás

75 75 Pozitív ferdeségű eloszlás

76 76 Negatív ferdeségű eloszlás

77 77 Szimmetrikus, kétcsúcsú (bimodális) eloszlás

78 78 Ferdeség és csúcsosság mérése  Ferdeségi együttható (skewness): E(z 3 )  Csúcsossági együttható (kurtosis): E(z 4 ) – 3  A normális eloszlás ferdeségi és csúcsossági együtthatója 0

79 79 A normális eloszlástípus

80 80

81 81 Milyen változó normális eloszlású?  Például a fejek száma dobásból  Sok apró hasonló, de független mennyiség összegeződése  Egy véletlen minta átlaga (vö. ROPstat)  Kis minta?  Nagy minta? GYAK

82 82 Változó: fejek száma 50 dobásból (gyakorisági eloszlás, n = 15000)

83 83 A normális eloszlás kiterjedtsége

84 84     A normális eloszlás kiterjedtsége  68% 95% 99,8%

85 85     Például  = 100 és  = 15 esetén  68% 95% 99,8%    GYAK

86 86 Példák normális és nem normális eloszlású változókra Hisztogram és kum% megtekintése az alábbi adatfájlok változóira  Antr500.msw  Új fájl 1000 esettel random normál változóval GYAK


Letölteni ppt "Vargha András Eötvös Loránd Tudományegyetem Budapest, 2012."

Hasonló előadás


Google Hirdetések