Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

TÁRSADALOMSTATISZTIKA Előadó: Csákó Mihály egyetemi docens 30 kontaktóra + 60 egyéni munkaóra = 3 kredit (Levelező: 12 kontakt + 78 egyéni munkaóra) A.

Hasonló előadás


Az előadások a következő témára: "TÁRSADALOMSTATISZTIKA Előadó: Csákó Mihály egyetemi docens 30 kontaktóra + 60 egyéni munkaóra = 3 kredit (Levelező: 12 kontakt + 78 egyéni munkaóra) A."— Előadás másolata:

1 TÁRSADALOMSTATISZTIKA Előadó: Csákó Mihály egyetemi docens 30 kontaktóra + 60 egyéni munkaóra = 3 kredit (Levelező: 12 kontakt + 78 egyéni munkaóra) A jegyzet-rovatot is érdemes figyelni!!! Wesley János Lelkészképző Főiskola Pedagógia alapszak, I. évfolyam

2 WJLF Pedagógia BACsákó M.: Társadalomstatisztika2 Az előadások beosztása: 1. Mi a statisztika és mire jó? A kurzus célja 2. Adatgyűjtés és ábrázolás: a hisztogram 3. Csoportok jellemzése: középértékek 4. Csoportok szóródása: a szórás 5. A normálgörbe 6. A normális közelítés módszere 7. Két változó kapcsolata: varianciaelemzés 8. Két változó kapcsolata: korreláció 9. Két változó kapcsolata: regresszió 10. Statisztikai következtetés: mintavétel 11. Valószínűségszámítás 12. Megbízhatósági próbák, szignifikancia

3 WJLF Pedagógia BACsákó M.: Társadalomstatisztika3 Számolási gyakorlat Ránézésre becsüljék meg a következő számokat %-ban! (Kb. 1%,10%, 50% …?) 99 a 407-ből? 57 a 209-ből? 99 a 197-ből? 39 a 398-ból? Ezek kb. a legnehezebb számolási feladatok amelyek előfordulhatnak a félév során.

4 WJLF Pedagógia BACsákó M.: Társadalomstatisztika4 Az igazság keresése: a kenyérfogyasztás példája 1. A büntetés-végrehajtási intézetekben fogva tartott elítéltek több mint 98 %-a kenyérfogyasztó. 2. A kenyérfogyasztó családokban felnövekedő gyermekek 50 %-a a standardizált teszteket átlag alatti eredménnyel teljesíti. 3. A XVIII. században, amikor gyakorlatilag minden kenyér otthon, a háztartásban készült, az átlag- életkor nem érte el az 50 évet, a csecsemőhalandó- ság elfogadhatatlanul magas volt, sok nő belehalt a szülésbe, és a lakosságot olyan járványok tizedel- ték, mint a tífusz, a sárgaláz és az influenza.

5 WJLF Pedagógia BACsákó M.: Társadalomstatisztika5 Az igazság keresése: a kenyérfogyasztás példája 4. Az erőszakos bűncselekmények több mint 90 %-át kenyérfogyasztás után 24 órán belül követik el. 5. A kenyér alapanyaga a tésztának nevezett szub- sztancia. Kísérletek során bebizonyosodott: ebből az anyagból néhány dekagramm elég, hogy egy egér megfulladjon tőle. Az átlag magyar ennek sokszorosát fogyasztja el egy hónap alatt! 6. A primitív törzsi társadalmakban, ahol a kenyér- fogyasztás ismeretlen, évszázadok óta feltűnően kevés rákos megbetegedést, Alzheimer-és Par- kinson-kóros, csontritkulásos esetet jegyeztek fel.

6 WJLF Pedagógia BACsákó M.: Társadalomstatisztika6 Az igazság keresése: a kenyérfogyasztás példája 7. A kenyér bizonyítottan addiktív. Kísérleti alanyok, akiktől egy időre megvonták, és csak vízzel táplálták őket, alig 2 nap elteltével már kenyérért könyörögtek. 8. A kenyérfogyasztás sok esetben csak előkészítője a "keményebb" élelmiszerek, mint például a vaj, lekvár, méz fogyasztásának. 9. A kenyérről bebizonyosodott, hogy magába szívja a vizet. Mivel az emberi testet több mint 90%-ban víz alkotja, a huzamos kenyérfogyasztás beláthatatlan következményekkel járhat a szervezet molekuláris összetételében.

7 WJLF Pedagógia BACsákó M.: Társadalomstatisztika7 Az igazság keresése: a kenyérfogyasztás példája 10. Az újszülöttek köhögnek a kenyértől. 11. A kenyeret 200 Celsius-fok körüli hőmérsékleten sütik. Ez a hőmérséklet nem egészen egy perc alatt elpusztít egy felnőtt embert. 12. A legtöbb kenyérfogyasztó képtelen megkülönböztetni a tudományos tényeket a statisztika álruhájába burkolt, értelmetlen locsogástól.

8 WJLF Pedagógia BACsákó M.: Társadalomstatisztika8 Találkozásaink a statisztikával: hétköznapi tapasztalatok Népszámlálás Az európai népesség öregedése A magyar népesség fogyása A cigány gyerekek iskolázottsága Éves iskolai statisztikai jelentés A levegő hőmérsékletének sokévi átlaga Foglalkozási kategóriák átlagkeresete Munkanélküliség mértéke Stb.

9 WJLF Pedagógia BACsákó M.: Társadalomstatisztika9 Példa az alkalmazásra Freedman: májműtétes példája Veszélyes bypass műtét, de életmentőnek tartják. Kérdés: „megéri-e”? Hogyan lehet megtudni? Számoljuk meg az eredményt!

10 WJLF Pedagógia BACsákó M.: Társadalomstatisztika10 Mit értünk statisztikán? Összeszámlálás, Jelzőszámok Kapcsolatkeresés, Feltételezett kapcsolat ellenőrzése, –magyarázat-keresés –minőség-ellenőrzés Kutatási módszer (- pl. survey)

11 WJLF Pedagógia BACsákó M.: Társadalomstatisztika11 ÖSSZEFOGLALÁS Mivel kezdődik a statisztikai tevékenység? Nem az adatgyűjtéssel, hanem a kategóriák megtervezésével. Mi mindenről kell dönteni az adatgyűjtéssel kapcsolatban? Kiktől? – miféle válaszok lehetségesek? Mit, milyen adatot gyűjtünk? Hogyan gyűjtjük?

12 WJLF Pedagógia BACsákó M.: Társadalomstatisztika12 ÖSSZEFOGLALÁS: Célok Milyen célok érdekében gyűjtünk adatot? Leggyakrabban egy népesség/csoport leírására. Szélsőséges pl.: a népszámlálás – mi baj? Több mint 20 kötet adat – áttekinthetetlen A „demográfiai adatok” 1 kötet (vagy 19)… „Magyarországon az átlagéletkor: év” vagy: „Magyarországon az átlagkereset…”

13 WJLF Pedagógia BACsákó M.: Társadalomstatisztika13 Változók Miért vizsgáljuk a dolgokat vagy személyeket? -mert nem egyformák, sokfélék, -és ráadásul változnak. Dolgoknak vagy személyeknek azt a tulajdonságát, jellemzőjét, amelyet vizsgálunk, változónak nevezzük. Pl.: életkor; fizetés; gyerekszám; munkahelyváltoztatások száma. Nem biztos, hogy megszámlálható (pl. lakóhely).

14 WJLF Pedagógia BACsákó M.: Társadalomstatisztika14 A tankönyv példája: jövedelem az USÁ-ban

15 WJLF Pedagógia BACsákó M.: Társadalomstatisztika15 A tankönyv példája: jövedelem az USÁ-ban A függőleges tengely = = sűrűségskála (%/egység)

16 WJLF Pedagógia BACsákó M.: Társadalomstatisztika16 A tankönyv gyakorló feladata 1.

17 WJLF Pedagógia BACsákó M.: Társadalomstatisztika17 A tankönyv gyakorló feladata 2-3.

18 WJLF Pedagógia BACsákó M.: Társadalomstatisztika18 A tankönyv gyakorló feladata 4.

19 WJLF Pedagógia BACsákó M.: Társadalomstatisztika19 A 18 évesek apjának és anyjának életkora ( )

20 WJLF Pedagógia BACsákó M.: Társadalomstatisztika20 Az apák életkora: grafikon Az apák életkora ÉvSzám% 40-ig több843 Ez a grafikon csak szemléltető eszköz - csak egy dolgot mutat. Csoportosított adatok.

21 WJLF Pedagógia BACsákó M.: Társadalomstatisztika21 Az apák életkor szerint: hisztogram 36% 30% 16% 9% 6% 3% A hisztogram pontosan megfelel az adatoknak, nemcsak szemléltet.

22 WJLF Pedagógia BACsákó M.: Társadalomstatisztika22 Feladat: Rajzolják meg a hisztogramot! Testvérek számaEset % 028,1 147, ,5 4-82,3 IDE

23 WJLF Pedagógia BACsákó M.: Társadalomstatisztika23 KÖZÉPÉRTÉKEK A középértékekkel (átlag) egy csoport gyors áttekintését kívánjuk nyújtani. Alkalmazásuk feltételei: 1. legyen értelmezhető csoport, amelyet jellemez (pl. 7.osztály; bérből élők…) 2. a célnak megfelelőt válasszuk a középértékek közül

24 WJLF Pedagógia BACsákó M.: Társadalomstatisztika24 KÖZÉPÉRTÉKEK A középértékek fajtái: - számtani átlag - medián - módusz - négyzetes átlag - harmonikus átlag - mértani átlag

25 WJLF Pedagógia BACsákó M.: Társadalomstatisztika25 KÖZÉPÉRTÉKEK A számtani átlag a legismertebb. Képlete: a 1 +a 2 +…+a n Σa ā = = n n

26 WJLF Pedagógia BACsákó M.: Társadalomstatisztika26 KÖZÉPÉRTÉKEK Mikor jó és mikor problémás a számtani közép: pl. testvérszám; testmagasság. A módusz a középtendenciát jobban kiemeli (ha van) = leggyakoribb érték A medián jó jelzőszám, de előnytelen matematikailag további számításokhoz

27 WJLF Pedagógia BACsákó M.: Társadalomstatisztika27 KÖZÉPÉRTÉKEK A hetedikesek kérésünkre megjelölték egy [0; 100] egyenes szakaszon, hány % esélyük van rá, hogy érdemi választ kapjanak tanáraiktól a kérdéseikre. Az esélyüket átlagosan 58,9%-ra becsülték. A medián érték 59,8%, a módusz pedig 41-60% (mivel csoportosítottuk a válaszokat). Mi a véleményük erről? Mit jelent ez? Milyenek lehetnek a vélemények részletesebben?

28 WJLF Pedagógia BACsákó M.: Társadalomstatisztika28 N= 27  62  81  182  133  169  45 = 699 % 3,9  8,9  11,6  26,0  19,0  24,2  6,4 = 100 Átlag =  Módusz = 40–60%  Medián = 350. eset = =180. a (40-60)-ban = = 59,78  59,8  KÖZÉPÉRTÉKEK

29 WJLF Pedagógia BACsákó M.: Társadalomstatisztika29 KÖZÉPÉRTÉKEK

30 WJLF Pedagógia BACsákó M.: Társadalomstatisztika30 KÖZÉPÉRTÉKEK Példa: Márta néni fantasztikus matektanár: minden osztályában eléri matekból a 3,2 átlagot, még az összevont osztályban is! Hogyan? „a” osztály: 2- 6; 3- 1; 4- 2; 5- 3 (12 fő) „b” osztály: 2- 2; 3- 6; 4- 4; 5- 0 (12 fő)

31 WJLF Pedagógia BACsákó M.: Társadalomstatisztika31 A 12 fő B jegy: Rajzoljuk meg először a hisztogramokat! Az osztályzatokat a (vízszintes) tengelyen ábrázoljuk, ezen helyezünk el annyi tanulót, ahányan az adott osztályzatot kapták.

32 WJLF Pedagógia BACsákó M.: Társadalomstatisztika32 A 12 fő B

33 WJLF Pedagógia BACsákó M.: Társadalomstatisztika33 A 12 fő B jegy:

34 WJLF Pedagógia BACsákó M.: Társadalomstatisztika34 A 12 fő B jegy:

35 WJLF Pedagógia BACsákó M.: Társadalomstatisztika35 A 12 fő B jegy: = 38 átlag (ā)38 : 12 ≈ 3,2

36 WJLF Pedagógia BACsákó M.: Társadalomstatisztika36 A 12 fő B jegy: = 38 átlag (ā)38 : 12 ≈ 3,2

37 WJLF Pedagógia BACsákó M.: Társadalomstatisztika37 KÖZÉPÉRTÉKEK Hogyan lehetne kifejezni a két osztály különbségét? Miben is áll ez a különbség? Átlag „a”: =38 38/12=3,17 ≈ 3,2 Átlag: „b”: =38 38/12=3,17 ≈ 3,2 Az átlaguk azonos – mi eltérő? A szóródás

38 WJLF Pedagógia BACsákó M.: Társadalomstatisztika38 A SZÓRÁS Eredmény: A két osztály átlageredménye azonos (3,2) de az egyikben nagy különbségek vannak a tanulók között (s  1,3), míg a másikban közel állnak egymáshoz (s  0,7). Vagyis a szórás segítségével tudjuk számszerűsíteni a különbséget.

39 WJLF Pedagógia BACsákó M.: Társadalomstatisztika39 A SZÓRÓDÁS MÉRTÉKE Mi a tanulság? A valóság a szóródásban rejlik, a középérték erős absztrakció. A mozgás mindig különbségből ered, oka tehát a különbségek okában van.  Valamiképpen fogalmilag ki kell fejezni a változatosságot:  a szórás mérőszámaival.

40 WJLF Pedagógia BACsákó M.: Társadalomstatisztika40 A SZÓRÓDÁS MÉRÉSE Első megközelítés: szélső értékek, vagyis az eloszlás kiterjedése. Pl. az emberi testmagasság A legmagasabb ismert férfi: Robert Pershing Wadlow ( ) 272 cm A legmagasabb ismert nő: Zeng Jinlian ( ) 246 cm

41 WJLF Pedagógia BACsákó M.: Társadalomstatisztika41 A SZÓRÓDÁS MÉRÉSE

42 WJLF Pedagógia BACsákó M.: Társadalomstatisztika42 A SZÓRÓDÁS MÉRÉSE A valaha ismert legalacsonyabb emberek: Nő: Pauline Musters ( ) 59 cm. Férfi: Calvin Philips ( ) 67 cm. Eleget tudunk-e így az emberi testmagas- ságról? Nem: az eloszlás még sokféle lehet a két végpont között.

43 WJLF Pedagógia BACsákó M.: Társadalomstatisztika43 A SZÓRÓDÁS MÉRÉSE Második megközelítés = az esetek zömének kiterjedése = interkvartilis távolság Pl. a tanári válasz esélye: N= 27  62  81  182  133  169  45 = 699 % 3,9  8,9  11,6  26,0  19,0  24,2  6,4 = kvartilis = a 175. eset (40-60%) 2.kvartilis = medián 3.kvartilis = az 525. eset (80-100%)

44 WJLF Pedagógia BACsákó M.: Társadalomstatisztika44 A SZÓRÓDÁS MÉRÉSE Harmadik megközelítés = az esetek átlagtól való távolságának átlaga = = szórás (s) A kiszámítás módja: négyzetes átlag Σ(a – ā) 2 s =  N Magyarázat: az összeadás tagjai előjelesek. (Lássuk Márta néni osztályainak példáján!)

45 WJLF Pedagógia BACsákó M.: Társadalomstatisztika45 A 12 fő jegy = 38 átlag (ā)38 : 12 ≈ 3,2 a-ā1,20,20,81,8

46 WJLF Pedagógia BACsákó M.: Társadalomstatisztika46 A 12 fő B jegy = 38 átlag (ā)38 : 12 ≈ 3,2 a-ā1,20,20,81,8 (a-ā) 2 1,440,040,643,24

47 WJLF Pedagógia BACsákó M.: Társadalomstatisztika47 A 12 fő B jegy = 38 átlag (ā)38 : 12 ≈ 3,2 a-ā1,20,20,81,8 (a-ā) 2 1,440,040,643,24 nx6x1,440,042x0,643x3,24 8,64 +0,04 +1,28 +9,72  nx = 19,68

48 WJLF Pedagógia BACsákó M.: Társadalomstatisztika48 12 fő jegy = 38 átlag (ā)38 : 12 ≈ 3,2 a-ā1,20,20,81,8 (a-ā) 2 1,440,040,643,24 nx6x1,440,042x0,643x3,24 8,64 +0,04 +1,28 +9,72  nx = 19,68  (  nx)/N √ (19,68:12) ≈ 1,3

49 WJLF Pedagógia BACsákó M.: Társadalomstatisztika49 A 12 fő B jegy = 38 átlag (ā)38 : 12 ≈ 3,2 a-ā1,20,20,81,81,20,20,80 (a-ā) 2 1,440,040,643,241,440,040,64 nx6x1,440,042x0,643x3,24 8,64 +0,04 +1,28 +9,72  nx = 19,68  (  nx)/N √ (19,68:12) ≈ 1,3

50 WJLF Pedagógia BACsákó M.: Társadalomstatisztika50 A 12 fő B jegy = 38 átlag (ā)38 : 12 ≈ 3,2 a-ā1,20,20,81,81,20,20,80 (a-ā) 2 1,440,040,643,241,440,040,64 nx6x1,440,042x0,643x3,242x1,446x0,044x0,640 8,64 +0,04 +1,28 +9,722,88 +0,24 +2,56 +0  nx = 19,68= 5,68  (  nx)/N √ (19,68:12) ≈ 1,3

51 WJLF Pedagógia BACsákó M.: Társadalomstatisztika51 A 12 fő B jegy = 38 átlag (ā)38 : 12 ≈ 3,2 a-ā1,20,20,81,81,20,20,80 (a-ā) 2 1,440,040,643,241,440,040,64 nx6x1,440,042x0,643x3,242x1,446x0,044x0,640 8,64 +0,04 +1,28 +9,722,88 +0,24 +2,56 +0  nx = 19,68= 5,68  (  nx)/N √ (19,68:12) ≈ 1,3 √ (5,68:12)

52 WJLF Pedagógia BACsákó M.: Társadalomstatisztika52 A 12 fő B jegy = 38 átlag (ā)38 : 12 ≈ 3,2 a-ā1,20,20,81,81,20,20,80 (a-ā) 2 1,440,040,643,241,440,040,64 nx6x1,440,042x0,643x3,242x1,446x0,044x0,640 8,64 +0,04 +1,28 +9,722,88 +0,24 +2,56 +0  nx = 19,68= 5,68  (  nx)/N √ (19,68:12) ≈ 1,3 √ (5,68:12) ≈ 0,7

53 = Az osztályok különbsége abban áll, hogy az „A” osztályban az eredmények szórása csaknem kétszer akkora, mint a „B”-ben: s a =1,3 osztályzat s b =0,7 osztályzat A SZÓRÓDÁS MÉRÉSE

54 WJLF Pedagógia BACsákó M.: Társadalomstatisztika54 A SZÓRÁSEGYSÉG 103. OLDAL ÁBRA

55 WJLF Pedagógia BACsákó M.: Társadalomstatisztika55 A NORMÁLGÖRBE 101. OLDAL ÁBRA

56 WJLF Pedagógia BACsákó M.: Társadalomstatisztika56 A NORMÁLGÖRBE HASZNÁLATA Mekkora a 0 és 1 közötti intervallumba eső terület?

57 WJLF Pedagógia BACsákó M.: Társadalomstatisztika57 GÖRBE ALATTI TERÜLETEK

58 VARIANCIA-ELEMZÉS FIGYELEM! Ez a fejezet NINCS BENNE a tankönyvben!!!

59 WJLF Pedagógia BACsákó M.: Társadalomstatisztika59 Mitől vannak a különbségek? Az ember igyekszik egyszerűnek látni a világot (pl. átlag). Ugyanez a törekvés a szabványosításban, a normában stb. Kénytelenek vagyunk beengedni valahogy a sokféleséget (pl. szórás). Ugyanez tör be a „tűrés” műszaki fogalmában, a „kalo”-ban stb.

60 WJLF Pedagógia BACsákó M.: Társadalomstatisztika60 Mi kell a magyarázathoz ? Mit akarunk megmagyarázni? A szórást. (= Az esetek különbözőségét.) Kell legalább még egy változó (= tehát ez is változik, azaz több értéke lehet) Sőt: nem is lehet más, csak változó.  Ui. ami ugyanolyan, az nem okoz különbséget. Egy lehetőség: a varianciaelemzés.

61 WJLF Pedagógia BACsákó M.: Társadalomstatisztika61 Mire jó a varianciaelemzés? Mikor használható? - Ha egy nominális (kategoriális) változóval akarunk magyarázni egy folytonos kvantitatív változót. Példák: Mennyire befolyásolja a lakóhely a jövedelmet? vagy a dolgozó neme? Azaz: Ha az elemek csoportokat alkotnak, felmerülhet, hogy a csoportba tartozás okozza a szóródást vagy annak egy részét 61

62 WJLF Pedagógia BACsákó M.: Társadalomstatisztika62 VARIANCIA-ELEMZÉS Variancia = teljes szórásnégyzetösszeg vagyis az összes elem átlagtól való távolságának négyzetes összege (amiből a szórást számítjuk) Ezt probáljuk „feldarabolni”: mekkora része származik a csoportbontásból. Vegyünk egy példát! (A tkv. adatai, 64. old.)

63 WJLF Pedagógia BACsákó M.: Társadalomstatisztika63 Gyerekszám és iskolázottság Gyerek- számEsetszám Összes gyerek (a-ā) n(a-ā) , , ,213519, , , , , , , , ,0637 N ,836 Átlag 1,2135 1, Szórás  1,1675

64 WJLF Pedagógia BACsákó M.: Társadalomstatisztika64 Gyerekszám és iskolázottság Gyerek- szám Max. középisk. Összes gyerek (a-ā) n(a-ā) ,486560, ,48657, ,51484, ,514302, ,514233, ,514135,8302 N ,804 Átlag 1,486 1, Szórás  1,173

65 WJLF Pedagógia BACsákó M.: Társadalomstatisztika65 Gyerekszám és iskolázottság Gyereksz Felsőfo- kon végz. Összes gyerek (a-ā) n(a-ā) ,941435, ,0590, ,059257, ,059301, ,059140, ,05965,90192 N ,519 Átlag 0,941 1, Szórás  1,096

66 WJLF Pedagógia BACsákó M.: Társadalomstatisztika66WJLF Pedagógia BACsákó M.: Társadalomstatisztika Teljes variancia = (csoportok és főátlag közötti) + csoporton belüli variancia

67 WJLF Pedagógia BACsákó M.: Társadalomstatisztika67 VARIANCIA-ELEMZÉS Hány változót használtunk? Kettőt! 1. gyerekszám; 2. iskolázottság Milyen változók ezek? a gyerekszám kvantitatív és diszkrét* az iskolázottság kvalitatív (dichotóm) – itt! A varianciaelemzés akkor használható, ha egy kvalitatív változónak egy kvantitatív változóra való hatását akarjuk megtudni. (* Valójában csak folytonos változók varianciáját lehet felbontani. Ezt sokszor nem tartják be. Itt pedig a számítások egyszerűsége és az adatok hozzáférhetősége miatt használtunk diszkrét változót.)

68 WJLF Pedagógia BACsákó M.: Társadalomstatisztika68 A KORRELÁCIÓ

69 WJLF Pedagógia BACsákó M.: Társadalomstatisztika69 A varianciaelemzéstől a korrelációig A varianciaelemzés megmutatta egy nominális (kategoriális) változó hatását egy folytonos kvantitatív változóra. De mit csináljunk, ha a magyarázó változónk is folytonos kvantitatív? (Pl. testmagasság a testsúly magyarázatára, vagy életkor a kereset magyarázatára Minden egyes esetet mégsem tekinthetünk külön kategóriának! 69

70 WJLF Pedagógia BACsákó M.: Társadalomstatisztika70 Hogyan ábrázolunk két változót? a konkrét eset

71 WJLF Pedagógia BACsákó M.: Társadalomstatisztika71 Hogyan ábrázolunk két változót? (Gyakorlás) Ábrázoljunk néhány apa-fiú párt! Legyen F=A; F=A+5cm; F=A-2cm; F=A+17cm; minden F = A+15% ! Figyeljük meg az esetek elhelyezkedését a F=A szabályhoz képest!

72 WJLF Pedagógia BACsákó M.: Társadalomstatisztika72 Descartes-féle koordinátarendszer Két változó értékei (adatpár) egy pontot határoz meg: P(x,y) Két pont meghatároz egy egyenest. Egyenlete: y=mx+b Mikor egyenes két változó kapcsolatának képe? (pl. az apák és fiak testmagasságának összefüggése?) Ha szigorú függvénykapcsolat van közöttük: vagyis ha az apa magasságából egyértelműen meg lehet mondani a fia magasságát.

73 WJLF Pedagógia BACsákó M.: Társadalomstatisztika73 Descartes-féle koordinátarendszer

74 WJLF Pedagógia BACsákó M.: Társadalomstatisztika74 Descartes-féle koordinátarendszer

75 WJLF Pedagógia BACsákó M.: Társadalomstatisztika75 Van-e itt szigorú függvénykapcsolat?

76 WJLF Pedagógia BACsákó M.: Társadalomstatisztika76 Két változó kapcsolata A társadalomban nincs szigorú függvénykapcsolat.  A kapcsolat képe nem egyenes, hanem pontfelhő. Különböző alakú pontfelhők lehetnek. Hogyan lehetne őket pontosabban leírni?

77 WJLF Pedagógia BACsákó M.: Társadalomstatisztika77 Próbáljuk körülrajzolni

78 WJLF Pedagógia BACsákó M.: Társadalomstatisztika78 Körülrajzolás: mit tudunk hozzá? Az apák magasságának a) átlagát, b) szórását A fiak magasságának c) átlagát, d) szórását.

79 WJLF Pedagógia BACsákó M.: Társadalomstatisztika79 Hogyan használjuk, amit tudunk?

80 WJLF Pedagógia BACsákó M.: Társadalomstatisztika80 Milyen lesz a pontfelhő alakja?

81 WJLF Pedagógia BACsákó M.: Társadalomstatisztika81 Korrelációs együttható számítása r = (standard x * standard y) átlaga 1.átszámítjuk standard értékbe mind x-et, mind y-t*; 2.minden pontra összeszorozzuk 3.a szorzatokat átlagoljuk. * Vagyis a szórásukkal fejezzük ki őket: hány szórásnyira vannak az átlaguktól.

82 WJLF Pedagógia BACsákó M.: Társadalomstatisztika82 A korrelációs együttható és a pontfelhő

83 WJLF Pedagógia BACsákó M.: Társadalomstatisztika83 A korrelációs együttható és a pontfelhő

84

85

86 WJLF Pedagógia BACsákó M.: Társadalomstatisztika86 Korrelációs együttható Az előző ábrákban látható, hogy 0 ≤ r ≤ 1 De ezt még tovább finomítjuk gyakorlati példák segítségével.

87 WJLF Pedagógia BACsákó M.: Társadalomstatisztika87 MENNYI ESÉLYED VAN ÉRDEMI VÁLASZRA A SZÜLEIDTŐL? MILYEN A KAPCSOLATA SZÜLEIVEL? AZ ANYA ISKOLAI VÉGZETT- SÉGE AZ APA ISKOLAI VÉGZETT- SÉGE MENNYI ESÉLYED VAN ÉRDEMI VÁLASZRA A SZÜLEIDTŐL? Pearson Correlation 1-,069,014,016 Sig. (2-tailed),068,724,693 N MILYEN A KAPCSOLAT A SZÜLEIVEL? Pearson Correlation -,0691-,092(*) -,037 Sig. (2-tailed),068,017,342 N AZ ANYA ISKOLAI VÉGZETTSÉGE Pearson Correlation,014-,092(*)1,673(**) Sig. (2-tailed),724,017,000 N AZ APA ISKOLAI VÉGZETTSÉGE Pearson Correlation,016-,037,673(**) 1 Sig. (2-tailed),693,342,000 N

88 WJLF Pedagógia BACsákó M.: Társadalomstatisztika88 MENNYI ESÉ- LYED VAN ÉRDEMI VÁ- LASZRA A SZÜ- LEIDTŐL? MILYEN A KAP- CSOLATA A SZÜLEIVEL? MENNYI ESÉLYED VAN ÉRDEMI VÁLASZRA A SZÜLEIDTŐL? Correlation 1 -,152(**) Sig. (2-tailed),000 N MILYEN A KAPCSOLATA SZÜLEIVEL? Correlation -,152(**) 1 Sig. (2-tailed),000 N Kutatási példák a korrelációra

89 WJLF Pedagógia BACsákó M.: Társadalomstatisztika89 Negatív korrelációs együtthatók

90 WJLF Pedagógia BACsákó M.: Társadalomstatisztika90 Negatív korrelációs együtthatók

91 WJLF Pedagógia BACsákó M.: Társadalomstatisztika91 Negatív korrelációs együtthatók

92 WJLF Pedagógia BACsákó M.: Társadalomstatisztika92 Korrelációs együttható Az előző ábrákban látható, hogy ki kell terjesztenünk r értékét a negatív számok felé: -1 ≤ r ≤ 1.Ha r = -1 : szigorú negatív függvénykapcsolat, Ha r = 0, akkor nincs kapcsolat, Ha r = 1 : szigorú pozitív függvénykapcsolat

93 WJLF Pedagógia BACsákó M.: Társadalomstatisztika93 A szórásegyenes

94 WJLF Pedagógia BACsákó M.: Társadalomstatisztika94 Kivételek Az r csak lineáris kapcsolatok erőssége mérésére alkalmas. A baloldali pontfelhő nem egy egyenes mentén szóródik.

95 WJLF Pedagógia BACsákó M.: Társadalomstatisztika95 Kivételek

96 WJLF Pedagógia BACsákó M.: Társadalomstatisztika96 Kivételek Problémákat okozhatnak az un. magányos elemek. (Pl. magas apa törpenövésű fia; vagy: milliárdos villája egy felsőközép-rétegű kertvárosi kerületben – egymaga elhúzza az átlagot) Megoldás lehet: kihagyjuk őket –Lásd ezt a megoldást pontozásos sportoknál: síugrás, műkorcsolyázás De csak óvatosan, mert a valósághoz ezek is hozzátartoznak! Kihagyásuk is torzít.

97 WJLF Pedagógia BACsákó M.: Társadalomstatisztika97 A korrelációs együttható érdekességei Az r nem az abszolút számok közötti kapcsolatot méri, hanem a szóráshoz képest vett adatok kapcsolatát Miért? Mert standard egységbe számoltuk át az adatokat – más szóval: a szóráshoz viszonyítottuk őket.

98 WJLF Pedagógia BACsákó M.: Társadalomstatisztika98 A korrelációs együttható érdekességei Az r értéke nem változik, ha… a) … x értékeit ugyanazzal a számmal megszorozzuk. b) … x értékeihez ugyanazt a számot hozzáadjuk (kivonjuk). c) … a változókat (x, y) felcseréljük.  Oksági összefüggést nem jelent!

99 WJLF Pedagógia BACsákó M.: Társadalomstatisztika99 A korrelációs együttható érdekességei Un. ökológiai korrelációk Azokat a korrelációkat hívjuk így, amelyeket csoportosított adatokból számítottak. Pl. Doll: cigarettafogyasztás – tüdőrák országonként (11 ország) Pl. iskolázottság és jövedelem kapcsolata USA teljes (25-54 éves): r = 0,44 államokra átlagolva 51 adatpárból: r = 0,64

100 WJLF Pedagógia BACsákó M.: Társadalomstatisztika100 A korrelációs együttható érdekességei Saját „ökológiai korrelációs” példám: Szakmunkástanulók 21 rangsora alapján képzett kategóriák szépen szétváltak. (  társadalmi szakmablokkok) Diszkriminancia-elemzéssel kevéssé rekonstruálható Ok: a csoportokon belüli szórást figyelmen kívül hagytuk.

101 A REGRESSZIÓSZÁMÍTÁS (Tkv. 188–252. old.)

102 WJLF Pedagógia BACsákó M.: Társadalomstatisztika102 Mit jelent a regresszió? Politikai-köznyelvi értelemben: a progresszió = haladás, akkor a regresszió = visszafejlődés A statisztikában más a jelentése: két összefüggő változó egyikének visszavezetése a másikra Pl. a testsúly és a testmagasság összefügg  megpróbálhatjuk visszavezetni a testsúlyt a test- magasságra (ld. a tkv. példáját)

103 WJLF Pedagógia BACsákó M.: Társadalomstatisztika103 A regresszió lépésenként – 1.

104 WJLF Pedagógia BACsákó M.: Társadalomstatisztika104 A regresszió lépésenként – 2. Az átlag + 1 szórás testmagassághoz tartozó testsúlyátlag

105 WJLF Pedagógia BACsákó M.: Társadalomstatisztika105 A regresszió lépésenként – 3. A magasság ± 2 szórásához tartozó testsúlyátlagok

106 WJLF Pedagógia BACsákó M.: Társadalomstatisztika106 A regresszió lépésenként – 4. A testmagasság szórásaihoz tartozó testsúlyátlagokat összekötő egyenes: a regressziós egyenes.

107 WJLF Pedagógia BACsákó M.: Társadalomstatisztika107 A regresszió lépésenként – 5. Figyeljék meg a szórásegyenes és a regressziós egyenes viszonyát! A regressziós egyenes kevésbé meredek. Miért? Mert az egyes esetek nem ugyanannyira térnek el a magasság átlagától, mint a testsúly átlagától. Milyen kapcsolat lenne, ha ugyanannyira térnének el?

108 WJLF Pedagógia BACsákó M.: Társadalomstatisztika108 Regresszió = y becslése y x-re vonatkozó (vagy: x szerinti) regressziós egyenese becslést ad az egyes x értékekhez tartozó y értékek átlagára. Az x egy szórásnyi változásához átlagosan az y értékek r szórásnyi változása kapcsolódik. A korrelációs együttható csak a kapcsolat erősségét mutatja meg, az összefüggés módját pedig a regressziós egyenes.

109 WJLF Pedagógia BACsákó M.: Társadalomstatisztika109 Regresszió = y becslése ahol r = a korrelációs együttható !

110 WJLF Pedagógia BACsákó M.: Társadalomstatisztika110 Regresszió = y becslése

111 WJLF Pedagógia BACsákó M.: Társadalomstatisztika111 Egyedi eset becslése Becslés egy adott magasságú egyén súlyára = az átlag!

112 WJLF Pedagógia BACsákó M.: Társadalomstatisztika112 Egyedi eset becslése Regressziós egyenes A hiba természetesen negatív előjelű is lehet.

113 WJLF Pedagógia BACsákó M.: Társadalomstatisztika113 A regressziószámítás feltételei Kvantitatív változók Folytonos változók Normáleloszlás (haranggörbe- szerű) „Rögbilabda alakú” pontfelhő Lineáris kapcsolat

114 WJLF Pedagógia BACsákó M.: Társadalomstatisztika114 Gyakorlatok – 1.

115 WJLF Pedagógia BACsákó M.: Társadalomstatisztika115 Gyakorlatok – 2. Egy hallgatót 650 ponttal vettek fel az egyetemre. Tippeljük meg az évvégi tanulmányi átlagát! (Tkv. 196–197.) Tudjuk hozzá: a felvételi pontátlaga = 550; szórása 80 p. az évvégi átlag = 2,6; szórása = 0,6 a felvételi pontok és az évvégi átlag közötti kapcsolat: r = 0,4

116 WJLF Pedagógia BACsákó M.: Társadalomstatisztika116 Gyakorlatok – 2. A megoldás menete: 1 – Mennyivel jobban felvételizett az átlagnál? 2 – Regressziós becslés a tanulmányi eredmény átlagtól való eltérésére 3 – Mennyit jelent ez az eltérés osztályzatban? 4 – Mit jelent ez az eredmény?

117 WJLF Pedagógia BACsákó M.: Társadalomstatisztika117 Következtetés y-ból x-re Ugyanolyan számítással becsülhetjük-e a testmagasságot a testsúlyból, ahogyan a testsúlyt becsültük a testmagasságból?

118 WJLF Pedagógia BACsákó M.: Társadalomstatisztika118 Két regressziós egyenes van! y-nak x szerinti regressziós egyenesének meredeksége: r*(y szórása) x-nek y szerinti regressziós egyenesének meredeksége: r*(x szórása) súlyátlag=160 magasságátlag=70

119 MINTAVÉTEL, HIBA, VALÓSZÍNŰSÉG

120 WJLF Pedagógia BACsákó M.: Társadalomstatisztika120 MINTAVÉTEL Mit nevezünk mintának? A kutatók többnyire az emberek egy nagyobb csoportjáról – ez a populáció – szeretnének megállapítani számszerű adatokat – un. paramétereket. Mivel a populáció túl nagy, kiválasztanak belőle egy részt, és csak arról gyűjtenek adatokat. Ez a kiválasztott rész a minta. A paramétereket a minta adataiból becsülik: fel- tételezve, hogy a minta olyan, mint a populáció.

121 WJLF Pedagógia BACsákó M.: Társadalomstatisztika121 MINTAVÉTEL DE OLYAN-E A MINTA, MINT A POPULÁCIÓ? Mikor lesz jó a becslés? Ha a minta tényleg olyan, mint a populáció. Hogyan tudhatnánk meg? Össze kéne hasonlítani! De ezt nem lehet: hiszen épp azért veszünk mintát, mert az egész populációt nem tudjuk megnézni. Csak azt tudjuk ellenőrizni, hogyan választották ki a mintát.

122 WJLF Pedagógia BACsákó M.: Társadalomstatisztika122 MINTAVÉTEL Példa a mintavételi eljárás fontosságára: Roosevelt és Landon megválasztási esélye (1936): A Literary Digest előrejelzése:43% a Gallup előrejelzése:56% Roosevelt eredménye:62% A különbség oka: a mintavétel módja

123 WJLF Pedagógia BACsákó M.: Társadalomstatisztika123 MINTAVÉTEL A Literary Digest eljárása: -postai kérdőív 10 millió (!) embernek A neveket honnan választják? telefonkönyvekből, klubnévsorokból DE: a telefonja a családok ¼ részének volt!  ez a minta torzít a gazdagok javára!

124 WJLF Pedagógia BACsákó M.: Társadalomstatisztika124 MINTAVÉTEL Kétféle torzítás fordul elő: a)mintavételi torzítás (mint láttuk) b)a nem válaszolók torzítása Akik nem válaszolnak, azok nagyon különbözhetnek a válaszolóktól! (Ez az egyik nehézsége ma a választási előrejelzéseknek Magyarországon.)

125 WJLF Pedagógia BACsákó M.: Társadalomstatisztika125 MINTAVÉTEL A véletlen mintavétel a legjobb módszer = a populáció minden tagjának ugyanakkora esélye legyen bekerülni a mintába. Az egyszerű véletlen mintavétel valójában visszatevés nélküli sorsolás (mint a lottó). De így változik a későbbi húzások valószínűsége! Ha nagy a populáció, egy húzás valószínűségét elhanyagolhatóan növeli csak, hogy nem tesszük vissza a kihúzottakat. (Pl. 1/68000; 1/67999…) Ez is ritkán valósítható meg, ezért többnyire többlépcsős csoportos mintavételt alkalmazunk.

126 WJLF Pedagógia BACsákó M.: Társadalomstatisztika126 Mintavétel Az egyszerű véletlen mintavétel ritkán valósítható meg, ezért többnyire többlépcsős csoportos mintavételt alkalmazunk. Pl. osztályokat választunk, abból diákokat: Legyen Bp-en 500 hetedik osztály, és válasszunk belőle 50-et. Hányféleképpen lehet? első … *499*498*…*452*451 = legalább 133 számjegyű ! A megítélése valószínűségszámítási feladat.

127 2. Valószínűségszámítás 2.1. Alapfogalmak, szabályok 2.2. A binomiális formula 2.3. Várható érték és standard hiba

128 WJLF Pedagógia BACsákó M.: Társadalomstatisztika128 Esélyek, valószínűség Valószínűség = az eseteknek várhatóan hány százalékában fog bekövetkezni a dolog, ha sokszor, egymástól függetlenül, azonos körülmények között megismételjük a kísérletet. (rövidítése: p – probability) Egy dolognak és az ellentétének a valószínűsége együtt mindig = 100%. (Vagyis: A + nemA = 1)

129 WJLF Pedagógia BACsákó M.: Társadalomstatisztika129 Esélyek, valószínűség Véletlenszerű húzás esetén egy dobozban lévő minden lap/golyó kihúzásának ugyanakkora az esélye. Ha visszatevéssel húzunk egymás után többször, akkor ez az esély nem változik. Ha nem tesszük vissza a kihúzott lapot, akkor a következő húzásnál eggyel kevesebb lapból húzunk  nő az esély.

130 WJLF Pedagógia BACsákó M.: Társadalomstatisztika130 Gyakorlás 1. Ugyanolyan valószínű, hogy bekövetkezik. mint hogy nem. Ez egészen biztosan bekövetkezik. Ez nem következhet be. Bekövetkezhet, de nem valószínű. Nagyon valószínű, de nem biztos. Programhiba - 50% 0% 10% 50% 90% 100% 200% Melyik számnak melyik állítás felel meg?

131 WJLF Pedagógia BACsákó M.: Társadalomstatisztika131 Gyakorlás szer dobunk egy érmével. Hány fejre számíthatunk? 100 lapot húzhatunk két doboz egyikéből, visszatevéssel. Minden húzásért annyi $-t kapunk, amekkora szám a lapon van. Melyik dobozt választaná? Miért?

132 WJLF Pedagógia BACsákó M.: Társadalomstatisztika132 Esélyek, valószínűség Feltétlen valószínűség: –pl. annak a valószínűsége, hogy a pikk dáma a második lap a pakliban. (1/52) Feltételes valószínűség: –pl. annak a valószínűsége, hogy a pikk dáma a második lap, HA az első a kőr 7. (1/51 – mert az első lapot már kivettük.)

133 WJLF Pedagógia BACsákó M.: Társadalomstatisztika133 Esélyek, valószínűség Példa: Mi a valószínűsége annak, hogy elsőre a pikk dámát, és azt megtartva, másodikra a kőr királyt húzzuk a pakliból? Pikk dáma: 1/52 Kőr király: 1/51 Szorzási szabály: Két esemény együttes bekövetkezésének valószínűsége = külön-külön valószínűsé- gük szorzata (p a,b = p a *p b ; pl.: 1/52*1/51)

134 WJLF Pedagógia BACsákó M.: Társadalomstatisztika134 Esélyek, valószínűség Független és nem független események: nem független a második esemény, ha valószínűsége függ az első bekövetkezésétől; Visszatevés nélküli húzások összefüggenek, visszatevésesek függetlenek egymástól. Nem független események együttes bekövetkezésekor a feltételes valószínűségeket szorozzuk össze, független eseményeknél feltétel nélküli valószínűségüket.

135 WJLF Pedagógia BACsákó M.: Társadalomstatisztika135 Esélyek, valószínűség Függetlenség  kölcsönös kizárás (!!!) Két esemény kölcsönösen kizárja egymást, ha egyik bekövetkezése esetén a másik nem következhet be. Összeadási szabály: két egymást kölcsönö- sen kizáró esemény közül legalább az egyik bekövetkezésének valószínűsége = = a kettő valószínűségeinek összege.

136 WJLF Pedagógia BACsákó M.: Társadalomstatisztika136 Esélyek, valószínűség „B” esemény „A” esemény Bekövetk ezik (I) Nem kö- vetkezik be (H) Bekövet- kezik (I) Kizárt!I + H Nem kö- vetkezik be (H) H + IH + H „B” esemény „A” esemény Bekövetk ezik (I) Nem kö- vetkezik be (H) Bekövet- kezik (I) I + II + H Nem kö- vetkezik be (H) H + IH +H Összeadáskor Szorzáskor

137 WJLF Pedagógia BACsákó M.: Társadalomstatisztika137 Ismétlő gyakorlat Egy-egy lapot húzunk az „A” és a „B” dobozból. Állapítsák meg annak valószínűségét, hogy… a húzott számok egyike 2 és a másika 5. a számok összege 7. a két szám egyenlő „A” doboz „B” doboz

138 WJLF Pedagógia BACsákó M.: Társadalomstatisztika138 Ismétlő gyakorlat (bemutatása) „A”=1 és „B”=6. „A”=2 és „B”=5. „A”=3 és „B”=4. „A”=4 és „B”=3. „A”=5 és „B”=2. b) Hányféle „kimenet” van összesen? Akkor p(7) = ? „A” doboz „B” doboz Mi annak valószínűsége, hogy a számok összege 7 a) hányféleképpen fordulhat elő a 7 mint összeg?

139 WJLF Pedagógia BACsákó M.: Társadalomstatisztika139 Kutatási példa A középiskolások jogtudatának fokát azzal mértük, hogy három gyakorlati példából hányban ismerik fel, mihez van joguk. Kérdésenként 3 válaszból kellett a helyeset kiválasztani.

140 WJLF Pedagógia BACsákó M.: Társadalomstatisztika140 Kutatási példa Melyik eredménynek mekkora a valószínűsége? 1)Hányféleképpen lehet 0 találat? Nem 1-féleképpen!!! Jelöljük az 1. kérdést normál, a 2.-at dőlt, a 3.-at vastag betűkkel, legyen R=rossz, J=jó, és számozzuk a lehetséges válaszokat! 0: (R1 R1 R1) (R1 R1 R2) (R1 R2 R1) (R2 R1 R1) ugyanez a számok felcserélésével (R2 R2 R2) Vagyis: 8-féleképpen lehet 0 szintű jogtudat!!!

141 WJLF Pedagógia BACsákó M.: Társadalomstatisztika141 Kutatási példa Jelöljük az ábrán az egyes szintek valószínűségét!

142 WJLF Pedagógia BACsákó M.: Társadalomstatisztika142 Kutatási példa Megállapítás: A magyar középiskolások jogismereti válaszainak eloszlása nem tér el attól, mintha csak találgatnának. Következtetés: A magyar középiskolások általában nem ismerik a jogaikat. A valószínűségi eloszlás figyelembe vétele ahhoz segített, hogy ne csak a normához (3), hanem a „0-ponthoz” is mérhessünk. Mire gondolhatnánk, ha 0 találatból több, 2 és 3 találatból sokkal kevesebb lenne, mint valószínű?

143 WJLF Pedagógia BACsákó M.: Társadalomstatisztika143 Esélyek, valószínűség Példa: Mekkora a valószínűsége annak, hogy a lottón a 8-jegyű joker-számban két 0 lesz? Tíz szám közül húznak, visszatevéssel. Mennyi a kedvező eset, és mennyi az összes? Egyszerűbb példa: 5-ször húzunk visszatevéssel 9 zöld és 1 piros golyó közül – mekkora a való- színűsége annak, hogy kétszer húzunk pirosat? Itt könnyű listát csinálni a kedvező esetekről: PPZZZ PZPZZ PZZPZ PZZZP ZPPZZ ZPZPZ ZPZZP ZZPPZ ZZPZP ZZZPP (10 kedvező)

144 WJLF Pedagógia BACsákó M.: Társadalomstatisztika144 Binomiális együttható A binomiális együttható azt mondja meg, hányféleképpen lehet sorba rendezni n elemet, ha közülük k egyfajtájú és n-k egy másik fajtájú: n! k! * (n-k)! Az előbbi példa lehetséges sorrendjei: 5! 5*4*3*2*1 2!*(5-2)! (2*1)*(3*2*1) (Ha bonyolultnak látszik a mondat, helyettesítse be így: k = „néhány” n-k = „a többi”.) ==5*2 = 10

145 WJLF Pedagógia BACsákó M.: Társadalomstatisztika145 Binomiális formula A formula nem más, mint a binomiális együttható alkalmazása a keresett valószínűség kiszámítá- sára (k és n-k valószínűségével kell szorozni). Pl. a piros és zöld golyók esetében: p (piros) = 1/10; p (zöld) = 9/10 Két piros golyóra p=(1/10) 2 …. (a kitevő=k), Három zöld golyóra p=(9/10) 3 …. (a kitevő=n-k).

146 WJLF Pedagógia BACsákó M.: Társadalomstatisztika146 A nagy számok törvénye Ha több „fej” jött egymás után, megnő-e az „írások” valószínűsége? NEM! => Mindig 50% marad. Minél hosszabb a feldobás-sorozat, annál nagyobb az abszolút eltérés a várható értéktől, de annál kisebb az eltérés százalékban. De mindig van „véletlen hiba”.

147 WJLF Pedagógia BACsákó M.: Társadalomstatisztika147 A nagy számok törvénye A dobások számá- val a hiba abszolút nagysága nő. A dobások számá- nak növekedésével a „fejek” aránya egyre kevésbé tér el az 50%-tól.

148 WJLF Pedagógia BACsákó M.: Társadalomstatisztika148 A nagy számok törvénye „Fejek” száma = várható érték + véletlen hiba A véletlen hiba a dobások számával nő, de egyre kevésbé tér el az 50%-tól. A véletlen hiba nagyjából a dobások száma sokszorozódásának négyzetgyöke arányában nő. = 100-szor annyi dobás hibája kb. 10- szeresre nő

149 WJLF Pedagógia BACsákó M.: Társadalomstatisztika149 Véletlen folyamatok Az érme feldobálása, a rulettezés, egy választási előrejelzés mintavétele – mind véletlen folyamat, vagyis: a következő dobásoknál, pörgetésnél, mintavételnél más lesz a fejek, a nyertesek, a szocialisták és jobbikosok aránya. A statisztika megpróbálja kiszámítani közelítőleg, h. mennyire függenek a számok a véletlentől.

150 WJLF Pedagógia BACsákó M.: Társadalomstatisztika150 Véletlen folyamatok Két fő gondolat: 1. hasonlóságot keresünk a minket érdeklő véletlen folyamat (mintavétel) és egy dobozból való véletlen húzások között; 2. a bennünket érdeklő ingadozást (pl. Fidesz szavazók becsült aránya) párhuzamba állítjuk a dobozból húzott számok összegének véletlen ingadozásával.

151 WJLF Pedagógia BACsákó M.: Társadalomstatisztika151 Dobozmodell bevezetése Ebből a dobozból húztunk 25-ször, vissza- tevéssel, feljegyeztük a lapokra írt számokat, és összeadtuk őket. Tízszer megismételtük a sorozatot és a következő eredményeket kaptuk:

152 WJLF Pedagógia BACsákó M.: Társadalomstatisztika152 Dobozmodell bevezetése

153 WJLF Pedagógia BACsákó M.: Társadalomstatisztika153 Dobozmodell bevezetése Jó, hogy ezt tudjuk a húzás-sorozatokról, de hogyan csináljunk modellt? Az alapvető eldöntendő kérdések: Milyen számok kerüljenek a dobozba? Melyikből mennyi? Hányat húzzunk? Egyelőre csak szerencsejátékokra nézzük. (Rulett)

154 WJLF Pedagógia BACsákó M.: Társadalomstatisztika154 Dobozmodell bevezetése Szerkesszünk dobozmodellt nevadai ruletthez! A fő: a dobozból minden számot ugyanolyan valószínűséggel húzhassunk, mint amekkora a annak a valószínűsége, hogy annyit nyerjünk a valóságban. Tegyünk fel 1$-t a a) párosra b) harmadik tucatra c) sarokra (négy számra)

155 3. Hibák valószínűsége

156 WJLF Pedagógia BACsákó M.: Társadalomstatisztika156 Dobozmodell és mintavétel Dobozmodellel tudjuk ellenőrizni (vala- mennyire) a mintavételünket: Ha ismerjük a populáció egy változójának eloszlását (pl. férfi/nő), akkor kiszámíthat- juk, mekkora lehet a standard hiba a mintában.

157 WJLF Pedagógia BACsákó M.: Társadalomstatisztika157 Dobozmodell bevezetése Fontos fogalmak: várható érték = a modell alapján várt összeg véletlen hiba = a várható érték eltérése a ténytől standard hiba = a modell alapján várt eltérés összeg = várható érték + véletlen hiba várható érték = (doboz átlaga)* húzások standard hiba = a doboz szórása*  húzások

158 WJLF Pedagógia BACsákó M.: Társadalomstatisztika158 Dobozmodell és mintavétel Pl. (a tkv-ből): Egy populációban 46% férfi és 54% nő van. Az első 100 fős mintában 51% ffi és 49% nő. mintabeli % = alapsokaságbeli % + véletlen hiba Egyszerű véletlen mintában a %-arány várható értéke = alapsokaságbeli %-arány. A %-arány standard hibájához szükségünk van a darabszám standard hibájára: a %-arány standard hibája= * 100% a darabszám standard hibája a minta nagysága

159 WJLF Pedagógia BACsákó M.: Társadalomstatisztika159 Mintavétel és standard hiba A mintabeli darabszám standard hibája a mintanagyság négyzetgyökével arányosan nő. A mintabeli %-arány standard hibája a mintanagyság négyzetgyökével arányosan csökken.

160 WJLF Pedagógia BACsákó M.: Társadalomstatisztika160 A statisztikai becslés Mit tehetünk akkor, ha nem ismerjük az alapsokaság eloszlását? (épp azt keressük) Pl. hányan regisztráltatnák magukat? A mintabeli arányt fogadjuk el a doboz szórásának megállapításához (100 fős minta választóból) (pl. 64 igen 36 nem  s=  0,64*0,36 =  0,2304 = 0,48) A standard hiba akkor  100 * 0,48 = 4,8 vagyis a regisztrálók aránya 64% ± 4,8% Ez az un. bootstrap módszer. 10 ?? db

161 WJLF Pedagógia BACsákó M.: Társadalomstatisztika161 A statisztikai becslés Konfidencia-intervallum = Milyen határok között megbízható a becslés? A normálgörbét vesszük segítségül: ± 2SH-n belül 95% biztonságú!

162 4. Szignifikanciaszámítások

163 WJLF Pedagógia BACsákó M.: Társadalomstatisztika163 Mire jó a szignifikancia-próba? Válaszol arra a kérdésre, hogy egy eredmény a véletlen műve-e, vagy valami más oka kell legyen. Más megfogalmazásban: származhat-e az eredmény a mintavétel véletlen ingadozásából?

164 WJLF Pedagógia BACsákó M.: Társadalomstatisztika164 Mire jó a szignifikancia-próba? Pl. adótörvényt egyszerűsítő törvényjavaslat A javaslat szerint a beszedett adó mennyisége nem fog változni. Mit is jelent ez? ∑ változás = új adózás – régi adózás = 0. Ha v > 0, akkor többet szednek be; ha v < 0, akkor kevesebbet szednek be.

165 WJLF Pedagógia BACsákó M.: Társadalomstatisztika165 Mire jó a szignifikancia-próba? Ellenőrzés: mekkora lehet a standard hiba? Lépések: 100 lapos mintát vettek adólapból. Mintaátlag = $; szórás 725 $ Eredhet-e a várt 0 $ és a „tényleges” -219 $ különbsége a mintavétel véletlen ingadozásából? Dobozmodellt készítenek: lappal és 100- at húznak közülük. A doboz szórását az adatok szórásával becsülik! Akkor SH =  100 * 725 $ / 100 = 72,5 $ Az átlag (-219$) a feltevéstől (0$) 3 SH-nyira van!

166 WJLF Pedagógia BACsákó M.: Társadalomstatisztika166 Mire jó a szignifikancia-próba? Mit is jelent ez? Használjunk normális közelítést! (Az adóváltozások eloszlása nem normális, de az átlag körüli ingadozás normális!) Az átlag ekkora eltérésének valószínűsége mindössze p = 1‰ – tehát nem véletlen.  tehát a kincstár valószínűleg átlagosan >200 $-t fog veszteni adófizetőnként, azaz összesen kb. 20 md-ot ( adózóval)

167 WJLF Pedagógia BACsákó M.: Társadalomstatisztika167 Mit használtunk a példában? A (null)hipotézist (változás = 0) Mintavételt (átlag, szórás) Az ellenhipotézist (változás = -219$) Dobozmodellt Az átlag körüli véletlen ingadozásról szerzett ismereteket (SH számítása) A normális közelítést

168 WJLF Pedagógia BACsákó M.: Társadalomstatisztika168 Szignifikancia-próba Nullhipotézis = Az eltérést a véletlen okozza. Ellenhipotézis = Az eltérésnek más oka van. Dobozmodell nélkül nincs korrekt szignfikancia-próba! Próbastatisztika – azt méri, mennyire térnek el az adatok a nullhipotézis szerint várható értéktől. Ezekkel kiszámítjuk a szignifikanciaszintet.

169 WJLF Pedagógia BACsákó M.: Társadalomstatisztika169 Szignifikancia-próba z-próba: z = A z-próba azt mondja meg, hogy a megfigyelt érték hány standard hibányira van a nullhipotézis alapján kiszámolt várható értéktől. A z-próbát két független minta össze- hasonlítására is használhatjuk. megfigyelt érték – várható érték standard hiba

170 WJLF Pedagógia BACsákó M.: Társadalomstatisztika170 Szignifikanciaszint Megfigyelt szignifikanciaszint = annak valószínűsége, hogy olyan szélsőséges próbastatisztikát kapunk, mint amit meg- figyeltünk – ehhez feltesszük, hogy a nullhipotézis igaz. NEM AZT jelenti, hogy mennyire valószínű a nullhipotézis, hanem azt, hogy mennyire valószínű a próbastatisztika, HA igaz a nullhipotézis.

171 WJLF Pedagógia BACsákó M.: Társadalomstatisztika171 Szignifikancia-próbák z-próba (az előbb láttuk) – nagy mintára t-próba – olyan, mint a z-próba, de kis mintán alkalmazható torzítás nélkül χ 2 - próba (khí-négyzet próba) – több kategória összehasonlítására alkalmas: összeadja a (megfigyelt érték – várható érték) SH törteket. Az összeg már nem normáleloszlású, ezért külön táblázat tartalmazza a χ 2 - görbék alatti területekhez tartozó valószín ű ségeket.

172 WJLF Pedagógia BACsákó M.: Társadalomstatisztika172 χ 2 - próba számítása  2 PRÓBA SZÁMÍTÁSA FIKTÍV PÉLDÁN: FIÚK ÉS LÁNYOK TANULMÁNYI EREDMÉNYE GYKZPJÓÖsszes F45 várható L55 várható Együtt

173 WJLF Pedagógia BACsákó M.: Társadalomstatisztika173 χ 2 - próba számítása  2 PRÓBA SZÁMÍTÁSA FIKTÍV PÉLDÁN: FIÚK ÉS LÁNYOK TANULMÁNYI EREDMÉNYE GYKZPJÓÖsszes F várható L várható Együtt

174 WJLF Pedagógia BACsákó M.: Társadalomstatisztika174 SZIGNIFIKANCIA  2 PRÓBA SZÁMÍTÁSA FIKTÍV PÉLDÁN : FIÚK ÉS LÁNYOK TANULMÁNYI EREDMÉNYE GYKZPJÓÖsszes F várható15,7522,56,75 eltérés L várható24,2522,58,25 eltérés Együtt χ 2 - próba számítása

175 WJLF Pedagógia BACsákó M.: Társadalomstatisztika175 SZIGNIFIKANCIA  2 PRÓBA SZÁMÍTÁSA FIKTÍV PÉLDÁN : FIÚK ÉS LÁNYOK TANULMÁNYI EREDMÉNYE GYKZPJÓÖsszes F várható15,7522,56,75 eltérés5,752,53,25 L várható24,2522,58,25 eltérés0,752,53,25 Együtt χ 2 - próba számítása

176 WJLF Pedagógia BACsákó M.: Társadalomstatisztika176 SZIGNIFIKANCIA  2 PRÓBA SZÁMÍTÁSA FIKTÍV PÉLDÁN : FIÚK ÉS LÁNYOK TANULMÁNYI EREDMÉNYE GYKZPJÓÖsszes F várható15,7522,56,75 eltérés 2 33,066,253,253,89 L várható24,2522,58,25 eltérés 2 0,566,2510,566,27 Együtt  összeg 10,16 χ 2 - próba számítása

177 WJLF Pedagógia BACsákó M.: Társadalomstatisztika177 A fiúk és lányok tanulmányi eredményének összehasonlításában a χ 2 - összeg = 10,16 A táblázat szabadságfoka (df) = ahány cella „szabadon” kitölthető, ha ismerjük a „peremeloszlást” (=az „összesen”-eket) – ez most itt df = 2. Nézzük meg a táblázatot (585. oldal) ! A szabadságfok = 2 sorban a legnagyobb szám 9,21 – és ott p = 1% ! χ 2 - próba számítása

178 WJLF Pedagógia BACsákó M.: Társadalomstatisztika178 Mit jelent ez? Értelmezés: Azt, hogy ilyen nagy próbastatisztikát ( χ 2 = 10,16 ) csak 1%-nál is kisebb valószínűséggel kaphatnánk véletlenül. Vagyis: Következtetés: Nyugodtan elvethetjük azt a null- hipotézist, hogy a fiúk és a lányok tanulmányi eredménye közötti eltérés oka pusztán a véletlen mintavétel. A fiúk és a lányok eredménye tényleg különbözik egymástól. χ 2 - próba számítása

179 WJLF Pedagógia BACsákó M.: Társadalomstatisztika179 ÖSSZEFOGLALÁS

180 WJLF Pedagógia BACsákó M.: Társadalomstatisztika180 Miről szólt ez a kurzus? Megszámlálható és megmérhető dolgok adatainak kezeléséről : - hogyan tudjuk leírni őket; - hogyan tudunk jellemzőik alapján következtetéseket levonni; - hogyan tudunk közöttük kapcsolatokat megállapítani; - hogyan tudunk olyanokat megismerni, amelyekhez nem férünk hozzá; - hogyan tudunk megbizonyosodni arról, hogy következtetéseink nem a véletlen művei.

181 WJLF Pedagógia BACsákó M.: Társadalomstatisztika181 Leírás: hisztogram, átlag, szórás Következtetések normálgörbével Kapcsolatok megállapítása: varianciaelemzéssel, korreláció- és regressziószámítással Az alapsokaság paramétereinek becslése mintavétellel A valószínűségszámítás alkalmazása a standard hiba kiszámítására és a minta véletlen ingadozásának ellenőrzésére (dobozmodellel) Miről szólt ez a kurzus?


Letölteni ppt "TÁRSADALOMSTATISZTIKA Előadó: Csákó Mihály egyetemi docens 30 kontaktóra + 60 egyéni munkaóra = 3 kredit (Levelező: 12 kontakt + 78 egyéni munkaóra) A."

Hasonló előadás


Google Hirdetések