Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

 Igen-nem segítségével megválaszolható kérdések 1. Egyetemi hallgatók IQ-ja nagyobb-e az átlagosnál? 2. Van-e különbség a férfiak és a nők verbális intelligenciaszintje.

Hasonló előadás


Az előadások a következő témára: " Igen-nem segítségével megválaszolható kérdések 1. Egyetemi hallgatók IQ-ja nagyobb-e az átlagosnál? 2. Van-e különbség a férfiak és a nők verbális intelligenciaszintje."— Előadás másolata:

1  Igen-nem segítségével megválaszolható kérdések 1. Egyetemi hallgatók IQ-ja nagyobb-e az átlagosnál? 2. Van-e különbség a férfiak és a nők verbális intelligenciaszintje között? 3. Teljes csöndben jobban lehet-e tanulni, mint halk zene mellett? 4. Összefügg-e a nyugalmi vérnyomásszint és a CPI teszt Tolerancia skálájának értéke?

2  X=MAWI-IQ, populáció = egyetemi hallgatók  H 0 : E(X) = 100  H 1 : E(X) < 100  H 2 : E(X) > 100  H 0 : Med(X) = 100  H 1 : Med(X) < 100  H 2 : Med(X) > 100  H 0 : E(X) = 100  H A : E(X)  100  H 0 : Med(X) = 100  H A : Med(X)  100

3  Verbális intelligencia: MAWI/VIQ, E(VIQ/ férfi ) =  f, E(VIQ/ nő ) =  n  H 0 :  f =  n  H 1 :  f <  n  H 2 :  f >  n  H 0 :  f =  n  H A :  f   n

4   A fenti hipotézisek a vizsgált változók valamilyen populációbeli jellemzőjére (várható érték, medián stb.) vonatkoznak.  Közülük egyszerre mindig csak egy lehet igaz (egymást kizáró alternatívák).  H 0, a nullhipotézis mindig csak egyféleképpen valósulhat meg. Az ellenhipotézisek (alternatív hipotézisek) végtelen sokféleképpen.

5  A statisztikai hipotézisvizsgálat  Lényege: A véletlen mintából valamilyen statisztikai eljárással javaslatot kell tenni arra, hogy a nullhipotézis az igaz, vagy pedig az (egyik) ellenhipotézis.  A statisztikai hipotézisvizsgáló eljárásokat statisztikai próbáknak nevezzük.  Statisztikai próba = döntési szabály

6  X-minta H0H0 H1H1 H2H2 Melyik az igaz? Statisztikai próba

7  Egy példa: melyik hipotézis az igaz?  H 0 : E(X) = 100  H 1 : E(X) < 100  H 2 : E(X) > 100  X = (108, 99, 105, 135, 124)  X = (65, 91, 58, 73, 69)  X = (97, 107, 93, 104, 101) Lehetséges minták

8  Néhány példa intervallumbecslésre (  nem ismert,  = 0,95) C 0,95 = x ± t  s  t   1,98 Változónátlag szórás s  nc1c1 c2c2 Pulzus11691,422,432,0887,2795,52 SZISZ117134,3712,851,19132,01136,72 DIASZ11778,1810,831,0076,2080,16

9  Egy eljárás a H 0 : E(X)=100 hipotézis vizsgálatára 1. Intervallumbecslés E(X)-re: C 0,95 = (c 1 ; c 2 ) X c2c2 c1c1 2. E(X) valószínűleg c 1 és c 2 között van. 3. Ha a 100 is c 1 és c 2 között van, tartsuk meg H 0 -t! 4. Ha c 2 < 100, fogadjuk el a H 1 : E(X) < 100 hipotézist! 5. Ha c 1 > 100, fogadjuk el a H 2 : E(X) > 100 hipotézist! 100?

10  Egy másik eljárás a H 0 : E(X) = A alakú hipotézisek vizsgálatára (  ismert) Ha H 0 : E(X) = A igaz, akkor az  u =  mennyiség standardizáltja, ami X normalitása, illetve nagy n-ek esetén N(0,1) eloszlású. Mivel |u| < 1,96 95%-os valószínűséggel teljesül, nem számítunk arra, hogy u  -1,96 vagy u  1,96 következik be. Ha mégis ezek lépnek fel, arra gondolunk, hogy H 0 nem igaz.

11  Példák l Fej vagy írást játszunk és partnerünk 10-szer egymás után nyer a saját érméjével. Mire következtetünk ebből? l 21-ezünk és partnerünk 3-szor egymás után 2 ászt oszt magának. Mire gondolunk? l 8 fős csoport egymás után két nyelvi tesztet tölt ki. 8 személy közül 7-nél az első teszt- eredmény a jobb. Hogyan értelmezzük ezt?

12  X-minta H 1 : E(X) <  0 H0H0 H 2 : E(X) >  0 H 0 : E(X) =  0  u =   0 u  -1,96u  1,96 u-próba Feltételek: X normális eloszlású,  ismert  0, N(0,1) 0,025 |u| < 1,96

13  Mi lehet az igazság?   H0H0 H 0 :  =100  =15, n = 25 H2H2 H1H1 uuu  u =  100

14  A H 0 : E(X) = A hipotézis vizsgálata, ha  -t nem ismerjük Ha H 0 : E(X) = A igaz, akkor a t =  mennyiség X normalitása (illetve nagy n) esetén t-eloszlású, f = n -1 szabadságfokkal. Mivel |t| < t 0,05 95%-os valószínűséggel teljesül, nem számítunk arra, hogy t  -t 0,05 vagy t  t 0,05 következik be. Ha mégis ezek lépnek fel, arra gondolunk, hogy H 0 nem igaz. s/

15  X-minta H 1 : E(X) < AH0H0 H 2 : E(X) > A H 0 : E(X) = A t  -t 0,05 t  t 0,05 |t| < t 0,05 Egymintás t-próba ss t =  Feltétel: X normális eloszlású   t  -t 0,05 t 0,05

16  A H 0 : E(X) = A hipotézis vizsgálata az egymintás t-próbával Hogyan döntsünk az egyes esetekben? VáltozóátlagAt f = n-1 t 0,10 t 0,05 t 0,01 Pulzus91,4805, ,661,982,62 SZISZ134,41303, ,661,982,62 DIASZ78,290-11, ,661,982,62 P/K-E6,203, ,661,982,62 SZ/K-E0,6500, ,661,982,62 D/K-E-1,10-0, ,661,982,62

17  A kétoldalú statisztikai próba alapfogalmai a t-próbán bemutatva (szignifikanciaszint =  )  t  t 0,05 -t 0,05 Elfogadási tartomány Kritikus tartomány Kritikus tartomány Kritikus értékek

18  A felső egyoldalú statisztikai próba alapfogalmai a t-próbán bemutatva (szignifikanciaszint =  )  t  t 0,10 Elfogadási tartomány Kritikus tartomány Kritikus érték H 0 : E(X) = A H 2 : E(X) > A Feltétel: H 1 : E(X) < A érdektelen

19  Az alsó egyoldalú statisztikai próba alapfogalmai a t-próbán bemutatva (szignifikanciaszint =  )  t  t 0,10 Elfogadási tartomány Kritikus tartomány Kritikus érték H 0 : E(X) = A H 1 : E(X) < A Feltétel: H 2 : E(X) > A érdektelen

20  A statisztikai próba hibái l H 0 elutasítása esetén: –Hiba: jogtalan elutasítás –Hiba neve: I. fajta hiba vagy elsőfajú hiba –Hiba valószínűsége  szignifikanciaszint –Mi függ tőle: a próba érvényessége l H 0 megtartása esetén: –Hiba: jogtalan elfogadás –Hiba neve: II. fajta hiba vagy másodfajú hiba –Hiba valószínűsége: általában ismeretlen –Mi függ tőle: a próba érzékenysége

21  Szokásos statisztikai szóhasználat  Ha a statisztikai próbában 0,95 megbízhatósággal (azaz  = 0,05 elsőfajú hibaszintet választva) elutasíthatjuk a H 0 nullhipotézist, akkor ezt mondjuk: a próba szignifikáns (5%-os szinten).  Speciálisan a H 0 : E(X) = A hipotézis elutasítása esetén ezt mondjuk: szignifikánsan különbözik az A hipotetikus értéktől, éspedig – t < -t 0,05 esetén szignifikánsan kisebb, – t > t 0,05 esetén pedig szignifikánsan nagyobb, mint A.

22  Szokásos statisztikai szóhasználat  Ha a statisztikai próbában a H 0 nullhipotézist  = 0,05 szignifikanciaszinten megtartjuk, akkor ezt mondjuk: a próba 5%-os szinten nem szignifikáns.  Speciálisan a H 0 : E(X) = A hipotézis megtartása esetén ezt mondjuk: az átlag nem különbözik szignifikánsan az A hipotetikus értéktől.  FONTOS: a H 0 nullhipotézis megtartása nem jelenti azt, hogy a H 0 nullhipotézis igaz. Csupán nincs elég indokunk arra, hogy elutasítsuk. (Ártatlanság vélelme.)

23  Milyen szignifikanciaszinten döntsünk?  Ha 10%-os szintet használunk, akkor a H 0 nullhipotézis elutasítása esetén 90% az esélye annak, hogy helyesen döntünk. A 10%-os hibalehetőség túl nagy, ezért ezt az eredményt csak tendenciaszerű jelzésként értelmezzük.  1%-os szinten a 99%-os megbízhatóság kiváló. Ekkor azonban ritkábban utasítjuk el H 0 -t, mint kellene, ami csökkenti a próba érzékenységét.  Tapasztalat: az 5%-os szint használata az ajánlott.

24  Két változó vagy populáció összehasonlítása 1. Szkizofréneknél különbözik-e egymástól a verbális és a performációs IQ szintje? 2. Teljes csöndben jobban lehet-e tanulni, mint halk zene mellett? 3. A neurotikusok toleranciája kisebb-e, mint a pszichopatáké? 4. Jobbak-e azok a házasságok, amelyekben a férj és a feleség iskolai végzettsége megegyezik, mint amelyekben különbözik?

25  Két középérték összehasonlítása Példák:  H 0 : E(VIQ/Sch) = E(PIQ/Sch)  H 0 : E(Telj/csönd) = E(Telj/halk zene)  H 0 : E(CPI-Tol/Neurot) = E(CPI-Tol/Ppata)  H 0 : E(Ház.jó/azon.isk) = E(Ház.jó/kül.isk) Általában (ha X és Y kvantitatív): H 0 :  1 =  2

26  Egy populáció, két változó esete  Példa: Szkizofréneknél VIQ és PIQ összevetése.  Megoldás: Z = VIQ-PIQ, vagy esetleg (kizárólag arányskálájú változóknál) Z = Y/X.  Az új nullhipotézis: H 0 : E(Z) = 0 vagy H 0 : E(Z) = 1.  Statisztikai próba: egymintás t-próba.  Végrehajtás: véletlen mintavétel, z-adatok kiszámítása, végül a Z-mintán egymintás t-próba.

27  Két populáció, egy változó esete Példa: Férfiak és nők verbális IQ-jának összevetése. Nullhipotézis: H 0 :  1 =  2 Mintavétel: A két populációból egymástól függetlenül kiválasztunk egy-egy véletlen mintát. Számítás: A két mintában kiszámítjuk az átlagot és a varianciát: Elemszám ÁtlagVariancia 1. Minta: n 1 x 1 var 1 = (s 1 ) 2 2. Minta: n 2 x 2 var 2 = (s 2 ) 2

28  A kétmintás t-próba Ha igaz a H 0 :  1 =  2 nullhipotézis és X normális eloszlású, akkor  1 =  2 teljesülése esetén a statisztikai mennyiség f = f 1 + f 2 szabadságfokú t-eloszlást követ, ahol f 1 = n 1 -1, f 2 = n 2 -1 és

29  X-minta H 1 :  1 <  2 H0H0 H 2 :  1 >  2 Feltételek: független minták, normális eloszlás,  1 =  2 t  -t 0,05 t  t 0,05 |t| < t 0,05 Kétmintás t-próba H 0 :  1 =  2   t  -t 0,05 t 0,05

30  A Welch-féle d-próba Ha igaz a H 0 :  1 =  2 nullhipotézis és X normális eloszlású, akkor a statisztikai mennyiség közelítőleg f szabadságfokú t- eloszlást követ, ahol a=Var 1 /n 1, b=Var 2 /n 2 jelöléssel

31  X-minta H 1 :  1 <  2 H0H0 H 2 :  1 >  2 H 0 :  1 =  2 d  -t 0,05 |d| < t 0,05 Welch-féle d-próba Feltételek: független minták, normális eloszlás d  t 0,05   t  -t 0,05 t 0,05

32  A Fisher-féle F-próba Kérdés: Két populáció szórása megegyezik-e? Ez fontos a kétmintás t-próba végrehajthatósága szem- pontjából, de önmagában is izgalmas probléma. F-próba: Ha igaz a H 0 :  1 =  2 nullhipotézis és X normális eloszlású, akkor az statisztikai mennyiség (f 1, f 2 ) szabadságfokú F-eloszlást követ, ahol f 1 a nagyobbik, f 2 pedig a kisebbik mintavariancia szabadságfoka.

33  X-minta H 0 :  1 =  2 H A :  1   2 H 0 :  1 =  2 F < F 0,025 F  F 0,025 Fisher-féle F-próba Feltételek: független minták, normális eloszlás  F 0,025   F 

34  Robusztus statisztikai próbák  A Welch-féle d-próba a kétmintás t-próba robusztus (a feltételekre kevésbé érzékeny) változatának tekinthető, mert ugyanazon a nullhipotézis vizsgálatára alkalmas, csak enyhébb feltételek mellett.  Az F-próba robusztus változatai a szóráshomogenitás ellenőrzésére, amelyek a normalitás megsértésére kevésbé érzékenyek:  Levene-próba  O’Brien-próba

35  Két kvantitatív változó kapcsolata

36  Mi az, hogy kapcsolat?  Együttjárás, együttmozgás, együttváltozás  Hatás, függés: “Úgy táncolsz, ahogy én fütyülök”  Függetlenség:  “Járja a maga útját”

37  Determinisztikus függvénykapcsolat  Ha egy autó 80 km/óra sebességgel halad az autó- pályán, akkor t óra alatt hány km-t tesz meg?  Válasz: s = 80t t = Eltelt idő (óra) S = Megtett út (km)

38  Nem determinisztikus összefüggések l Tanulj fiam, –hogy szép legyen a bizonyítványod, –hogy meg ne bukj matekból, –hogy felvegyenek az egyetemre, –hogy vidd valamire az életben.

39  A kétváltozós pontdiagram Hány órát tanul naponta Tanulmányi átlag

40  Egy KSH-vizsgálat adatai (I) Születési súly (kg) Születési testhossz (cm)

41  Egy KSH-vizsgálat adatai (II) Testsúly 10 éves korban (kg) Testmag. 10 évesen (cm)

42  Egy KSH-vizsgálat adatai (III) Apa testmagassága (cm) Gyerek testmag. 10 év (cm)

43  Egy KSH-vizsgálat adatai (IV) Anya testsúlya (kg) Gyerek tests. 10 év (kg)

44  Az előrejelzés problémája l Ha az anya 50 kg súlyú, hány kiló lehet 10 éves gyermeke?

45  Előrejelzés egy egyenes segítségével Anya testsúlya (kg) Gyerek tests. 10 év (kg)

46  Anya testsúlya (kg) Gyerek tests. 10 év (kg) Melyik a legjobb előrejelző egyenes?

47  Az az egyenes a legjobb, amelyik a legközelebb fekszik a pontdiagram pontjaihoz Az egyenesek az X változó különféle lineáris függvényeinek grafikonjai. Közös képletük: f(x) = a + bx Pl. f(x) = x f(x) = x –f(1) = ·1 = 23 f(1) = ·1 = 24 –f(2) = ·2 = 26 f(2) = ·2 = 17 –f(3) = ·3 = 29 f(3) = ·3 = 10

48  X változó Y változó a y = a + bx  ‘a’ paraméter = Y tengelymetszet ‘b’ paraméter = egyenes hajlásszögének tangense: b = tg (  Az egyenes paraméterei (együtthatói)

49  Az előrejelzés alapfogalmai l Jósolt (függő) változó: Y l Jósló (előrejelző, független) változó: X l Lineáris előrejelzés (jóslás): Ŷ = a + bX l Az x értékhez tartozó igazi Y-érték: y l Az x értékhez tartozó előrejelzés: ŷ = a + bx l Az előrejelzés hibája egy személynél: (y - ŷ) 2 l A legjobb előrejelzésnél E((Y - Ŷ) 2 ) minimális

50  Szokásos szóhasználat l Legjobb előrejelző egyenes: regressziós egyenes Regressziós egyenes képlete, y =  +  x, a lineáris regressziós függvény/egyenlet l Regressziós egyenlet meghatározása: regressziós feladat l Regresszió hibája = hibavariancia: Res = E((Y - Ŷ ) 2 )  és  paraméter: regressziós együtthatók

51  Példák lineáris regresszióra Változó Átlag Variancia Regressziós egyenlet X: SúlySzül 3,21 0,25 Y = 26,05 + 2,24X Y: Súly10 33,2 46,4 Res = 45,20 X: ThosszSzül 50,2 6,4 Y = 96,88 + 0,83X Y: Thossz10 138,7 41,5 Res = 37,09 X: Anyatesth 161,1 38,3 Y = 77,66 + 0,38X Y: Thossz10 138,7 41,5 Res = 36,02 X: Apatesth 173,4 46,0 Y = 78,42 + 0,35X Y: Thossz10 138,7 41,5 Res = 35,96

52  Az Y kvantitatív változó előrejelzése X ismerete nélkül, illetve X ismeretében Y legjobb előrejelzése abban az esetben, ha nem tudunk semmit X-ről vagy más változókról:  Y Ezen előrejelzés hibája: E((Y -  Y ) 2 ) = Var(Y) l X-et is felhasználva a lekisebb hibájú előrejelzés: Ŷ =  +  X, az X változó Y-ra vonatkozó lineáris regressziós függvénye. Ezen előrejelzés hibája, az ún. hibavariancia: E((Y - Ŷ) 2 ) = Res

53  Milyen szoros az együttjárása Y-nak az X kvantitatív változóval? Minél informatívabb X az Y változóra nézve, annál kisebb lesz Res a Var(Y)-hoz viszonyítva, vagyis annál kisebb lesz a Res/Var(Y) hányados. Viszont annál nagyobb lesz a mutató, az X változónak az Y változóra vonatkozó lineáris determinációs együtthatója.

54  Alapösszefüggések a determinációs együtthatóra 0  Det(X,Y)  1 l Det(X,Y) = 0 csakkor, ha Res = Var(Y). Ekkor X nem tartalmaz lineáris jellegű információt Y-ra nézve. Det(X,Y) = 1 csakkor, ha Res = 0. Ekkor Y hibamentesen előrejelezhető X által. X determinisztikusan meghatározza Y-t, éspedig lineáris függvény formájában.

55  A determinációs együttható l Jól mutatja, hogy Y milyen mértékben függ lineárisan X-től, hogy X milyen mértékben határozza meg, “determinálja” Y-t. l FONTOS: Det(X,Y) = Det(Y,X). l Jelzi, hogy az X és az Y változó milyen mértékben határozza meg egymást, vagy másképpen: X és Y milyen szoros lineáris típusú kapcsolatban van egymással.

56  Két véletlen változó függetlensége DEFINÍCIÓ: Y független X-től, ha Y eloszlása ugyanaz bármely X=x mellett KÉRDÉS: Függ-e a személy magassága a nemétől?

57  Függ-e a születési testhossz a születési súlytól? És fordítva? Születési súly (kg) Születési testhossz (cm)

58  Függ-e az Y változó X-től? , YY X X

59  Függ-e az Y változó X-től? X Y

60  A függetlenség kölcsönös FONTOS: Ha Y független X-től, akkor X is független Y-tól

61  Függetlenség és elméleti átlag l Bármely X és Y kvantitatív változóra: E(X+Y) = E(X) + E(Y) l Ha X és Y független egymástól, akkor E(X·Y) = E(X)·E(Y), vagyis ekkor E(X·Y) - E(X)·E(Y) = 0, de a megfordítás nem mindig igaz.

62  Két kvantitatív változó kovarianciája l DEFINÍCIÓ: Cov(X,Y) = E(X·Y) - E(X)·E(Y) l Ha X és Y független változók, akkor Cov(X,Y) = 0 l A megfordítás nem mindig igaz, vagyis nulla kovariancia esetén X és Y nem biztos, hogy független egymástól.

63  Két kvantitatív változó korrelációs együtthatója l Ha X vagy Y szórását megkétszerezzük, kétszeresére nő a kovarianciájuk is. l Szórásokkal leosztott, ún. “standardizált” kovariancia = korrelációs együttható:

64  Összefüggés a korrelációs és a determinációs együttható között A korrelációs együttható négyzete mindig megegyezik a determinációs együtthatóval:  (X,Y) 2 = Det(X,Y)  (X,Y) tehát az X és Y közti összefüggés mértékét jelzi, vagyis a lineáris típusú kapcsolat szorosságának mérőszáma.

65  A korrelációs együttható jellemzői - 1   (X,Y)  1 Ha X és Y független, akkor  (X,Y) = 0. Ha  (X,Y) = 0, vagyis ha X és Y korrelálatlan, akkor nem feltétlenül függetlenek, de biztos, hogy nincs köztük lineáris típusú összefüggés (U vagy fordított U alakú kapcsolatban persze lehetnek). l Ha X és Y együttes eloszlása normális, azaz bármely rögzített X = x mellett Y normális, akkor a függetlenség és a korrelálatlanság ekvivalens.

66  A lineáris transzformáció hatása  -ra  abszolút értéke nem változik, legfeljebb az előjele Ha U = 10X + 5 és V = 4Y  10, akkor  (U, V) =  (X, Y) Ha U = 10X + 5 és V = 10  4Y, akkor  (U, V) =  (X, Y)

67  A korreláció nem feltétlenül oki kapcsolat, csak egy együttjárás Ha  (X, Y) > 0, akkor három eset lehetséges: a)X pozitív hatással van Y-ra b)Y pozitív hatással van X-re c)Egy Z háttérváltozó hat egyidejűleg X-re és Y-ra

68  Regresszió és korreláció kapcsolata Az elméleti korrelációs együttható szokásos jelölései:  (X,Y),  XY vagy  A lineáris regresszió képlete: Ŷ =  +  X vagy Ŷ =  YX +  YX X l Ekkor és z Ŷ =  z X      X Y YX

69  Kérdés Férj és feleség IQ-ja között  = 0,50 a korreláció. Várhatóan milyen IQ-jú a férj, ha a feleség IQ-ja a)100? b)140? c)70?

70  Válasz A férj várható IQ-ja (  = 0,50): a)100  100 b)140  120 c)70  85

71  Két következmény Ha X értékét 1 egységgel növeljük, akkor Y értéke várhatóan  YX egységgel nő. Ha viszont  X egységgel növeljük, akkor Y értéke várhatóan  Y egységgel nő. Speciálisan, ha  X =  Y, akkor  = .  XY előjele összhangban van a regressziós egyenes irányával. Ha a regressziós egyenes emelkedő, akkor X és Y között pozitív a korreláció. Ha ereszkedő, akkor  XY negatív.

72  A korrelációs együttható két fontos jelentése  milyen mértékben „öröklődik” a szélsőségesség X-ről Y-ra, illetve Y-ról X-re  Szélsőségesség ~ standard érték    determinációs együttható, megmagyarázott variancia hányad, relatív hibacsökkenés

73  

74  Ha az X vagy az Y változó értékskáláját szűkítjük, akkor a korreláció általában csökken  

75  

76  

77  

78  

79  A mintabeli korrelációs együttható (Pearson-féle r) l Jelölése: r XY vagy r l Egyik képlete: l Mintabeli kovariancia: s XY = ∑(x i – x)(y i – y)/(n – 1) r XY a  XY elméleti korrelációs együttható egyik pontbecslése 

80  X-minta H 1 :  XY < 0 H0H0 H 2 :  XY > 0 Feltétel: X és Y együttes eloszlása legyen normális t  -t 0,05 t  t 0,05 |t| < t 0,05 Korrel. eh. vizsgálata H 0 :  XY = 0 (f = n  2)   t  t 0,05 -t 0,05

81  X-minta H 1 :  XY < 0 H0H0 H 2 :  XY > 0 Feltétel: X és Y együttes eloszlása legyen normális r  -r 0,05 r  r 0,05 |r| < r 0,05 Korrel. eh. vizsgálata H 0 :  XY = 0 r xy kiszámítása (f = n  2) A t-táblázat helyett használható az r XY kritikus értékeinek táblázata is.

82  Dichotóm változók vizsgálata  Dichotóm (kétértékű) változók –Személy neme (x 1 = férfi, x 2 = nő) –Egyetért-e... (x 1 = igen, x 2 = nem) –Előfordul-e... (x 1 = igen, x 2 = nem) –Megoldotta-e... (x 1 = igen, x 2 = nem) –Beteg-e (x 1 = igen, x 2 = nem)  Bináris változó: az a speciális eset, amikor x 1 = 0 és x 2 = 1

83  Dichotóm változók eloszlása l Eloszlás: Az x 1 és x 2 érték előfordulási valószínűsége, azaz P(x 1 ) és P(x 2 ). l Pl. a ‘Személy neme’ egy lehetséges eloszlása: {P(ffi) = 0,45, P(nő) = 0,55}. l A ‘Személy neme’ változó szintén lehetséges eloszlása: {P(ffi) = 0,60, P(nő) = 0,40}. l Mindig igaz: P(x 1 ) + P(x 2 ) = 1

84  Egy dichotóm változó vizsgálata egy populációban l Példa: pszichológia szakra felvételizők között a fiú-lány arány ugyanakkora-e? l Nullhipotézis: H 0 : P(ffi) = 0,5, P(nő) = 0,5 l Egy valódi vizsgálat adatai: –1981-ben 94 felvételiző között 16 fiú és 78 lány volt (kapott gyakoriságok: n i ) –Ha H 0 igaz lenne, 94-ből fiúra és lányra számítanánk (várt/elméleti gyakoriságok: i )

85  Eloszlásvizsgálat khi-négyzet-próbával  Minél nagyobb az eltérés a kapott (n i ) és a várt ( i ) gyakoriságok között, annál valószínűbb, hogy a nullhipotézis nem igaz.  Az eltérés egy lehetséges mértéke:  2 = (n ) 2 / 1 + (n ) 2 / 2  Ha igaz a H 0 hipotézis, akkor ez khi-négyzet eloszlású, f = 1 szabadságfokkal.

86  A fenti példa számításai  2 = (16 -  ) 2 /  + (78 -  ) 2 /   2  2 (f=1) Emiatt a H 0 hipotézist elutasítjuk, s azt mondjuk: A fiúk aránya szignifikánsan kisebb a lányokénál. 

87  Egy másik példa  2 = (10 -  ) 2 /  + (20 -  ) 2 /   2  2 (f=1) Az eredmény tehát 5%-os szinten szignifikáns, vagyis a dobókocka 95%-os valószínűséggel hamis.  Egy dobókockával 30-szor dobunk szabályosan. Összesen 10 hatost kapunk. Hamis a kocka?

88  X-minta H0H0 H A : P(x 1 )  p 1, P(x 2 )  p 2 Feltétel: i  5  2 <  2 Khi-négyzet-próba H 0 : P(x 1 ) = p 1, P(x 2 ) = p 2 (f = 1)  2   2 0 0,2 0,4 0,6    22 0,05    f=1  0,05 

89  Két populáció összehasonlítása egy dichotóm változó segítségével  Példa: Matematika és pszichológia szakra felvételizők között van-e különbség a nemi megoszlás tekintetében?  Nullhipotézis: A két populációban a nemi megoszlás ugyanaz, vagyis P(fiú/matek) = P(fiú/pszich) és P(lány/matek) = P(lány/pszich)

90  Egy konkrét példa H 0 igaz volta esetén a közös fiú-arány kb. 130/320, így a várt fiú-gyakoriság a matek és a pszichológus szakon: 11 = 80  130/320 = 32,5 és 21 = 240  130/320 = 97,5 Hasonlóan a közös lány-arány kb. 190/320, így 12 = 80  190/320 = 47,5 és 22 = 240  190/320 = 142,5

91  H 0 igaz volta esetén a A 2×2-es khi-négyzet-próba statisztikai mennyiség f = 1 szabadságfokú khi- négyzet-eloszlást követ, így  2 < 3,841 esetén H 0 -t megtartjuk,  2  3,841 esetén pedig H 0 -t 5%-os szignifikanciaszinten elutasítjuk (  2 = 3,841). 0,05

92  Számolás: kontingenciatáblázatból Kapott gyakoriságok 32,5 47,5 97,5142,5 Várt gyakoriságok   2  44,92  6,635  2 (f=1)  Konklúzió: a különbség 1%-os szinten szignifikáns. 

93  Általános eset MintákX=x 1 2 Összesen 1. Mintan 11 n 12 n 1 2. Mintan 21 n 22 n 2 Összesenm 1 m 2 N ij = (n i  m j )/N Alkalmazási feltétel: ij  5 (f = 1)

94  Két dichotóm változó eloszlásának összehasonlítása egy populációban l Példa: Egy középiskolai osztályban előadást tartottak a dohányzás ártalmairól. Ezután 36 tanuló közül 8-an leszoktak, 3 tanuló pedig rászokott a dohányzásra. Volt-e hatása a felvilágosító előadásnak? l Nullhipotézis: A dohányzás dichotóm változója eloszlása az előadás előtt és után ugyanaz. –Különbségváltozó: x 1 = leszokik, x 2 = rászokik –Nullhipotézis: H 0 : P(x 1 ) = P(x 2 )

95  l Adattáblázat: Dohányzik?Utána igenUtána nem Előtte igen ab = 8 Előtte nem c = 3d l Képlet és számolás: McNemar-próba: Alkalmazási feltétel: (b+c)/2  5, azaz b+c > 10

96  Egy példa  40 fős évfolyamon 12 kérdésből álló vizsgatesztet írattak. Az 1. feladatot 28-an, a 2. feladatot pedig 20-an oldották meg helyesen. Szignifikánsan nehezebbnek tekinthető-e a 2. feladat?  A fenti kérdésre a megadott az adatok alapján nem lehet válaszolni.  Hiányzik: n(1. jó, 2. rossz) és n(1. rossz, 2. jó)

97  l Megfelelő adattáblázat: Megoldás2. helyes2. helytelen 1. helyesb 1. helytelenc l A McNemar-próba képlete:

98  Két dichotóm változó kapcsolatának vizsgálata DohányzikIgenNemÖsszesen Igen Nem Összesen Könnyen teremt baráti kapcsolatokat 15 éves lányok Függetlenségvizsgálat  homogenitásvizsgálat

99  Sorösszegek szerinti százalékok táblázata DohányzikIgenNemÖsszesen Igen86,1%13,9%100% Nem58,0%42,0%100% Összesen61,7%38,3%100% Könnyen teremt baráti kapcsolatokat 15 éves lányok

100  Oszlopösszegek szerinti százalékok táblázata DohányzikIgenNemÖsszesen Igen 18,3% 5,0% 13,1% Nem 81,7% 95,0% 86,9% Összesen100,0% Könnyen teremt baráti kapcsolatokat 15 éves lányok

101  A  2 -próba számolása 2×2-es kontingenciatáblázatból  Formailag ugyanúgy végzendő, mint két csoport összehasonlítása esetén.  A fenti példa esetében  Mivel  2 > 6,635 (f=1), az eredmény p < 0,01 (azaz 1%-os) szinten szignifikáns.

102  A kapcsolat szorosságának mérése dichotóm változók esetén  Kontingencia-együttható:  Yule-féle asszociációs együttható:

103  Néhány összefüggés a kapcsolati mutatókra -1    1 -1    1  2 =  2 /N l A fenti gyakorisági táblázathoz kapcsolódóan  ,,és


Letölteni ppt " Igen-nem segítségével megválaszolható kérdések 1. Egyetemi hallgatók IQ-ja nagyobb-e az átlagosnál? 2. Van-e különbség a férfiak és a nők verbális intelligenciaszintje."

Hasonló előadás


Google Hirdetések