Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Többváltozós adatelemzés 2. előadás. Keresztábla elemzés Más néven kontingencia tábla Két kategória változó együttes eloszlását mutataja Általában nominális.

Hasonló előadás


Az előadások a következő témára: "Többváltozós adatelemzés 2. előadás. Keresztábla elemzés Más néven kontingencia tábla Két kategória változó együttes eloszlását mutataja Általában nominális."— Előadás másolata:

1 Többváltozós adatelemzés 2. előadás

2 Keresztábla elemzés Más néven kontingencia tábla Két kategória változó együttes eloszlását mutataja Általában nominális vagy ordinális mérési szintű változókra használjuk

3 Kereszttábla

4

5

6 Mit vizsgálunk? Független-e a két változó eloszlása, vagy valamilyen (a véletlen ingadozáson túlmutató) összefüggés van a változók között. Pl.: akik tornateremmel rendelkeznek, nagyobb valószínűséggel rendelkeznek könyvtárral is. Pl.: vannak olyan fenntartók, akik nagyobb gondot fordítanak (több forrás áll rendelkezésükre) a tornateremre.

7 Hogy vizsgáljuk Amennyiben a változók függetlenek, akkor az együttes bekövetkezési valószínűség a parciális bekövetkezési valószínűségek szorzata.

8 Független vs. tényleges

9 Függetlenség tesztelése Pearson: Likelihood arány:

10 Függetlenség tesztelése

11 A függetlenség nemcsak az arányoktól függ, hanem a mintanagyságtól is

12 Asszociáció szorosságának mérése Χ 2 alapú mutatószámok: –Phi –Cramer V –Kontingencia együttható

13 Asszociáció szorossága

14 A mutatók értékei 0 és 1 között vannak (elméleti határ) –0, ha nincs kapcsolat a két változó között (függetlenség) –1, ha determinisztikus kapcsolat van a két változó között

15 Az asszociáció mutató számai nem függnek a csoport méretétől

16 Asszociáció szorosságának mérése PRE (Proportional Reduction of Errors) alapú mutatószámok –Guttman féle lambda Azt vizsgálja, hogy mi a legjobb becslés különböző kategóriák esetén, és ezáltal mennyivel csökkenthető a bizonytalanság

17 Guttman féle lambda

18 (30-19)+(69-46)+(135-43)+ ( )+(171-57)+(70-28)=487 lambda=1-487/( )=1-0,841=0,159 A besorolási bizonytalanság 16%-kal csökkenthető, ha figyelembe vesszük a tanulók szorgalmát A mutató értéke 0 és 1 között van: –0: nem tudunk semmit javítani a besoroláson –1: a besorolás tökéletes (determinisztikus kapcsolat)

19 Guttman féle lambda

20

21 Hátránya, hogy ha valamelyik kategória gyakrabban fordul elő a többinél, akkor a lamba-ra 0 adódik a szignifikáns kapcsolat esetén is.

22 Associáció mérése További PRE alapú mutatószámok: –Goodman-Kruskal féle tau –‘Uncertainty coefficient’ Nemcsak a leggyakoribb kategóriaértéket veszik figyelembe, hanem a többit is.

23 PRE alapú mutatószámok

24 Ordinális változók esetén a kapcsolat szorossága Ordinális változók esetén nemcsak a kacsolat szorosságát lehet meghatározni, hanem annak irányát is (nagyobb értékhez inkább nagyobb érték tartozik, vagy épp fordítva)

25 Kapcsolat szorossága Goodman Kruskal féle gamma: –Hány olyan pár van az adatbázisban, ahol az első változó értékéhez a második változó nagyobb értéke társul –Hány olyan pár van, amikor az első változó nagyobb értékéhez a második változó kisebb értéke térsul –Hány olyan eset áll fenn, ami egyik fenti kategóriába sem fér bele (ún. csomósodás)

26 Goodman Kruskal féle gamma Sorszámmagatartásszorgalom Pozitív irány: Negatív irány: Csomósodás:

27 Goodman Kruskal féle gamma Az értékek kereszttáblából is számolhatók: Pozitív irány: 19*( )+17*( …+28)+ +…+51*28 Negatív irány 17*( )+15*( …+0)+…+ +20*( )

28 Goodman Kruskal féle gamma Pozitív irányok (concordant) számát jelölje P Negativ irányok (disconcordant) számát jelölje Q gamma=(P-Q)/(P+Q)

29 Goodman Kruskal féle gamma A mutató értéke -1 és 1 között van. Amennyiben a két változó kapcsolatában nem mutatható ki összefüggés a mutató értéke 0. Ha kimutatható és a nagyobb értékhez nagyobb tartozik, akkor pozitív, ha nagyobb értékhez kisebb tartozik negatív a mutató értéke

30 Probléma nagysága ötfokú skálán: A tanulók iskolai magatartása Változógamma Probléma nagysága ötfokú skálán: A tanulók hiányzása 0,548 Probléma nagysága ötfokú skálán: A tanulók szorgalma 0,632 Probléma nagysága ötfokú skálán: A tanárok szaktárgyi felkészültsége 0,279 Probléma nagysága ötfokú skálán: A tanárok módszertani felkészültsége 0,305 Probléma nagysága ötfokú skálán: A tanárok lelki-szellemi kondíciója 0,265 Probléma nagysága ötfokú skálán: A tanárok iskolán kívüli elfoglaltságai 0,179 Probléma nagysága ötfokú skálán: A tankönyvkínálat 0,228 Probléma nagysága ötfokú skálán: A taneszközök megléte illetve hiánya 0,198

31 További mutatók Abban különböznek, hogy hogyan kezelik a ‘csomósodást’ –Sommers féle d –Kendall féle tau-b –Kendall féle tau-c

32 További mutatók

33 Nominális vs. ordinális?

34

35 Vélemények egyezősége Négyzetes táblákra alkalmazható csak, ahol a két vizsgált változó ugyanazokat az értékeket veszi fel Azt vizsgálja csak, hogy a két változó ugyanazokat az értékeket veszi-e fel vagy sem, azaz csak a fődiagonálisban lévő cellákat vizsgálja Tipikus alkalmazása, ha egy kisérlet előtt és után is megkérdezzük a vizsgált személy véleményét, vagy ha két különböző személy (pl házaspár) véleményét kérdezzük ugyanarról a dologról

36 Vélemények egyezősége

37 Kappa Kappa értéke: – 0, ha az egyezőség csak a véletlennek tudható be, –pozitív, ha a vélemények egyeznek (1, ha tökéletes egyezőség van), –negatív, ha nem egyeznek (legkisebb értéke nem -1) Inkább csak tesztelésre alkalmas, összehasonlításra nem

38 Miben különbözik a függetlenség tesztelésétől?

39

40 Szimmetrikusság tesztelése Alapevetően nem a függetlenséget teszteljük, hanem egyfajta változatlanságot Először gyógyszerkisérleteknél alkalmazták. Feljegyezték, hogy egy adott betegség a vizsgált személynél megállapítható-e vagy sem, utána kapott kezelték egy vegyülettel és később megint megvizsgálták, hogy a betegség nála kimutatható-e vagy sem. A kérdés az, hogy a gyógyszernek van-e hatása vagy nincs.

41 Szimmetrikusság tesztelése Lehet, hogy alapvetően nem független a két időpontban diagnosztizált betegség, mert például a páciens védettséget szerez. Tehát a χ 2 teszt nem ad kielégítő bizonyítékot a gyógyszer hatékonyságára

42 Szimmetrikusság tesztelése


Letölteni ppt "Többváltozós adatelemzés 2. előadás. Keresztábla elemzés Más néven kontingencia tábla Két kategória változó együttes eloszlását mutataja Általában nominális."

Hasonló előadás


Google Hirdetések