Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Többváltozós adatelemzés

Hasonló előadás


Az előadások a következő témára: "Többváltozós adatelemzés"— Előadás másolata:

1 Többváltozós adatelemzés
2. előadás

2 Keresztábla elemzés Más néven kontingencia tábla
Két kategória változó együttes eloszlását mutataja Általában nominális vagy ordinális mérési szintű változókra használjuk

3 Kereszttábla

4 Kereszttábla

5 Kereszttábla

6 Mit vizsgálunk? Független-e a két változó eloszlása, vagy valamilyen (a véletlen ingadozáson túlmutató) összefüggés van a változók között. Pl.: akik tornateremmel rendelkeznek, nagyobb valószínűséggel rendelkeznek könyvtárral is. Pl.: vannak olyan fenntartók, akik nagyobb gondot fordítanak (több forrás áll rendelkezésükre) a tornateremre.

7 Hogy vizsgáljuk Amennyiben a változók függetlenek, akkor az együttes bekövetkezési valószínűség a parciális bekövetkezési valószínűségek szorzata.

8 Független vs. tényleges

9 Függetlenség tesztelése
Pearson: Likelihood arány:

10 Függetlenség tesztelése

11 A függetlenség nemcsak az arányoktól függ, hanem a mintanagyságtól is

12 Asszociáció szorosságának mérése
Χ2 alapú mutatószámok: Phi Cramer V Kontingencia együttható

13 Asszociáció szorossága

14 Asszociáció szorossága
A mutatók értékei 0 és 1 között vannak (elméleti határ) 0, ha nincs kapcsolat a két változó között (függetlenség) 1, ha determinisztikus kapcsolat van a két változó között

15 Az asszociáció mutató számai nem függnek a csoport méretétől

16 Asszociáció szorosságának mérése
PRE (Proportional Reduction of Errors) alapú mutatószámok Guttman féle lambda Azt vizsgálja, hogy mi a legjobb becslés különböző kategóriák esetén, és ezáltal mennyivel csökkenthető a bizonytalanság

17 Guttman féle lambda

18 Guttman féle lambda (30-19)+(69-46)+(135-43)+
( )+(171-57)+(70-28)=487 lambda=1-487/( )=1-0,841=0,159 A besorolási bizonytalanság 16%-kal csökkenthető, ha figyelembe vesszük a tanulók szorgalmát A mutató értéke 0 és 1 között van: 0: nem tudunk semmit javítani a besoroláson 1: a besorolás tökéletes (determinisztikus kapcsolat)

19 Guttman féle lambda

20 Guttman féle lambda

21 Guttman féle lambda Hátránya, hogy ha valamelyik kategória gyakrabban fordul elő a többinél, akkor a lamba-ra 0 adódik a szignifikáns kapcsolat esetén is.

22 Associáció mérése További PRE alapú mutatószámok:
Goodman-Kruskal féle tau ‘Uncertainty coefficient’ Nemcsak a leggyakoribb kategóriaértéket veszik figyelembe, hanem a többit is.

23 PRE alapú mutatószámok

24 Ordinális változók esetén a kapcsolat szorossága
Ordinális változók esetén nemcsak a kacsolat szorosságát lehet meghatározni, hanem annak irányát is (nagyobb értékhez inkább nagyobb érték tartozik, vagy épp fordítva)

25 Kapcsolat szorossága Goodman Kruskal féle gamma:
Hány olyan pár van az adatbázisban, ahol az első változó értékéhez a második változó nagyobb értéke társul Hány olyan pár van, amikor az első változó nagyobb értékéhez a második változó kisebb értéke térsul Hány olyan eset áll fenn, ami egyik fenti kategóriába sem fér bele (ún. csomósodás)

26 Goodman Kruskal féle gamma
Sorszám magatartás szorgalom 1 2 4 3 5 Pozitív irány: Negatív irány: Csomósodás:

27 Goodman Kruskal féle gamma
Az értékek kereszttáblából is számolhatók: Pozitív irány: 19*( )+17*( …+28)+ +…+51*28 Negatív irány 17*( )+15*( …+0)+…+ +20*( )

28 Goodman Kruskal féle gamma
Pozitív irányok (concordant) számát jelölje P Negativ irányok (disconcordant) számát jelölje Q gamma=(P-Q)/(P+Q)

29 Goodman Kruskal féle gamma
A mutató értéke -1 és 1 között van. Amennyiben a két változó kapcsolatában nem mutatható ki összefüggés a mutató értéke 0. Ha kimutatható és a nagyobb értékhez nagyobb tartozik, akkor pozitív, ha nagyobb értékhez kisebb tartozik negatív a mutató értéke

30 Probléma nagysága ötfokú skálán: A tanulók iskolai magatartása
Változó gamma Probléma nagysága ötfokú skálán: A tanulók hiányzása 0,548 Probléma nagysága ötfokú skálán: A tanulók szorgalma 0,632 Probléma nagysága ötfokú skálán: A tanárok szaktárgyi felkészültsége 0,279 Probléma nagysága ötfokú skálán: A tanárok módszertani felkészültsége 0,305 Probléma nagysága ötfokú skálán: A tanárok lelki-szellemi kondíciója 0,265 Probléma nagysága ötfokú skálán: A tanárok iskolán kívüli elfoglaltságai 0,179 Probléma nagysága ötfokú skálán: A tankönyvkínálat 0,228 Probléma nagysága ötfokú skálán: A taneszközök megléte illetve hiánya 0,198

31 További mutatók Abban különböznek, hogy hogyan kezelik a ‘csomósodást’
Sommers féle d Kendall féle tau-b Kendall féle tau-c

32 További mutatók

33 Nominális vs. ordinális?

34 Nominális vs. ordinális?

35 Vélemények egyezősége
Négyzetes táblákra alkalmazható csak, ahol a két vizsgált változó ugyanazokat az értékeket veszi fel Azt vizsgálja csak, hogy a két változó ugyanazokat az értékeket veszi-e fel vagy sem, azaz csak a fődiagonálisban lévő cellákat vizsgálja Tipikus alkalmazása, ha egy kisérlet előtt és után is megkérdezzük a vizsgált személy véleményét, vagy ha két különböző személy (pl házaspár) véleményét kérdezzük ugyanarról a dologról

36 Vélemények egyezősége

37 Kappa Kappa értéke: 0, ha az egyezőség csak a véletlennek tudható be, pozitív, ha a vélemények egyeznek (1, ha tökéletes egyezőség van), negatív, ha nem egyeznek (legkisebb értéke nem -1) Inkább csak tesztelésre alkalmas, összehasonlításra nem

38 Miben különbözik a függetlenség tesztelésétől?

39 Miben különbözik a függetlenség tesztelésétől?

40 Szimmetrikusság tesztelése
Alapevetően nem a függetlenséget teszteljük, hanem egyfajta változatlanságot Először gyógyszerkisérleteknél alkalmazták. Feljegyezték, hogy egy adott betegség a vizsgált személynél megállapítható-e vagy sem, utána kapott kezelték egy vegyülettel és később megint megvizsgálták, hogy a betegség nála kimutatható-e vagy sem. A kérdés az, hogy a gyógyszernek van-e hatása vagy nincs.

41 Szimmetrikusság tesztelése
Lehet, hogy alapvetően nem független a két időpontban diagnosztizált betegség, mert például a páciens védettséget szerez. Tehát a χ2 teszt nem ad kielégítő bizonyítékot a gyógyszer hatékonyságára

42 Szimmetrikusság tesztelése


Letölteni ppt "Többváltozós adatelemzés"

Hasonló előadás


Google Hirdetések