Többváltozós adatelemzés 3. előadás
Kereszttábla elemzés: RISK mutatószámok (csak 2x2-es táblákra)
Esélyhányados (odds) Esélyhánydos (odds): (valószínűség) / (1-valószínűség) Teheséggondozás esélyhányadosa, ha van csoportos korrepetálás: (0,837/0,163=5,153) Teheséggondozás esélyhányadosa, ha nincs csoportos korrepetálás: (0,474/0,526=0,900) Odds ratio: 5,153/0.900=5,725
Relative Risk Tehetséggondozás léte az iskolában (igen): (0,837/0,474=1,768) Tehetséggondozás léte az iskolában (nem): (0,163/0,526=0,309)
Kereszttábla elemzés - RISK
Változók felcserélése Az ‘odds ratio’ nem változik a változók felcserélésével
Tehetséggondozás léte az iskolában Változó Odds Ratio Csoportos korrepetálás léte az iskolában 5,725 Korrekciós osztály léte az iskolában 2,819 Felzárkóztató foglalkozás léte az iskolában 4,719 Cigány kisebbségi program léte az iskolában 1,823
További tesztek Az iskolaigaztató neme befolyásolja-e a tehetségkutatás és a csoportos korrepetálás kapcsolatát? Az ‘odds ratio’ az összes csoportra 1 (feltételes függetlenség) Cochran teszt Mantel-Heanszel teszt Az ‘odds ratio’ megegyezik az összes csoportra Breslow-Day teszt Tarone teszt
További tesztek
Iskolafenntartó hatása
ANOVA ANalysis Of VAriance Ún. variancia elemzés Egy folytonos változó és egy kategória változó kapcsolatát vizsgálja (alapesetben) A teljes varianciát felbontja csoporton belüli és csoportok közötti varianciára
ANOVA X folytnonos változó, Y kategória változó k kategóriával.
ANOVA Varinacia hányados (determinációs hányados): H2= SSK / SST Átlagok egyezőségének tesztelése (normális eloszlás, csoportok szórásának egyezősége)
Országos oktatáspolitika hatása az oktatás tartalmára
Országos oktatáspolitika hatása az oktatás tartalmára (extrém értékek elhagyásával)
Részt vettek-e a minőségbiztosítás finanszírozására kiírt pályázaton? H2: 11,4%
ANOVA Amennyiben az azonos variancia a különböző csoportokra nem teljesül, akkor is lehet tesztelni a csoportok átlagának egyezőségét: Welch teszt Brown-Forsythe teszt
Részt vettek-e a minőségbiztosítás finanszírozására kiírt pályázaton?
t-teszt Csak 2 kategória összehasonlítására alkalmas Kis minták esetén szükséges a normális eloszlás, de nagy minták esetén nem normális eloszlás esetén is működik (központi határeloszlási tétel)
t-teszt Akik részt vettek minőségbiztosítás finanszírozására kiírt pályázaton és nyertek, azok nagyobb összegből gazdálkodhattak-e, mint akik részt vettek, de nem nyertek
t-teszt
t-teszt Akik nem vettek részt, de tervezték nagyobb összegből gazdálkodhattak-e, mint akik nem is tervezték?
t-teszt
Kovariancia VAR(X+Y)=VAR(X)+VAR(Y)+2KOVAR(X,Y) Változók együttváltozását méri KOVAR(X,Y)=E[(X-E(X))(Y-E(Y))]= =E(XY)-E(X)E(Y) Realizációk esetén várható érték helyett átlagok szerepelnek
Kovariancia 67270+19138+12194+8216=106818 Az átlagok összeadódnak 21437978395+9175976233+8231728663+544335164=39390018451 A varianciák nem adódnak össze
Kovariancia Összes költség varianciája: 39390018451+2*13723733583+… …+2*862268974=116237903759
Korreláció KORREL(X,Y)= =KOVAR(X,Y) / [SQRT(VAR(X))SQRT(VAR(Y))] Változó lineáris kapcsolatát méri Értéke -1 és 1 között van: 0, ha X és Y között nincs lineáris kapcsolat (korrelálatlan) 1, ha tökéletes lineáris kapcsolat van, azonos irányú -1, ha tökéletes lineáris kapcsolat ellentétes irányú
Korreláció
Korreláció A korreláció érzéketlen a lineáris transzforációra A korreláció érzékeny a monoton transzformációra
Korreláció – sztenderdizált változók
Korreláció – logaritmált változók
Rangkorreláció Spearman nevéhez kötődik A változók értékeit sorrendbe rakja: a legkisebb 1-es értéket kap, a második 2-t, és így tovább. Utána ezen rangszámok segítségével számol korrelációt. Nem érzékeny a monoton transzformációra. Értéke szintén -1 és 1 között van. A nevezetes értékek (-1, 0 és 1) ugyanaz mint a (Pearson) korreláció esetén Ordinális mérési szintű változók esetén is értelmezhető
Rangkorreláció
Rangkorreláció – logaritmált változók