Statisztikai módszerek a pedagógiai kutatásban
Mérés Dolgokhoz valamilyen szabály alapján számokat rendelünk hozzá. Ezek a számok az ADATOK.
Adatok fajtái Mérhető adatok Rangsorolt adatok Nominális adatok intervallumskálán mérhetők Összeadhatók (additívek) Pl. hány másodperc alatt teljesíti a tanuló az 50 métert. Rangsorolt adatok Ordinális skálán jelöljük őket Nem adhatók össze, nem jelölik a pontos különbséget. Pl. Hányadik lett a tanuló gyorsfutásban. Nominális adatok Egy kategóriát jelölünk egy számmal. Nominális skála. Pl. férfi 1, nő 2, stb.
Statisztikai mérések Leíró statisztika: Matematikai statisztikai: gyakoriságok Középérték számítás Szóródás Összefüggések vizsgálata Matematikai statisztikai: A minta tulajdonságai érvényesek-e az alapsokaságra?
A statisztikai módszerek típusai Függnek: Az adatok milyenségétől (mérhető, ordinális, nominális) A kutatásban résztvevő mint számától (egy, kettő, több)
Leíró statisztika Gyakoriságok Középértékek Szóródások Korreláció Abszolút Átlag Szóródási terjedelem Korreláció-számítás Százalékos (relatív) Módusz Interkvartilis félterjedelem Kummulatív Medián Átlagos eltérés Variancia Szórás Relatív szórás Falus I. – Ollé J. 2000
Matematikai statisztika Jelentős-e a különbség? Adatfajták Minták száma Intervallum MÉRHETŐ Ordinális RANGSOROLT Nominális KATEGÓRIA Egy Egymintás t-próba Wilcoxon próba ᵡ²- próba Kettő Kétmintás t-próba F-próba Welch-próba Mann-Withney próba Több Varianciaanalízis Kruskall-Wallis-próba Falus I. – Ollé J. 2000
Matematikai statisztika Van-e szoros összefüggés? Adatfajták Változók száma Intervallum Ordinális Nominális Kettő korrelációszámítás rangkorreláció ᵡ²- próba Kettő vagy több Regresszióanalízis Több Parciális korreláció Faktoranalízis klaszteranalízis Falus I. – Ollé J. 2000
SPSS for Windows Menüpontok: Data – módosíthatjuk a változók legfontosabb tulajdonságait. Transform – a változók értékeinek átkódolása, új változók létrehozása a meglévők segítségével. Analyze – a legfontosabb statisztikai eljárások innen indíthatók el. Graphs – az adatokból diagrammok készíthetők. Utilities – formai segédeszközök (pl. betűtípus, cellarácsok). Window – több ablak megnyitása. Help – segítség angol nyelven.
Adatok bevitele Data – Data View Variable View Hiányzó adat (Missing value): 9 Type: a típus Variable label: a változónév címkéje Alignement: igazítás Define labels: a kategóriákat állapíthatjuk itt meg. Új adatoszlop bevitele: Insert Variable (Data menüben) Ellenőrzés: File menüpont – Display Data Info
Mért adatok feldolgozása
Mért adatok elemzése Gyakorisági eloszlások (abszolút, relatív és kummulatív) Középértékek (számtani közép, medián, módusz) Szóródás Hipotézisvizsgálat (t próbák) Variancia-analízis Korreláció számítás Regresszió-analízis Faktoranalízis klaszteranalízis
Abszolút gyakorisági eloszlások Értéktartomány meghatározása. Csoportok meghatározása. Gyakorisági eloszlás meghatározása (hány adat esik az illető értéktartományba). Pl. Tudásszintmérés esetén megállapítjuk: A legnagyobb és legkisebb értéket. Csoportok meghatározása: Páratlan számú csoport (8-9, nagyobb elemszám esetében 10-20) Intervallum nagysága (1,2,3,5, 10, stb.) A csoportok nem fedhetik egymást, oszthatóság! Pl. 25-29, 30-34, 35-39, stb.
Gyakoriságok ábrázolása Gyakorisági poligon Hisztogramm
Intervallumok ábrázolása poligonnal Az intervallumnak meghatározzuk a közepét. A középértékekhez rendeljük az abszolút gyakoriságot. Pl. 25-29: középérték 27………………f(a): 2 30-34. középérték 32……………..f(a): 6 Feladat: ábrázoljuk a 64. o. található minta adatait poligon és hisztogram segítségével.
Relatív (százalékos) gyakoriság f(%) Számítsuk ki a mintánkra az abszolút gyakorisági eloszlást. A kiszámolt gyakoriságokat szorozzuk meg 100-zal. Minden kapott értéket osszunk el az elemek számával. (egyszerű hármas szabály alkalmazása, % kiszámítása.) Ábrázolása: poligonnal, kördiagrammal, hisztogrammal.
Feladat Számítsuk ki a csoportközép értéket és a relatív gyakoriságot, majd ábrázoljuk. Csoporthatárok csoportközép F(a) F(%) 25-29 2 4% 30-34 6 12% 35-39 7 14% 40-44 45-49 10 20% 50-54 55-59 4 8% 60-64 3 6% 65-69 1 2%
Kumulatív gyakoriság Kiszámítjuk az abszolút gyakoriságot minden csoporthoz rendelve. Minden egyes csoport esetében a csoporthoz tartozó gyakorisághoz hozzáadjuk a nála kisebb elemeket tartalmazó csoportok gyakoriságait. Ábrázoljuk.
Gyakoriság kiszámítása SPSS-sel 1. Készítsük el az adattáblát. Analyze menüpont Descriptive Statistics – Frequencies A változó áthelyezése a másik ablakba Kipipáljuk a kis ablakocskát Chart – grafikont is ad ( a Chart menüpont alatt formázható).
A középérték mérőszámai Számtani középérték (átlag). Medián: az az elem, melynél a minta egyik fele nagyobb, a másik fele pedig kisebb. Módusz: a minta elemei között leggyakrabban előforduló érték.
Számtani középérték Az adott mintába tartozó elemeket összeadjuk. A kapott értéket elosztjuk az elemek számával. Csoportosított adatok esetén: Megállapítjuk a csoportközépértékeket. Megállapítjuk az abszolút gyakoriságot. A fenti két értéket megszorozzuk egymással. A kapott szorzatokat összeadjuk és elosztjuk az elemek számával. Feladat: számoljuk ki az előző feladat számtani középértékét.
Medián Állítsuk nagyság szerinti sorrendbe az adatainkat. Páratlan adat esetén keressük meg a középső értéket. Páros adatszám esetén keressük meg a két középső értéket, majd adjuk őket össze és osszuk el kettővel. Csoportosított adatok esetén a megfelelő intervallumot keressük meg, majd továbbszámolunk…
Módusz Számoljuk meg egy-egy elem összesen hányszor fordul elő. Keressük meg, melyik elem fordul elő a leggyakrabban. Csoportosított adatok esetén: Megkeressük azt az intervallumot, melyhez a legnagyobb gyakoriság tartozik. Az illető intervallum csoportközepe lesz a módusz.
Példa A számtani középérték, a medián és a módusz nem esik mindig egybe, és jellemzi a mintát. (l. könyvbeli ábrák. 114. o.)
Középérték számítás SPSS-sel Analyze menüpont: Descriptive statistics – Freqvencies. Kitörölni a pipát a kisablakocskából, ahol a gyakoriságot kértük, majd a STATISTICS-re megyünk és ott kijelöljük, mi mindent szeretnénk megtudni az adatainkról.
Szóródás Szóródási terjedelem: a minta legnagyobb és legkisebb elemének különbsége. Jele Ri. Kvartilisek: azok az értékek, melyek a minta nagyság szerinti sorba rendezett elemeit negyedelik Q1, Q2, Q3. (Q2-Me) Interkvartilis félterjedelem: a minta nagyság szerint sorba rendezett elemeinek középső 50%-át tartalmazó értéktartomány fele. Q=(Q3-Q1)/2
Szóródás Átlagos eltérés: a minta számtani középértéktől való távolsága. Az távolságokat összegezve és elosztva a minta elemszámával kapjuk meg a mintát jellemző átlagos eltérést. Variancia (négyzetes összeg): minden elem átlagtól való eltérését négyzetre emeljük, majd a kapott értékeket összeadjuk. A négyzetes összeget elosztjuk a szabdságfokkal (n-1). Szórás=variancia négyzetgyöke. Jele: Si Variációs együttható: szórás és számtani közép hányadosa megszorozva 100%-kal.
Szóródás kiszámítása SPSS-sel Szóródási terjedelem: Range Kvartilisek: Quartiles Cut points for…10 – 10 részre oszthatjuk a mintát. Átlagos eltérés nincs. Variancia: variance Szórás: std. Deviation.
Hipotézisvizsgálat – szignifikáns-e a kapott eredmény? Cél: megvizsgálni, hogy a hipotézisünk beigazolódott-e vagy sem. Pl. kontroll csoportos kísérlet esetén a kísérlet hatékony volt-e, különbség mutatható-e ki a kontroll csoport és a kísérleti csoport eredményei között. (l. 158. o.) 95% valószínűség esetén a különbség szignifikáns p<0,05. 99% fölött a különbség erősen szignifikáns, a kapott eredmény nem a véletlen műve.p<0,01.
Egydimenziós minták - A mintákról csak egy adatunk van
T-próbák Önkontrollos pedagógiai kísérlet esetén: egymintás t-próba. Kontrollcsoportos pedagógiai kísérlet esetén: kétmintás t-próba és az F próba.
Egymintás t-próba - SPSS Azt vizsgáljuk, hogy az önkontrollos kísérlet során szignifikáns-e a különbség az előzetes és utófelmérés eredményei között. ANALYZE – COMPARE MEANS - PAIRED-SAMPLES T TEST Kijelölöm a két oszlop nevét, átviszem a másik ablakba. OPTIONS: Confidence Interval – beállítom, a szignifikancia szintet.
Két mintás t-próba Azt vizsgáljuk, hogy a kísérleti és kontrollcsoport eredményei szignifikánsan eltérnek-e egymástól. Az adatokat egy oszlopba írjuk, a második oszlopba írjuk be a csoport számát. ANALYZE – COMPARE MEANS - INDEPENDENT-SAMPLES T TEST TEST VARIABLE: matek GROUPING VARIABLE: csoport - Define Groups…. Megnevezzük… OK.
Variancia-analízis Többcsoportos kísérlet esetén hasonlítjuk össze a különböző minták eredményeit. Ha az egyes csoportokra kiszámolt varianciák nem különböznek lényegesen egymástól, a különbség közöttük nem szignifikáns.
Variancia-analízis SPSS ANALYZE - COMPARE MEANS - MEANS Dependent list (függő változó): teljesit Independent list (független változó): osztály OPTIONS: mean, variance, number of cases (elemszám) Kijelölni az ANOVA TABLE AND ETA OK
Variancia-analízis (2) Páronként is megvizsgálhatjuk a csoportok között létezik-e szignifikáns különbség. ANALYZE – COMPARE MEANS - ONE-WAY ANOVA Dependent list: teljesit Factor: osztály POST HOC – TUKEY’S HONESTLY SIGNIFICANT DIFFERENCE OK
Többdimenziós minták A mintákról több sor adatunk van
Korreláció számítás Pl. egy osztály fizika és matematika eredményei között vizsgáljuk van-e összefüggés. Korrelációt számolhatunk mért, rangsorolt és nominális adatok esetén is. MÉRT adatoknál klb. korreláció figyelhető meg: Negatív korreláció: Matek eredmény magas – fizika eredmény alacsony Pozitív korreláció: Matek magas – fizika magas Korrelálatlanság: hol magas, hol alacsony, nincs összefüggés. (grafikusan: 214. o.)
Korreláció (2) A korreláció értéke -1 és 1 között mozog, minél közelebb van az 1-hez vagy -1-hez, annál nagyobb az összefüggés a két eredmény között.
Korrelációszámítás - SPSS ANALYZE – CORRELATE – BIVARIATE Áthelyezzük a változókat a másik ablakba a nyíl segítségével PEARSON TWO-TAILED DISPLAY kipipálva STATISTICS: kipipálni a means és a standard deviations-t
Parciális korrelációs együttható Többdimenziós minta esetében jól alkalmazható. Kiszámítása: ANALYZE – CORRELATE – PARTIAL VARIABLES: azok a változók, amelyek között korrelációt akarunk számítani CONTROLLING FOR: amelyik változónak a hatását ki akarjuk zárni.
Regresszió-analízis A populáció bármely tagjára vonatkoztatva a regresszió-analízis segítségével becsülhetjük meg az általa elérhető értéket. Pl. a vizsgált személynek csak néhány adatát ismerjük, illetve a minta alapján tudjuk milyen összefüggések vannak a különböző adatok között. Meg tudjuk becsülni, hogy az illető személy milyen adatokat produkálhatna egy vizsgálat során. (235. o)
Regresszió-analízis (2) Regressziós egyenlet: összefüggést találunk a két mintasor értékei között és ennek alapján kiszámíthatjuk az összes hiányzó értéket. ANALYZE – REGRESSION – LINEAR Independent list: X Dependent list: Y STATISTICS: ESTIMATES – kipipálni Y=1,428X+o,658
Rangsorolt adatok elemzése
Rangsorolt adatok elemzésére alkalmas statisztikai eljárások Wilcoxon próba Mann-Withney próba Kruskal-Wallis próba Rangkorreláció számítás
Wilcoxon-próba Csoportrangszámok meghatározása önkontrollos kísérlet esetén. Pl. a kísérlet során alkalmazott- elő és utófelmérések eredményei nem túl megbízhatóak, ezért rangsorolták a gyerekeket teljesítményük alapján és az előzetes és utófelmérés során kialakult rangsor alapján értékelik az eredményeket.
Wilcoxon próba - SPSS ANALYZE – NONPARAMETRIC TEST – 2 RELATED SAMPLES Áthelyezzük a két változót, és OK Leolvassuk a kapott eredményeket.
Mann-Withney próba Kontrollcsoportos kísérletek esetén alkalmazzuk, hogy összehasonlítsuk a két csoport által elért eredmények közötti különbség szignifikáns-e. SPSS: ANALYZE – NONPARAMETRIC TESTS - 2 INDEPENDENT SAMPLES TEST VARIABLE LIST: elott, után GROUPING VARIABLE: csoport DEFINE VARIABLE: 1,2
Kruskal-Wallis próba Több minta esetén akarjuk ellenőrizni, hogy az elért eredmények közötti különbségek szignifikánsak-e. SPSS: ANALYZE – NONPARAMETRIC TESTS – K INDEPENDENTS SAMPLES
Rangkorreláció-számítás SPSS ANALYZE – CORRELATE – BIVARIATE Variables: áttenni a változókat Test of Significance: two tailed kipipálva OK
Megállapítható adatok elemzése ᵡ²- próba
ᵡ²- próba Megállapítható adatok esetében egy-egy jelenség mellé rendelünk egy-egy számot, mindig ugyanazt a számot. Pl. település nagysága, válaszadó neme, iskolatípus, stb. Az adatokat kontingencia táblázatba foglaljuk.
ᵡ²- próba, SPSS Adattábla létrehozása. ANALYZE – DESCRIPTIV STATISTICS – CROSSTABS ROWS – sorok COLUMNS – oszlopok STATISTICS – CHI-SQUARE: kipipálni CONTINUE CELLS: kipipálni, amit szeretnénk (%, elemszám). FORMAT: a táblázat beállításai. (l. saját kutatás)
Köszönöm a figyelmet!