A pedagógiai kutatás módszertana Babeş-Bolyai Tudományegyetem Tanító- és óvóképző szak
A leíró és a matematikai statisztika Alapvetően kétfajta statisztikát használunk a pedagógiai kutatásban: az egyik az ún. leíró statisztika, a másik pedig az ún. matematikai statisztika. Leíró statisztikáról abban az esetben beszélünk, hogyha egy jól meghatározott csoportot akarunk elemezni, s nem kívánunk a tágabb, befoglaló populációra vonatkozó következtetéseket levonni. Például arra szeretnénk választ kapni, hogy egy általános iskola két IV. osztálya közül melyikben ismernek több népdalt a gyermekek. Egyszerű csoportokkal dolgozik, következtetései is pontosak és nem valószínűségi jellegűek.
A leíró és a matematikai statisztika A matematikai statisztikát akkor alkalmazzuk, amikor egy mintáról úgy kívánunk következtetést megfogalmazni, hogy az a tágabb populációra is érvényes legyen, vagyis az ilyen becsléseink nem pontosak, hanem valószínűségi jellegűek. Ha például egy énektanítási módszer hatékonyságát vizsgáljuk, és a két IV. osztály a negyedikes populáció reprezentatív mintáit képezik, akkor már nem elég egyszerűen az átlagok közül a nagyobbra rámutatni és azt mondani, hogy az ott alkalmazott módszer hatékonyabb, hanem egy matematikai eljárással (pl. t-próba) meg kell vizsgálni azt, hogy a befoglaló populáción is érvényes lesz-e a megállapításunk. Ez az eljárás tehát bonyolultabb, és valószínűségi jellegű.
A valószínűség a valószínűség események bekövetkeztének az esélyét jelöli. olyan eseményekről van szó, amelyek nem pontosan előreláthatóak, vagyis bizonytalan kimenetelűek. A valószínűségszámításban azt az eseményhez rendelt számot, ami kifejezi a bekövetkezés esélyét, úgy nevezzük, hogy valószínűség.
A valószínűség a valószínűség számszerűen kifejezett értéke 0 és 1 között változik, ahol a 0 lehetetlen eseményt, az 1 pedig a biztosan bekövetkező eseményt jelöli. ha A esemény valószínűségét P(A)- val jelöljük (a P az angol probability szó rövidítéséből), akkor 0≤P(A)≤1. Ha például egy esemény bekövetkezésének valószínűsége P(A)=0,95, akkor ez azt jelenti, hogy 95%-os valószínűséggel bekövetkezik. Másképpen fogalmazva, hogyha a beavatkozást megismételnénk, akkor valószínűleg, hogy 100 esetből az esemény 95-ször előfordulna.
Statisztikai becslés és statisztikai összehasonlítás a statisztikai becslés célja az, hogy a minta alapján következtessen a populációra. az n-szer elismételt beavatkozás, hogyha k alkalommal bekövetkezik, akkor a k/n hányados a relatív gyakoriságot fejezi ki. Megfigyelhető, hogy ha a k értéke közel van az n-hez, akkor az esemény relatíve sokszor következik be, ha viszont a k értéke 0-hoz közelít, akkor az esemény relatíve ritkán következik be
Statisztikai becslés és statisztikai összehasonlítás a becslés mellett a matematikai statisztika másik fontos problémája a statisztikai összehasonlítás. Ez esetben adatokat hasonlítunk össze egymással. az összehasonlítás feltétele az összehasonlíthatóság. az összehasonlítandó adatok lehetőleg csak olyan tényezők tekintetében különbözzenek, amelyek hatását vizsgáljuk, más tényezők tekintetében pedig homogének legyenek.
Középértékek a számtani középérték (átlag): segítségével valamely számsor átlagos tendenciáját ragadjuk meg. Az átlag kiszámítása egyszerű: összeadjuk a mintába tartozó adatokat, és az így nyert összeget elosztjuk az adatok számával. az átlag a mintát a leginkább, legáltalánosabban jellemző számadat. például a vizsgálati személyek átlagéletkorát, az elért teljesítmény átlagát, vagy tesztpontszámok átlagát.
Középértékek A medián olyan érték, amelyiknél a minta egyik fele nagyobb, a minta másik fele pedig kisebb, tehát éppen a középen elhelyezkedő adat. Ha páratlan számú adatunk van, akkor a mediánt úgy határozhatjuk meg, hogy a növekvő sorrendbe helyezett adatok közül megkeressük a középsőt. Ha páros számú adatunk van, akkor a növekvő sorrendbe rendezett adatok közül a két középső számtani középértéke adja a mediánt.
Középértékek a módusz: a minta adatai közül a leggyakrabban előforduló középérték, vagy a legnagyobb gyakorisággal rendelkező csoport csoportközépértéke. A módusz meghatározása egyszerű, mivel a leggyakrabban előforduló érték, viszont ezzel a középértékkel ritkán tudjuk a mintánkat jellemezni, mivel csak a leggyakrabban előforduló adatra utal.
Szimetrikus gyakorisági eloszlás
Nem szimetrikus gyakorisági eloszlás
Egymintás t-próba ha az adatok ugyanazoktól a személyektõl származnak két mérés eredményeként (kontroll-feltétel), akkor az összehasonlítást egymintás t-próbával végezzük. a minta által reprezentált populációra vonatkozó becslésünk érdekében meg kell állapítanunk a valószínûségi szintet, ami a pedagógiai vizsgálatokban legalább 95%. a szignifikancia megállapításának elsõ lépéseként meg kell határozni a minta szabadságfokát. Egymintás t-próbánál ez nagyon egyszerű művelet, a minta elemszámából kivonunk egyet. szf=n-1. a továbbiakban szükségünk van a t-eloszlás táblázatra melynek segítségével a szabadságfok figyelembe vételével összehasonlítjuk a kiszámolt t értéket a táblázatban található értékekkel.
Kétmintás t-próba hogyha nincs lehetőségünk önkontrollos kísérletet végezni, akkor rendszerint kontrollcsoportos kísérletet végzünk, ugyanis a kísérleti csoport adatait viszonyítani kell valamihez. ez esetben tehát két különböző csoportból származó adatsorokkal dolgozunk. Két csoport átlagainak összehasonlítására kétmintás t-próbát használunk. ha egyforma a két minta ez azt is jelenti, hogy a szórásuk is egyforma kell legyen. A minták szórásai teljesen egyformák nem lehetnek, de becslést kell tennünk arra vonatkozóan, hogy a különbségek csak véletlenek. ehhez viszont egy újabb statisztikai eljárás szükséges, az F-próba. A kétmintás t-próbát megelőző F-próba tehát arra jó, hogy megállapítsuk, hogy a két minta teljesíti-e a szórások egyformaságának feltételét.
A korrelációszámítás egy adott mintán a változók lehetnek valamilyen módon kapcsolatban egymással vagy pedig értékeik egymástól teljesen függetlenek. Az adatok közötti kapcsolat egyik lehetõsége, hogy az egyik változó magas értéke a másik változó magas értékével jár együtt, vagy az egyik változó alacsony értéke együttjár a másik változó alacsony értékével. Az azonos irányú együttváltozást pozitív korrelációnak, az ellentétes irányút pedig negatív korrelációnak nevezzük. Előfordulhat az az eset is, hogy két adatsor között nem találunk semmilyen kapcsolatot, vagyis ez a korreláció hiányára utal.
A pozitív, negatív korreláció és a korreláció hiánya pontdiagramokkal ábrázolva
A korrelációs együttható (r) a korrelációs együttható megmutatja a változók közötti kapcsolat erõsségét és irányát is. jelölése r, értéke pedig -1 és +1 között változhat. Ha az r értéke pozitív, akkor ez azt jelenti, hogy a változók azonos irányba változnak, és minél jobban megközelíti a maximális értéket (+1) annál erősebb pozitív korrelációról beszélünk. egy változó önmagával való kapcsolata a legerősebb, ez az érték a +1. ha az r értéke negatív, akkor ez azt jelenti, hogy a változók ellentétes irányba mozdulnak el, és minél jobban megközelíti a minimális értéket (-1), annál erősebb negatív korrelációról beszélünk. az r értéke ha 0, vagy 0 körüli érték, akkor a korreláció hiányáról beszélünk.
A korrelációs együttható (r) a korrelációs együttható kiszámítása után azt kell leellenőrizzük, hogy az összefüggés mennyire valódi és nem a véletlen mûve. Erre ad választ az r szignifikancia vizsgálata. a szignifikancia tehát a korreláció megbízhatóságát jelöli és két dologtól függ: egyrészt az r számértékétõl, ami minél nagyobb mértékben eltér a 0-tól, annál nagyobb valószínűséggel jelöl valós kapcsolatot, másrészt viszont a minta elemszámától függ. Minél nagyobb mintával dolgozunk, annál megbízhatóbb az érték. A szignifikancia kiszámolásához szükségünk van a mintába tartozó elemek szabadságfokára. Ez a minta elemszámánál kettővel kisebb érték, azaz szf = n – 2. az r kritikus értékei a korrelációs együttható valószínűségi szintjének táblázatából olvashatóak le.