A számítógépes elemzés alapjai
Adatok fajtái Mérhető adatok, Intervallumskála az adatok közti különbségek, intervallumok egyenlők Ordinális skálán elhelyezkedő adatok: rangsorolásból származó adatok kapcsolt rangpontszámok Nominális mérés: az adatokat számokkal helyettesítjük, melyek nem jelölnek sorrendiséget nem összeadhatók
Statisztikai eljárások Leíró statisztika Ha a tényleges személyeket elemezzük, azaz a Populáció=minta Statisztikai eljárások Gyakoriságok Középértékek Szóródások Korreláció
Statisztikai eljárások Matematikai statisztika Megadja, hogy a reprezentatív mintából vonható le következtetés az alapsokaságra. Különbözőségvizsgálatok Adatfajták Minták száma intervallum ordinális nominális egy egymintás t-próba Wilcoxon-próba Kereszttábla elemzés, khi-négyzet próba kettő kétmintás t-próba F-próba Mann-Whitney-próba három varianciaanalízis Kruskall-Wallis- próba
Statisztikai eljárások Matematikai statisztika Összefüggésvizsgálatok Adatfajták Minták száma intervallum ordinális nominális kettő korrelációszámítás Spearmann-féle rangkorreláció Keresztábla elemzés, khi-négyzet próba Kettő vagy több, mint kettő regresszióanalízis Több mint kettő Parciális korrelációszámítás Faktoranalízis klaszteranalízis
Leíró statisztika
Középértékek Átlag Módusz Medián
Gyakorisági vizsgálatok A kategóriák számának meghatározása 10 és 20 közötti páratlan szám de alacsony számú (50 körüli elmeszámú) minta esetén kevesebb (7-9 kategória) is lehet. A csoportintervallumok (lépésköz) meghatározása 1, 2, 3, 5, 10 a kategóriaszám alapján Diszjunktság: A csoportok meghatározásánál ügyelni kell arra, hogy a minta minden eleme pontosan egy kategóriába legyen besorolható, ezért a csoportok nem fedhetik át egymást.
Abszolút gyakoriság Def: Az egyes kategóriákba tartozó értékeket az adott csoport gyakoriságának nevezzük, a létrejövő értékeket együttesen pedig a minta abszolút gyakorisági eloszlásának.
További gyakorisági mutatók Relatív gyakoriság az abszolút gyakorisági értékek és az elemszám hányadosát, azaz az egyes kategóriába tartozók összes kitöltőhöz viszonyított százalékos arányát. A kumulatív gyakoriság megmutatja, a minta hány eleme található a kategória felső határa alatt. Halmozott %-os gyakoriság, vagy más néven százalékos kumulált gyakoriság megmutatja a minta hány százaléka található a kategória felső határa alatt.
Szóródási mutatók Szóródási terjedelem: a minta értéktartománya: a minta legnagyobb és a legkisebb elemének a különbsége. R = Xmax - Xmin Átlagos eltérés: a minta elemeinek az átlagtól való átlagos távolsága. Négyzetes összeg: A minta elemeinek az átlagtól való eltéréseinek négyzete összegezve.
Variancia A variancia a négyzetes összeg osztva a minta szabadságfokával. Szabadságfoknak nevezzük a minta független elemeinek számát.
Szórás A szórás a variancia pozitív előjelű négyzetgyöke.
Tétel A mintától 1 szórásnyi terjedelembe tartozik az adatok több mint 2/3-a. A mintától 2 szórásnyi terjedelembe tartozik az adatok több mint 90%-a. A mintától 3 szórásnyi terjedelembe tartozik az adatok több mint 95 %-a.
Relatív szórás A relatív szórás a szórás átlaghoz viszonyított mérőszáma: a szórás és az átlag hányadosának eredménye.
Kvartilisek A kvartilisek a minta negyedelő pontja. Interkvartilis félterjedelem a harmadik és az első kvartilis különbsége: Q3-Q1
Összefüggések
Gyakorisági poligon és a középérték-mutatók Balra ferdült: Módusz > Medián > Számtani közép Jobbra ferdült: Módusz < Medián < Számtani közép Normális eloszlás (harang görbe) : Módusz = Medián = Számtani közép
Matematikai statisztika
Korreláció A korrelációs együttható két mennyiségi adatsor közti kapcsolat erősségét és irányát megadó együttható.