A középérték mérőszámai
A számtani középérték (átlag) Összeadjuk a mintába tartozó adatokat, és az így kapott összeget elosztjuk az adatok számával Csak intervallumskálán értelmezett adatok, mért adatok esetén alkalmazhatjuk Kiszámítás Excel segítségével =átlag(A1:An) =average(A1:An)
Medián Ez a középérték fejezi ki leginkább a minta közepét. A medián az az érték, amelynél a minta egyik fele nagyobb, másik fele kisebb. A nagyság szerint sorba rendezett adatok közül a középső (ha páratlan adatunk van) vagy a két középső adat számtani középértéke (ha páros adatunk van) adja Kiszámítás Excel segítségével =medián(A1:An) =median(A1:An)
Módusz Nominális adatok esetében is alkalmazhatjuk A módusz a minta elemei közt leggyakrabban előforduló érték, vagy a legnagyobb gyakorisággal rendelkező csoport csoportközépértéke. Ha poligonnal ábrázoljuk a minta gyakorisági eloszlását,a minta csúcsához tartozó érték a módusz. Bimodális eloszlásról beszélünk, ha a mintának két csúcsa van: ilyenkor valószínűleg két különböző móduszú részmintával van dolgunk. Kiszámítás Excel segítségével =módusz(A1:An) =mode(A1:An) Csoportosított adatok esetén a legnagyobb gyakoriságú csoport középértékét tekintjük módusznak
Átlag, módusz, medián
A középértékek értelmezése A szimmetrikus görbe (Gaus-görbe, harang-görbe) esetén a 3 középérték valószínűleg egybeesik. A gyakorisági eloszlás azonban „elferdülhet”, a csúcs jobbra vagy balra tolódhat
A középértékek használata A módusz kiválóan alkalmas más mérések alkalmazása előtt a várható értékek becslésére, hiszen a mintában leggyakrabban előforduló értékeket határozza meg. (Pl. hányast fogok kapni a vizsgán? A tanár leggyakrabban 8-ast ad, a legvalószínűbb, h. én is azt kapok) A medián használata szélsőséges adatok esetén indokolt. A mintáról az adatok egymáshoz viszonyításával ad információt. A számtani középérték nagyon érzékeny a szélsőséges adatokra, ugyanakkor ez veszi figyelembe legpontosabban az egyes adatok tényleges értékét.
A szóródás mérőszámai 1. Szóródási terjedelem = a minta legnagyobb és legkisebb száma közötti különbség A kvartilisek = a mediánhoz hasonlóan a minta nagyság szerinti sorban elhelyezett elemeit negyedelik (a medián = a 2. kvartilis) Interkvartilis félterjedelem = a minta nagyság szerint sorba rendezett elemeinek középső 50%-át tartalmazó értéktartomány fele 1. kvartilis = kvartilis(A1:An;1) =quartile(A1:An;1) 3. kvartilis = kvartilis(A1:An;3) =quartile(A1:An;3) Interkvartilis félterjedelem =(kvartilis(A1:An;3)-kvartilis(A1:An;1))/2
A kvartilisek: Q1, Q2, Q3
A szóródás mérőszámai 2. Átlagos eltérés = a minta számtani középértéktől való távolsága (a távolságok összegzése és elosztása a minta elemszámával) Variancia = a négyzetes összeg és a minta szabadságfokának hányados Négyzetes összeg = az eltérések négyzetének összege A minta szabadságfoka = azt mutatja, hogy a mintában hány olyan elem van, amelyik független egymástól. Itt: n-1 Számításuk EXCEL segítségével: Átlagos eltérés =átl.eltérés(A1:An) Average deviation =avedev(A1:An) variancia = varp(A1:An)
A szóródás
A szórás Szórás = a minta elemeinek szóródását jellemző szám, a variancia négyzetgyöke A középértékhez hozzáadva/kivonva az egyszeres, többszörös szórásnyi terjedelmet, olyan értéktartományt kapunk, amelyekbe a minta jól meghatározott részei tartoznak: Normál eloszlás esetén a számtani középértéktől való egyszeres terjedelembe az adatok 2/3-a tartozik kétszeres terjedelembe az adatok 95%-a tartozik háromszoros terjedelembe az adatok 99%-a tartozik Variációs együttható (relatív szórás) – két különböző értéktartománnyal rendelkező mintát tesz összehasonlíthatóvá Számításuk EXCEL segítségével: Szórás =szórásp(A1:An) Standard deviation =stdev(A1:An) Variációs együttható =varp(A1:An)/átlag(A1:An)