Dr Gunther Tibor PhD II/2. Középértékek Dr Gunther Tibor PhD II/2.
Statisztikai fogalmak »statisztika« szó latin eredetű, a „status”-ból származik, amelyet állapotnak és államnak is fordíthatunk; A statisztika tárgya mindig valamilyen állapot leírására szolgál. Az adatok - kísérlet, megfigyelés, vizsgálat eredményeként kapjuk A legtöbbször számként jelenik meg Az adatok mindig rögzítettek. (Ez számítástechnikai alapkövetelmény is.)
A mérhető adat Amennyiben adatunk úgy keletkezik, hogy valamilyen mérés „terméke A mérés - nem más, mint egy hozzárendelés, ami a való világ egy bizonyos objektuma (ill. annak része), és egy szám között áll fenn. az esetek legnagyobb többségében valamilyen fizikai skálán történnek. (Pl.: hosszúság, tömeg, idő, VC, stb.)
A megállapítható adat Ilyenkor az adatokat úgy nyerjük, hogy a mérés szerepét egy megállapítás veszi át. A kategória megadásában nem szerepel számérték. Ilyen adat pl. egy kérdéses személy neme; ez csak szóban („férfi”, vagy „nő”), ill. a biológiai szimbólumok felhasználásával adható meg. Ide tartoznak az „igen-nem”-mel megválaszolható kérdések is. Pl.: a „volt-e már valaha náthája?”-kérdésre két válasz lehetséges: vagy „igen”, vagy „nem”. A számokkal sokkal egyszerűbb számolni, mint megállapításokkal (kategóriákkal).
Az eloszlások típusai Diszkrét Folytonos
Diszkrét eloszlás/egyenletes eloszlás Valamennyi értékhez ugyanakkora gyakoriság tartozik. A relatív gyakoriság a különböző kategóriák, osztályok számának reciprokával egyenlő: a „férfi-nő”, ill. „fej, vagy írás” esetében két osztály van, s ezért egyketted, azaz 0,5 (50%) a relatív gyakoriság; a dobókockánál egyhatod (0,167 = 16,7%),
A folytonos eloszlás Normális eloszlás Binomiális eloszlás Hipergeometrikus eloszlás Poisson-eloszlás Exponenciális eloszlás Student (t-) eloszlás Lognormális eloszlás
A folytonos eloszlás Legfontosabb a normális eloszlás Leírása legpontosabban azzal a matematikai egyenlettel lehetséges, amely egyben az eloszlás görbéjét is meghatározza. Egy (kszí) folytonos valószínűségi változót normális eloszlásúnak nevezünk akkor, ha az egész számegyenesen értelmezve van ( -től -ig) A függvénygörbe pedig - ún. „sűrűségfüggvény”
Binomiális eloszlás A diszkrét eloszlások nagyon sok esetben megállapítható változók viselkedését írják. Ha a változó csak két értéket vehet föl - hasonlóan a logikai értékekhez -, akkor az értékek eloszlása binomiális eloszlás (Ez - bizonyos esetekben jól közelíthető normális eloszlással).
Hipergeometrikus eloszlás Egy dobozban van N golyó Köztük M fekete van Mi a valószínűsége annak, hogy n-et találomra kihúzva (n elemű mintát véve) éppen k feketét találunk azok között.
Poisson-eloszlás Gyakran lép fel a természetben és jó közelítését adja a gyakorlatban előforduló véletlen változónak Azt tapasztalhatjuk, hogy a pontok tér-, vagy időbeli elhelyezkedése akkor követ ilyen eloszlást, ha azok egymástól függetlenül és minden térrészben (időszakaszban) egyformán valószínűen oszolhatnak meg. Ilyen eloszlást mutat - a vérsejtek száma egy mikroszkóp látóterében [síkbeli eloszlások]; egy folyadékban, ill. annak meghatározott részében levő kolloid részecskék száma; a telefonközpontba (vagy szolgáltató egységbe) adott időszakban és időtartamban beérkezett telefonhívások vásárlók száma;
Exponenciális eloszlás Bizonyos gépi berendezések élettartamai
Student (t-) eloszlás Ezt az eloszlást W. S. Gosset állította fel a XX. század elején, s mivel ebben az időben „Student” álnév alatt írt Formálisan egy t statiszikai függvény eloszlásáról van szó. Statisztikai próbákban használatos a t-eloszlás táblázata
Lognormális eloszlás Bizonyos törési-aprítási folyamatoknál az őrlemény szemcsedarabjainak nagyság szerinti megoszlása lognormális eloszlást mutat. Ugyancsak jól közelíthető lognormális eloszlással egyes foglalkozási rétegek jövedelemeloszlása
A medián Ez az elnevezés (latinul) önmagában is közepet jelent. Úgy határozzuk meg, hogy a vízszintes tengelyen megkeressük azt a pontot, amelytől jobbra is és balra is ugyanannyi adat van.
A medián számszerű meghatározása A minta elemeink száma páros, vagy páratlan Növekvő sorba rendezzük a minta elemeit Páros elem esetén a két középső elem számtani átlaga Páratlan a középső elem
Kvantilis „Kvantálni” annyit jelent, mint részekre osztani. kvartilisek négy egyenlő rész A K1 első kvartilis a minta egynegyede A K2 masodik kvartilis a kétnegyede azaz fele K3 a harmadik kvartilis a háromnegyede a decilis tíz egyenlő rész a centilis száz egyenlő rész medián két egyenlő rész
Módusz „A leggyakrabban előforduló érték”
A szóródás mérőszámai Bármely középérték csak egy tulajdonságot jellemez az eloszlásgörbének a vízszintes tengelyen elfoglalt helyét, s ezt a helyet az eloszlás közepével adja meg (Gaus)
A variancia és a szórás A szórás Az átlagtól való eltérések négyzetének átlaga a variancia, Az ebből vont négyzetgyök után kapjuk a szórást. (Ne felejtsük el, hogy adatainknak – pl. fizikai – tartalma van. A variancia (más néven szórásnégyzet): A szórás
A szóródás mérőszámai A szabadságfok az egymástól függetlenül választható tagok (mintaelemek) számával egyenlő.
KÖSZÖNÖM A FIGYELMET!