Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Matematikai alapok és valószínűségszámítás Az adatok megtekintése.

Hasonló előadás


Az előadások a következő témára: "Matematikai alapok és valószínűségszámítás Az adatok megtekintése."— Előadás másolata:

1 Matematikai alapok és valószínűségszámítás Az adatok megtekintése

2 Adatok megtekintése Vizsgálataink során tehát kérdést (kérdéseket) fogalmazunk meg, meghatározzuk azon sokaságot, vagy más néven populációt, amelyre az érdeklődésünk irányul, majd a sokaságból mintát veszünk (lehetőleg nagyszámú, véletlen mintát) és a mintába került megfigyelési egységeinkről adatokat gyűjtünk különböző statisztikai változók (a megfigyelési egységek jellemzői, ismérvei) mentén. Az összegyűjtött adatokat adatmátrixban rögzítjük, melyben jellemzően egy megfigyelési egység (eset) egy sor, míg az egyes oszlopok egy-egy változót reprezentálnak.

3 Adatok megtekintése Minthogy azonban az ideális minta nagyszámú megfigyelési egységet tartalmaz, és jellemzően minden megfigyelési egységről számos változó vonatkozásában gyűjtünk adatokat, az adatmátrix általában túlontúl terjedelmes ahhoz, hogy egyszerű megtekintés útján megállapíthassuk az adatok lényeges tulajdonságait. Erre a célra használhatunk: Grafikus módszereketGrafikus módszereket Az adatokból számolt összegző statisztikákat, ún. leíró statisztikákat.Az adatokból számolt összegző statisztikákat, ún. leíró statisztikákat.

4 Leíró statisztikák Statisztikai függvénynek vagy statisztikáknak nevezzük azokat az adatokból számolt mutatókat, melyek egy függvénnyel (képlettel) az adatokból meghatározhatóak. Statisztikai függvénynek vagy statisztikáknak nevezzük azokat az adatokból számolt mutatókat, melyek egy függvénnyel (képlettel) az adatokból meghatározhatóak. A leíró statisztikák az adathalmaz néhány jellemző tulajdonságát könnyedén megragadó statisztikák. A leíró statisztikák az adathalmaz néhány jellemző tulajdonságát könnyedén megragadó statisztikák. A legegyszerűbb leíró statisztikák pl. -a minta elemszáma (mintanagyság) -az értékek maximuma -az értékek minimuma -a minta terjedeleme: a maximum és a minimum különbsége

5 Gyakorisági eloszlás (diszkrét változó) Egy változó jellemezhető azzal, hogy különböző értékei hányszor, milyen gyakran fordulnak elő az adott mintában. A gyakorisági eloszlás éppen ezt, a változó értékeinek gyakoriságát fejezi ki. Pl. Etnikai hovatartozás gyakoriság relatív gyakoriság százalék 1.Latin % 2.Fehér % 3.Ázsiai % 4.Afrikai % 5.Indián % 6.Multietnikai % 7.Egyéb %

6 Kördiagram

7 Oszlopdiagram

8

9 Gyakorisági eloszlás (diszkrét változó) Pl. iskolai végzettség: gyakoriság rel. gyak. % kumulatív gyak. Kumulatív % középiskola év főiskola év főiskola master PhD

10 Oszlopdiagram

11 Gyakorisági eloszlás (folytonos változó) Pl. naponta elszívott cigaretták száma értékgyakoriság Értékgyakoriság

12 Oszlopdiagram Mint a bal oldali ábra is illusztrálja, folytonos változók esetén az oszlopdiagram nem a megfelelő megoldás az adatok grafikus megjelenítésére, mert a változónak túl nagyszámú értéke van, amelyek gyakorisága meglehetősen kicsi lesz, még nagy minta esetén is.

13 Hisztogram Ezért nem az egyes értékek gyakoriságát nézzük, illetve ábrázoljuk, hanem az értékeket intervallumokba soroljuk, és az egyes intervallumokba eső értékek gyakoriságára koncentrálunk. Ha pl a naponta elszívott cigik számát 8 intervallumba (1-10, 11-20, 21-30,…, 71-80) soroljuk, a balra látható hisztogramot kapjuk.

14 Hisztogram Az intervallumok száma (bizonyos határok között) önkényesen megválasztható, azonban a túl sok vagy túl kevés intervallum sem jó, mivel az előbbi esetben nem tömörítjük kellőképpen az információt, míg az utóbbi esetben pedig éppen fordítva, olyannyira tömörítjük, ami már információvesztést okozhat.

15 Hisztogram


Letölteni ppt "Matematikai alapok és valószínűségszámítás Az adatok megtekintése."

Hasonló előadás


Google Hirdetések