Gazdaságelemzési és Statisztikai Tanszék STATISZTIKA I. 4. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék
A SOKASÁG MENNYISÉGI ISMÉRV SZERINTI ELEMZÉSE I. Az információsűrítés eszközei: A SOKASÁG MENNYISÉGI ISMÉRV SZERINTI ELEMZÉSE I.
Jelölések Mennyiségi ismérv: diszkrét folytonos N elemű sokaság, ismérv: Y Rangsor készítés: (az Y értékeket nagyság szerint növekvő sorba rendezzük)
Gyakorisági sor készítése Rangsor készítés: (az Y értékeket nagyság szerint növekvő sorba rendezzük)
Gyakorisági sor készítése
Közölt és valódi határok abszolút hibakorlát, szignifikáns számjegy:
Osztályközök meghatározása a gyakorlatban 5-15 osztály általában elegendő 60 esetnél: 25 <60 <26 k=1+3,3lgN vagy osztályközök hossza: nagyvonalú kerekítéssel könnyen áttekinthető legyen Folytonos ismérv Felső határt < relációként értelmezzük
Mennyiségi sorok + kumulálás
Kvantilis értékek A rangsorba rendezett sokaságot k egyenlő részre osztják. diszkrét ismérv esetén, ha sok egyező érték van, ne használjuk; folytonos ismérv esetén se, ha kevés a megfigyelés és több egyező érték van.
Kvantilisek
A kvantilisek meghatározása egyedi értékek alapján (rangsorból)
A kvantilisek meghatározása osztályközös gyakorisági sorból becslés, arányú osztópont:
GYAKORISÁGI ELOSZLÁSOK FŐ JELLEGZETESSÉGEI 1. Helyzet (közepes érték helye a számegyenesen): helyzetmutatók (középértékek) 2. Szóródás (az ismérvértékek különbözősége): szóródási mérőszámok 3. Alak (az eloszlás görbéjének kinézete a normális eloszláshoz képest): aszimmetria, csúcsosság mérőszámai
Középérték nagyságában különböző gyakorisági sorok (helyzet)
Szóródás nagyságában különböző gyakorisági sorok (szóródás)
Alak szerint különböző gyakorisági sorok (aszimmetria)
Alak szerint különböző gyakorisági sorok (csúcsosság)
KÖZÉPÉRTÉKEK (helyzet-mutatók)
Középértékek jellemzői A mennyiségi ismérvet egyetlen számmal jellemzik. Dimenzió, mértékegység: Y ismérv mértékegysége. Követelmények: közepes helyzetűek, tipikusak, egyértelműen meghatározhatók, könnyen értelmezhetők legyenek.
Medián kvantilis nem érzékeny a szélső értékekre minimum, ha A=Me (összességében a hibák abszolút értékeinek összege minimális) sorrendi, intervallum és arány skálán használható induktív statisztikai célra nem nagyon alkalmas
Medián meghatározása Egyedi adatokból: a rangsorban az -edik érték Osztályközös gyakorisági sorból, a kvantilisek becslésénél megismert formula alapján:
Módusz diszkrét ismérv: a leggyakrabban előforduló ismérvérték folytonos ismérv: a gyakorisági görbe maximumához tartozó érték tipikus érték a kiugró, extrém értékekre érzéketlen valamennyi mérési skála esetén alkalmazható nem mindig létezik, nem mindig lehet egyértelműen meghatározni induktív statisztikai célra általában nem alkalmas
Módusz meghatározása osztályközös gyakorisági sorból egyenlő hosszúságú osztályközök: nem egyenlő osztályközök esetén: a módusz becslése az átszámított gyakoriságok alapján történik.
ÁTLAGOK Súlyozatlan Súlyozott Számtani: Harmonikus:
ÁTLAGOK Súlyozatlan Súlyozott Mértani: Négyzetes:
SÚLYOZOTT ÁTLAG átlagolandó érték: Yi súly: fi súlyként a relatív gyakoriság is használható: A súlyozott átlag nagysága függ: 1. az átlagolandó értékek abszolút nagyságától 2. a súlyarányoktól (súlyok egymáshoz való arányától)
Példák a különböző átlagokra
A számtani átlag néhány matematikai tulajdonsága átlagtól vett eltérések (előjeles hibák) összege nulla hibák négyzeteinek összege minimális az átlag viselkedése lineáris transzformáció esetén:
A számtani átlag néhány egyéb tulajdonsága egyértelműen meghatározható valamennyi értékkel algebrai kapcsolatban áll kiugróan magas értékekre fokozottan érzékeny nyesett átlag szerepe
százalékos megoszlása 60 eladásra kínált lakás kínálati ára kumulált gyakorisági és relatív gyakorisági sorok Kínálati ár (millió Ft) A lakások száma százalékos megoszlása 12,1 – 18,0 15 25,0 18,1 – 24,0 24 40,0 24,1 –30,0 11 18,3 30,1 –36,0 7 11,7 36,1 –42,0 2 3,3 42,1 –48,0 1 1,7 Összesen 60 100,0
60 eladásra kínált lakás kínálati ára kumulált gyakorisági és relatív gyakorisági sorok Osztályköz f f ' g g' 12,1 – 18,0 15 25,0 18,1 – 24,0 24 39 40,0 65,0 24,1 –30,0 11 50 18,3 83,3 30,1 –36,0 7 57 11,7 95,0 36,1 –42,0 2 59 3,3 98,3 42,1 –48,0 1 60 1,7 100,0
A magyar városok népessége - abszolút és relatív értékösszegek A népesség száma (fő) Osztályköz-hosszúság A városok száma számának százalékos megoszlása népességének száma (fő) népességének százalékos megoszlása 1001 – 5000 4000 56 19,4 199629 4,0 5001 10000 95 33,0 685534 13,6 10001 20000 76 26,4 1078313 21,3 20001 40000 39 13,5 1088993 21,5 40001 70000 30000 11 3,8 622350 12,3 70001 110000 5 1,7 436468 8,6 110001 - 160000 50000 3 1,0 400349 7,9 160001 210000 541758 10,7 Összesen 288 100,0 5053394
A magyar városok népessége - abszolút és relatív értékösszegek A népesség száma (fő) 1001 – 5000 56 3000 168000 3,2 199629 5001 10000 95 7500 712500 13,7 685534 10001 20000 76 15000 1140000 21,9 1078313 20001 40000 39 30000 1170000 22,5 1088993 40001 70000 11 55000 605000 11,6 622350 70001 110000 5 90000 450000 8,6 436468 110001 - 160000 3 135000 405000 7,8 400349 160001 210000 185000 555000 10,7 541758 Összesen 288 5205500 100,0 5053394
A magyar városok népessége - abszolút és relatív értékösszegek A népesség száma (fő) 1001 – 5000 4,0 19,4 5001 10000 13,6 33,0 52,4 17,5 10001 20000 21,3 26,4 78,8 38,9 20001 40000 21,5 13,5 92,4 60,4 40001 70000 12,3 3,8 96,2 72,7 70001 110000 8,6 1,7 97,9 81,4 110001 - 160000 7,9 1,0 99,0 89,3 160001 210000 10,7 100,0 Összesen