Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaGabi Némethné Megváltozta több, mint 10 éve
1
Gazdaságstatisztika LEÍRÓ STATISZTIKA I. 2. előadás 2013. szeptember 12.
2
Sokaság: a vizsgálat tárgyát képező egységek összessége
Mintavétel KÖVETKEZTETŐ STATISZTIKA Sokaság: a vizsgálat tárgyát képező egységek összessége Következtetés LEÍRÓ STATISZTIKA Minta: valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés (mérés) eredménye Mintavétel
3
Statisztikai módszertan ágai
LEÍRÓ vagy DESKRIPTÍV statisztika A vizsgálat tárgyát képező jelenség tömör, számszerű jellemzését adja. Nem lép túl a megfigyelés körén, de a megfigyelt adatok legjobb megértésére, bemutatására, összefoglaló jellemzésére törekszik. Például: Népszámlálási adatok feldolgozása, elemzése, a népesség számával, összetételével kapcsolatos jellemzők közzététele, megjelenítése Gazdasági szervezetek legfontosabb adatainak közzététele statisztikai évkönyvekben Lakásépítésről, oktatásról készített statisztikai összefoglaló Vállalat gazdálkodásának vizsgálata
4
Statisztikai módszertan ágai
KÖVETKEZTETŐ statisztika Fő célja a mintából való következtetés, általánosítás a teljes sokaságra vonatkozóan. Például: Minőség-ellenőrzés Lakosság jövedelmi különbségeinek elemzése Ingatlan árbecslések Befektetési tanácsadások Könyvvizsgálat Mezőgazdaság
5
Leíró statisztika Területei: adatgyűjtés adatok ábrázolása
adatok csoportosítása, osztályozása adatokkal végzett egyszerűbb aritmetikai műveletek eredmények megjelenítése
6
1. Adatgyűjtés Az egyedi mérésekből származó adatok (mennyiségi ismérvek) lehetnek diszkrétek és folytonosak. Egy diszkrét mennyiségi ismérv csak véges vagy megszámlálhatóan sok, egymástól jól elkülöníthető értéket vehet fel. Háztartások nagysága Gazdálkodó szervezetek nagysága Balesetek száma Mogyorós csokiban a mogyorók száma Adott időszak alatti meghibásodások száma Egy folytonos mennyiségi ismérv valamely adott intervallumon belül bármilyen értéket felvehet. Háztartások jövedelme Lakások alapterülete Gépkocsi abroncsok futásteljesítménye Bux index havi hozamadata
7
2. Az adatok ábrázolása Eszközei: Oszlopdiagram Kördiagram
Vonaldiagram Sávdiagram
8
Oszlopdiagram
9
Kördiagram
10
Sávdiagram
11
Vonaldiagram
12
3. Adatok csoportosítása, osztályozása
Egy mennyiségi ismérv szerinti rendezés és osztályozás X mennyiségi ismérv (Xi változatai különbségi vagy arányskálán mért, valamilyen mértékegységgel rendelkező számértékek) X a továbbiakban változó, Xi (ismérv)érték Rangsor A sokaság egységeinek sorba rendezése az X változó nagysága szerint A rangsor a megfigyelési egységeknek és/vagy azokhoz tartozó Xi ismérvértékeknek monoton nemcsökkenő sorrendben történő felsorolása. Készítésének célja: megkönnyítse a sokaság egységeinek X változó szerinti osztályozását Osztályozás Gyakorisági sor, gyakorisági eloszlás
13
3. Adatok csoportosítása, osztályozása
Az X szerint képzett osztály Osztály- közép abszolút relatív alsó felső gyakoriság határa X10 X11 X1* f1 g1 X20 X21 X2* f2 g2 Xi0 Xi1 Xi* fi gi … Xk0 Xk1 Xk* fk gk Összesen N 1 Osztályközhosszúság:
14
3. Adatok csoportosítása, osztályozása
X ismérv szerinti osztályozás kérdései: Az X változó diszkrét, és az általa felvehető értékek száma kicsi Annyi osztályt képezünk ahány különböző X érték lehetséges az i-edik osztály esetében fennáll az alsó és felső osztályhatár egybeesése Az X változó folytonos, vagy diszkrét ugyan, de az általa felvehető különböző értékek száma nagy X lehetséges értékeinek tartományát osztályközökre bontjuk az i-edik osztályköz Xi1 felső határa nem eshet egybe az (i+1)-dik osztályköz Xi+1,0 alsó határával Hány osztályt képezzünk? Egy osztályozás akkor megfelelő, ha az osztályok számának és határainak egy bizonyos sávon belüli változtatása nem nagyon befolyásolja a grafikus képet. A gyakorlatban ehhez 5-15 osztály használata szinte mindig elegendő. Osztályok számának meghatározása:
15
3. Adatok csoportosítása, osztályozása
A mennyiségi sorok grafikus ábrázolásának alapját a gyakorisági táblázat készítése jelenti. Osztályba sorolás (folytonos adatok és nagyszámú diszkrét megfigyelés esetén); gyakoriságok (fi) megállapítása; relatív gyakoriságok (gi) megállapítása összegzett (kumulált) gyakoriságok (fi’), illetve összegzett relatív gyakoriságok (gi’) megállapítása; gyakorisági táblázat készítése (fi , gi , fi’ , gi’ adataiból); gyakorisági (relatív gyakorisági), illetve összegzett gyakorisági (relatív gyakorisági) hisztogramok (folytonos adatok esetén a poligon és az ogiva) felvétele (tapasztalati eloszlások elkészítése); grafikus ábrázolás
16
Példa – kevés számú diszkrét adat
Egy folyamatosan működő üzemben 24 órán keresztül feljegyezték a gépleállások számát. A leállásokra vonatkozóan az alábbi értékek adódtak óránkénti megoszlásban: Gyakorisági táblázat készítése: - Legkisebb és legnagyobb értékek megkeresése - Gyakoriságok meghatározása 0 1 :
17
Példa – kevés számú diszkrét adat
A gyakorisági táblázat: Leállások száma Gyakoriság (fi) Relatív gyakoriság (gi) 3 0,125 (12,5%) 1 5 0,208 (20,8%) 2 4 0,168 (16,8%) 0,083 (8,3%) 6 összesen 24 1,000 (100%)
18
Példa – kevés számú diszkrét adat
Adatok ábrázolása: PÁLCIKA DIAGRAM gyakoriságok Relatív Leállások száma 5 4 3 2 1 0,2 0,16 0,12 0,08 0,04 6
19
kumulált gyakoriság (fi’) kumulált relatív gyakoriság (gi’)
Példa – kevés számú diszkrét adat A gyakorisági táblázat folytatása: leállások száma kumulált gyakoriság (fi’) kumulált relatív gyakoriság (gi’) 3 0,125 1 8 0,333 2 13 0,541 17 0,709 4 20 0,834 5 22 0,917 6 24 1,000
20
Kumulált relatív gyakoriságok
Példa – kevés számú diszkrét adat Kumulált relatív gyakoriság ábrázolása: Kumulált relatív gyakoriságok Leállások száma 1 2 3 4 5 6 0,5
21
Példa – nagy számú folytonos adat
hónap hozam 2005. március -7,188% 2007. április 8,200% 2009. május 14,878% 2011. június -2,963% 2005. április -4,360% 2007. május 4,917% 2009. június 2,533% 2011. július -4,857% 2005. május 3,185% 2007. június 7,997% 2009. július 12,038% 2011. augusztus -15,731% 2005. június 10,292% 2007. július 1,152% 2009. augusztus 11,520% 2011. szeptember -15,778% 2005. július 10,053% 2007. augusztus -6,569% 2009. szeptember 4,223% 2011. október 10,947% 2005. augusztus 4,021% 2007. szeptember 3,616% 2009. október 1,698% 2011. november 0,196% 2005. szeptember 6,182% 2007. október -3,696% 2009. november 1,132% 2011. december -3,817% 2005. október -11,159% 2007. november -6,113% 2009. december 1,999% 2012. január 10,699% 2005. november 3,112% 2007. december 1,836% 2010. január 2,808% 2012. február 2,072% 2005. december -1,857% 2008. január -11,116% 2010. február -2,616% 2012. március -3,433% 2006. január 6,599% 2008. február 0,111% 2010. március 13,104% 2012. április -2,173% 2006. február 4,480% 2008. március -7,927% 2010. április 2,119% 2012. május -12,454% 2006. március -0,669% 2008. április 3,986% 2010. május -11,369% 2012. június 7,427% 2006. április 5,447% 2008. május -0,057% 2010. június -4,881% 2012. július 0,385% 2006. május -13,671% 2008. június -10,216% 2010. július 5,612% 2012. augusztus 0,606% 2006. június 0,764% 2008. július 8,558% 2010. augusztus 1,320% 2012. szeptember 5,956% 2006. július 5,398% 2008. augusztus -5,564% 2010. szeptember 2,963% 2012. október 3,343% 2006. augusztus -2,072% 2008. szeptember -10,735% 2010. október -0,402% 2012. november -5,098% 2006. szeptember -1,713% 2008. október -33,440% 2010. november -11,464% 2012. december -0,505% 2006. október 2,883% 2008. november -6,192% 2010. december 3,276% 2013. január 6,368% 2006. november 2,161% 2008. december -3,634% 2011. január 6,280% 2013. február -2,950% 2006. december 8,234% 2009. január -6,110% 2011. február 1,946% 2013. március -5,170% 2007. január -3,210% 2009. február -12,233% 2011. március -0,414% 2013. április 2,372% 2007. február -2,902% 2009. március 8,298% 2011. április 4,667% 2013. május 5,203% 2007. március 0,222% 2009. április 15,066% 2011. május -3,304% 2013. június -1,247%
22
Példa – nagy számú folytonos adat
Rangsor -15,778% -10,216% -4,881% -2,950% -0,414% 1,152% 2,533% 4,021% 6,182% 10,053% -15,731% -7,927% -4,857% -2,902% -0,402% 1,320% 2,808% 4,223% 6,280% 10,292% -13,671% -7,188% -4,360% -2,616% -0,057% 1,698% 2,883% 4,480% 6,368% 10,699% -12,454% -6,569% -3,817% -2,173% 0,111% 1,836% 2,963% 4,667% 6,599% 10,947% -12,233% -6,192% -3,696% -2,072% 0,196% 1,946% 3,112% 4,917% 7,427% 11,520% -11,464% -6,113% -3,634% -1,857% 0,222% 1,999% 3,185% 5,203% 7,997% 12,038% -11,369% -6,110% -3,433% -1,713% 0,385% 2,072% 3,276% 5,398% 8,200% 13,104% -11,159% -5,564% -3,304% -1,247% 0,606% 2,119% 3,343% 5,447% 8,234% 14,878% -11,116% -5,170% -3,210% -0,669% 0,764% 2,161% 3,616% 5,612% 8,298% 15,066% -10,735% -5,098% -2,963% -0,505% 1,132% 2,372% 3,986% 5,956% 8,558% A teljes értékköz: 30,844 (%)
23
Példa – nagy számú folytonos adat
osztály Osztály-köz fi fi’ gi [%] gi’ [%] Alsó határ Felső 1. -20% -15% -17,50% 2 2,02% 2. -10% -12,50% 9 11 9,09% 11,11% 3. -5% -7,50% 20 20,20% 4. 0% -2,50% 23 43 23,23% 43,43% 5. 5% 2,50% 32 75 32,32% 75,76% 6. 10% 7,50% 15 90 15,15% 90,91% 7. 15% 12,50% 8 98 8,08% 98,99% 8. 20% 17,50% 1 99 1,01% 100,00% összesen GYAKORISÁGI TÁBLÁZAT
24
Példa – nagy számú folytonos adat
GYAKORISÁGI HISZTOGRAM (tapasztalati sűrűségfüggvény) Gyakoriság vonaldiagramja
25
Példa – nagy számú folytonos adat
Gyakorisági görbe
26
Példa – nagy számú folytonos adat
Kumulált relatív gyakoriság vonaldiagramja KUMULÁLT RELATÍV GYAKORISÁGI HISZTOGRAM
27
Példa – nagy számú folytonos adat
Ogiva KUMULÁLT RELATÍV GYAKORISÁG VONALDIAGRAMJA (tapasztalati eloszlásfüggvény)
28
Gyakorisági eloszlások jellegzetességei
Középérték-mutatók: helyzeti és számított Ingadozásmutatók: abszolút és relatív Alakmutatók Középértékek Helyzeti Számított Módusz Medián Számtani átlag Mértani átlag Harmonikus átlag Négyzetes átlag Középérték elvárások: Közepes helyzetűek Tipikusak Egyértelműen meghatározhatóak Lehetőleg könnyen értelmezhetőek
29
Medián Helyzeti középérték – valódi középérték, a rangsor közepén található: az az érték, amelynél az előforduló értékek fele kisebb, fele pedig nagyobb Páratlan számú adatnál a középső Páros számú adatnál a két középső érték számtani átlaga Érzéketlen a szélsőértékekre Sok egyforma ismérvérték esetén nem tanácsos használni ha 4,5
30
Medián – folytonos példa
-15,778% -10,216% -4,881% -2,950% -0,414% 1,152% 2,533% 4,021% 6,182% 10,053% -15,731% -7,927% -4,857% -2,902% -0,402% 1,320% 2,808% 4,223% 6,280% 10,292% -13,671% -7,188% -4,360% -2,616% -0,057% 1,698% 2,883% 4,480% 6,368% 10,699% -12,454% -6,569% -3,817% -2,173% 0,111% 1,836% 2,963% 4,667% 6,599% 10,947% -12,233% -6,192% -3,696% -2,072% 0,196% 1,946% 3,112% 4,917% 7,427% 11,520% -11,464% -6,113% -3,634% -1,857% 0,222% 1,999% 3,185% 5,203% 7,997% 12,038% -11,369% -6,110% -3,433% -1,713% 0,385% 2,072% 3,276% 5,398% 8,200% 13,104% -11,159% -5,564% -3,304% -1,247% 0,606% 2,119% 3,343% 5,447% 8,234% 14,878% -11,116% -5,170% -3,210% -0,669% 0,764% 2,161% 3,616% 5,612% 8,298% 15,066% -10,735% -5,098% -2,963% -0,505% 1,132% 2,372% 3,986% 5,956% 8,558%
31
Medián becslése A mediánt tartalmazó osztály bal végpontja. me annak a legelső osztályköznek a sorszáma, amelyre igaz, hogy No. osztály Osztály-köz fi fi’ gi [%] gi’ [%] Alsó határ Felső 1. -20% -15% -17,50% 2 2,02% 2. -10% -12,50% 9 11 9,09% 11,11% 3. -5% -7,50% 20 20,20% 4. 0% -2,50% 23 43 23,23% 43,43% 5. 5% 2,50% 32 75 32,32% 75,76% 6. 10% 7,50% 15 90 15,15% 90,91% 7. 15% 12,50% 8 98 8,08% 98,99% 8. 20% 17,50% 1 99 1,01% 100,00% összesen A mediánt tartalmazó osztály hossza.
32
Módusz Helyzeti középérték – tipikus
Diszkrét ismérv esetén a leggyakrabban előforduló ismérvérték(ek) Folytonos ismérv esetén pedig a gyakorisági görbe maximumhelye Érzéketlen a szélsőértékekre
33
Módusz becslése mo a legnagyobb gyakoriságú osztály(ok) sorszáma
A móduszt tartalmazó osztály bal végpontja. No. osztály Osztály-köz fi fi’ gi [%] gi’ [%] Alsó határ Felső 1. -20% -15% -17,50% 2 2,02% 2. -10% -12,50% 9 11 9,09% 11,11% 3. -5% -7,50% 20 20,20% 4. 0% -2,50% 23 43 23,23% 43,43% 5. 5% 2,50% 32 75 32,32% 75,76% 6. 10% 7,50% 15 90 15,15% 90,91% 7. 15% 12,50% 8 98 8,08% 98,99% 8. 20% 17,50% 1 99 1,01% 100,00% összesen A móduszt tartalmazó osztály hossza.
34
Számtani átlag Az a szám, amellyel az átlagolandó számértékeket helyettesítve azok összege változatlan marad Leggyakrabban használt középérték Meghatározható gyakorisági sorból is a gyakoriságokkal súlyozva Számított középérték-mutató Bármely alapadathalmazból egyértelműen meghatározható Minden alapadatot felhasznál Érzékeny a szélsőértékekre min. ,ha
35
Számtani átlag –diszkrét példa
Leállások száma óránként Előfordulások gyakorisága (fi) Relatív gyakoriság (gi) 3 0,125 1 5 0,208 2 4 0,168 0,083 6 összesen 24 1,000
36
Számtani átlag – folytonos példa
-15,778% -10,216% -4,881% -2,950% -0,414% 1,152% 2,533% 4,021% 6,182% 10,053% -15,731% -7,927% -4,857% -2,902% -0,402% 1,320% 2,808% 4,223% 6,280% 10,292% -13,671% -7,188% -4,360% -2,616% -0,057% 1,698% 2,883% 4,480% 6,368% 10,699% -12,454% -6,569% -3,817% -2,173% 0,111% 1,836% 2,963% 4,667% 6,599% 10,947% -12,233% -6,192% -3,696% -2,072% 0,196% 1,946% 3,112% 4,917% 7,427% 11,520% -11,464% -6,113% -3,634% -1,857% 0,222% 1,999% 3,185% 5,203% 7,997% 12,038% -11,369% -6,110% -3,433% -1,713% 0,385% 2,072% 3,276% 5,398% 8,200% 13,104% -11,159% -5,564% -3,304% -1,247% 0,606% 2,119% 3,343% 5,447% 8,234% 14,878% -11,116% -5,170% -3,210% -0,669% 0,764% 2,161% 3,616% 5,612% 8,298% 15,066% -10,735% -5,098% -2,963% -0,505% 1,132% 2,372% 3,986% 5,956% 8,558%
37
Számtani átlag – folytonos példa
osztály Osztály-köz fi fi’ gi [%] gi’ [%] Alsó határ Felső 1. -20% -15% -17,50% 2 2,02% 2. -10% -12,50% 9 11 9,09% 11,11% 3. -5% -7,50% 20 20,20% 4. 0% -2,50% 23 43 23,23% 43,43% 5. 5% 2,50% 32 75 32,32% 75,76% 6. 10% 7,50% 15 90 15,15% 90,91% 7. 15% 12,50% 8 98 8,08% 98,99% 8. 20% 17,50% 1 99 1,01% 100,00% összesen
38
Harmonikus átlag Mértani átlag
A harmonikus átlag az a szám, amellyel az átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad. Mértani átlag A mértani átlag az a szám, amellyel az átlagolandó értékeket helyettesítve azok szorzata változatlan marad.
39
Választás a középértékek között
Négyzetes átlag Az a szám, amellyel az átlagolandó értékeket helyettesítve, azok négyzetösszege változatlan marad Tipikus alkalmazási területe a szórásszámítás Választás a középértékek között
40
Választás a középértékek között
Módusz, medián, számtani átlag? Melyiket használjuk? Egyértelműen meghatározható-e? Az összes rendelkezésre álló adattól függ-e vagy sem? Mennyire érzékeny a szélsőségesen nagy vagy kicsi értékekre? Mekkora és milyen módon értelmezhető hibával képes helyettesíteni az alapadatokat?
41
Választás a középértékek között
Medián Egyértelműen meghatározható, mindig létezik Ha sok az egyforma ismérvérték, akkor nem tanácsos használni Nem függ sem az összes értéktől, sem a szélsőséges értékektől Sok egyforma ismérvérték esetén nem tanácsos használni Módusz Nem mindig határozható meg egyértelműen, nem is mindig létezik Becslése bizonytalan (függ az osztályok kialakításától) Számtani átlag Bármely alapadathalmazból egyértelműen meghatározható, minden alapadatot felhasznál, mindig létezik Érzékeny a szélsőséges értékekre nyesett átlag Nem feltétlen tipikus érték
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.