Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Konzultáció – Leíró statisztika 2014. október 22. Gazdaságstatisztika.

Hasonló előadás


Az előadások a következő témára: "Konzultáció – Leíró statisztika 2014. október 22. Gazdaságstatisztika."— Előadás másolata:

1 Konzultáció – Leíró statisztika 2014. október 22. Gazdaságstatisztika

2 Egy internetszolgáltató vállalkozásnál 280 napon keresztül vizsgálták az ügyfelek napi reklamációinak számát. A megfigyelések eredményiből az alábbi gyakorisági eloszlást készítették. 1. Készítsen az adatokból gyakorisági táblázatot és értelmezze minden gyakorisági sorból az 5. osztályhoz tartotó értéket! 2. Ábrázolja a gyakorisági sort és a kumulált relatív gyakoriságokat! 3. Mekkora a napi reklamációk átlagos száma? 4. Mekkora a napi reklamációk tipikus értéke? 5. Mekkora a medián értéke? 6. Mekkora az átlagtól vett eltérések négyzetes átlaga (szórás)? 7. Mekkora a relatív szórás? Példa Reklamációk száma (reklamáció naponta) Napok száma 031 145 265 377 432 521 69

3 1. Készítsen az adatokból gyakorisági táblázatot és értelmezze minden gyakorisági sorból az 5. osztályhoz tartozó értéket! A megfigyelések során 32 napon volt a napi reklamációk száma 4. 250 napon volt a napi reklamációk száma 4, vagy annál kevesebb. Az esetek 11,4%-ban volt napi 4 reklamáció. Az esetek 89,3%-ban volt a napi reklamációk száma 4, vagy annál kevesebb. Példa – megoldás (1) Reklamációk száma (reklamáció naponta) Napok száma 031 0.111 145760.1610.271 2651410.2320.504 3772180.2750.779 4322500.1140.893 5212710.0750.968 692800.0321

4 2. Ábrázolja a gyakorisági sort és a kumulált relatív gyakoriságokat! Gyakoriság: Relatív gyakoriság: Kumulált relatív gyakoriság: Példa – megoldás (2) Reklamációk száma (reklamáció naponta) Napok száma 031 0.111 145760.1610.271 2651410.2320.504 3772180.2750.779 4322500.1140.893 5212710.0750.968 692800.0321

5 2. Ábrázolja a gyakorisági sort és a kumulált relatív gyakoriságokat! Relatív gyakorisági hisztogram Példa – megoldás (3) 5

6 2. Ábrázolja a gyakorisági sort és a kumulált relatív gyakoriságokat! Kumulált relatív gyakoriságok Példa – megoldás (4) 6 0,111 0,271 0,504 0,779 0,893 0,968 1,000 0123456 Napi reklamációk száma Kumulált relatív gyakoriság

7 3. Mekkora a napi reklamációk átlagos száma? Példa – megoldás (5) Reklamációk száma (reklamáció naponta) Napok száma 031 0.111 145760.1610.271 2651410.2320.504 3772180.2750.779 4322500.1140.893 5212710.0750.968 692800.0321

8 4. Mekkora a napi reklamációk tipikus értéke? A napi reklamációk tipikus értéke a módusz. A módusz értéke 3. Azért tipikus, mert ez a leggyakoribb érték. Példa – megoldás (6) Reklamációk száma (reklamáció naponta) Napok száma 031 0.111 145760.1610.271 2651410.2320.504 3772180.2750.779 4322500.1140.893 5212710.0750.968 692800.0321

9 5. Mekkora a medián értéke? Páros számú adat esetén a sorba rendezett adatok között a két középső átlaga a medián. Esetünkben a 140. és a 141. adat a növekvő sorrendbe rendezett adatok között a két középső. E két adat értéke rendre a 2 és a 2. Ezért a medián értéke 2. Miért nem ezzel számoltunk? Példa – megoldás (7) Reklamációk száma (reklamáció naponta) Napok száma 031 0.111 145760.1610.271 2651410.2320.504 3772180.2750.779 4322500.1140.893 5212710.0750.968 692800.0321

10 6. Mekkora az átlagtól vett eltérések négyzetes átlaga (szórás)? 7. Mekkora a relatív szórás? Példa – megoldás (8) 10 Reklamációk száma (reklamáció naponta) Napok száma 031 0.111 145760.1610.271 2651410.2320.504 3772180.2750.779 4322500.1140.893 5212710.0750.968 692800.0321

11 Egy áramszolgáltatónál 650 megfigyelést végeztek a szolgáltatásban bekövetkező áramkimaradásokra vonatkozóan. A megfigyelések eredményit az alábbi táblázatban rögzítették. 1. Készítsen az adatokból gyakorisági táblázatot és értelmezze minden gyakorisági sorból a 4. osztályhoz tartotó értéket! 2. Ábrázolja az áramkimaradások időtartam szerinti megoszlását és a tapasztalati eloszlásképet! 3. Mekkora az áramkimaradások átlagos időtartama? 4. Mekkora a tipikusnak tekinthető áramkimaradás időtartama? 5. Becsülje meg és értelmezze a mediánt! 6. Adjon becslést a szórásra! 7. Mekkora a relatív szórás? Példa Áramkimaradás időtartama (perc) Áramkimaradások száma [0;10)40 [10;20)190 [20;30)350 [30;40)40 [40;50)20 [50;60)10

12 Áramkimaradás időtartama (perc) Áramkimaradások száma [0;10)40 0.062 [10;20)1902300.2920.354 [20;30)3505800.5380.892 [30;40)406200.0620.954 [40;50)206400.0310.985 [50;60)106500.0151 1. Készítsen az adatokból gyakorisági táblázatot és értelmezze minden gyakorisági sorból a 4. osztályhoz tartotó értéket! A megfigyelések során 40 esetben volt az áramkimaradás időtartama 30 percnél hosszabb vagy azzal egyenlő és 40 percnél rövidebb. 620 esetben volt az áramkimaradás időtartama 40 percnél rövidebb. Az esetek 6,2%-ban volt az áramkimaradás időtartama 30 percnél hosszabb vagy azzal egyenlő és 40 percnél rövidebb. Az esetek 95,4%-ban volt az áramkimaradás időtartama 40 percnél rövidebb. Példa – megoldás (1)

13 2. Ábrázolja az áramkimaradások időtartam szerinti megoszlását és a tapasztalati eloszlásképet! Példa – megoldás (2) Áramkimara- dás időtartama (perc) Áramkimara- dások száma [0;10)40 0.062 [10;20)1902300.2920.354 [20;30)3505800.5380.892 [30;40)406200.0620.954 [40;50)206400.0310.985 [50;60)106500.0151 10 20 30 40 50 60 Időtartam szerinti megoszlás (relatív gyakorisági hisztogram ) Áramkimaradások időtartama (perc)

14 2. Ábrázolja az áramkimaradások időtartam szerinti megoszlását és a tapasztalati eloszlásképet! Példa – megoldás (3) 14 Áramkimara- dás időtartama (perc) Áramkimara- dások száma [0;10)40 0.062 [10;20)1902300.2920.354 [20;30)3505800.5380.892 [30;40)406200.0620.954 [40;50)206400.0310.985 [50;60)106500.0151 10 20 30 40 50 60 Tapasztalati eloszláskép Áramkimaradások időtartama (perc)

15 Áramkimaradás időtartama (perc) Áramkimara- dások száma [0;10)40 0.062 5 [10;20)1902300.2920.35415 [20;30)3505800.5380.89225 [30;40)406200.0620.95435 [40;50)206400.0310.98545 [50;60)106500.015155 3. Mekkora az áramkimaradások átlagos időtartama? Az áramkimaradások átlagos értékének becsléséhez szükségünk van az osztályközepekre. Átlag becslése: Példa – megoldás (4)

16 Áramkimaradás időtartama (perc) Áramkimaradások száma [0;10)40 0.062 5 [10;20)1902300.2920.35415 [20;30)3505800.5380.89225 [30;40)406200.0620.95435 [40;50)206400.0310.98545 [50;60)106500.015155 4. Mekkora a tipikusnak tekinthető áramkimaradás időtartama? A leggyakrabban előforduló időtartamú áramkimaradást tekintjük tipikusnak, ez a módusz. Módusz: folytonos ismérv esetén a gyakorisága görbe maximum helye(i). Módusz becslése: tudjuk, hogy a 3. osztályközben van. Példa – megoldás (5) 16 A móduszt tartalmazó osztály bal végpontja A móduszt tartalmazó osztály hossza

17 5. Becsülje meg és értelmezze a mediánt! Áramkimaradás időtartama (perc) Áramkimaradások száma [0;10)40 0.062 5 [10;20)1902300.2920.35415 [20;30)3505800.5380.89225 [30;40)406200.0620.95435 [40;50)206400.0310.98545 [50;60)106500.015155 Példa – megoldás (6) 17 A mediánt tartalmazó osztály bal végpontja A mediánt tartalmazó osztály hossza a megfigyelések száma:650 Az első olyan osztályköz sorszáma, amelyhez tartozó kumulált gyakoriság nagyobb vagy egyenlő, mint a megfigyelések számának fele. Most a 3. osztály.

18 6. Adjon becslést a szórásra! 7. Mekkora a relatív szórás? Áramkimaradás időtartama (perc) Áramkimaradások száma [0;10)40 0.062 5 [10;20)1902300.2920.35415 [20;30)3505800.5380.89225 [30;40)406200.0620.95435 [40;50)206400.0310.98545 [50;60)106500.015155 Példa – megoldás (7) 18

19 Elméleti kérdések – válaszok vázlatai 1. Ismertesse a matematikai statisztika tárgyát, lényegét, a mintavételi és nem mintavételi hiba közötti különbséget! A matematikai statisztika célja: következtetés tapasztalati (megfigyelési, mérési) adatokból események ismeretlen valószínűségeire, valószínűségi változók ismeretlen eloszlásfüggvényére vagy azok paramétereire (lásd következő dia)  leíró statisztika és következtető statisztika A matematikai statisztika lényege, hogy a sokaságnak csak egy részét, vagyis a mintát vizsgáljuk, ezért a statisztikai módszerek alkalmazásakor sohasem lehetünk biztosak a döntésünkben A statisztikai mintavételek és az ebből származó adatokat felhasználó elemzések, következtetések tehát mindig tartalmaznak hibákat, ez a statisztika szükségszerű velejárója Nem mintavételi hiba: független attól, hogy a teljes sokaságot, vagy annak egy részét vizsgájuk. A mintával kapcsolatos teendőkhöz, az adatgyűjtéshez kapcsolódó hiba: pontatlan adatgyűjtés, rögzítés, lekérdezés, elírások stb. Mintavételi hiba: A statisztikai hiba azon része, amely részleges vizsgálatok (mintavétel) esetén abból adódik, hogy nem a teljes sokaságot figyeljük meg. A sokaság teljes megfigyeléséről való lemondás ára. 19

20 Sokaság: a vizsgálat tárgyát képező egységek összessége Minta: valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés (mérés) eredménye Mintavétel Következtetés Matematikai statisztika lényege A megfigyelési eredmények a minta elemei, a megfigyelések száma a minta nagysága vagy elemszáma. 20 Mintavétel: a statisztikai sokaságból információszerzés céljából véletlenszerűen egyedi elemeket emelünk ki A minta elemei az alapsokaság eloszlásával megegyező eloszlású valószínűségi változók.

21 2. Mutassa be a sokaság és az ismérv csoportosításának lehetőségeit, minden esetre írjon 2-2 példát! Álló sokaság: Az álló sokaság állapotot fejez ki, adatai időpontra értelmezhetőek. Mozgó sokaság: A mozgó sokaság folyamatot fejez ki, időtartamra értelmezhető. Diszkrét sokaság: A diszkrét sokaság elkülönülő egységekből áll. Folytonos sokaság: A folytonos sokaság olyan tömegből áll, amelynek egységeit önkényesen határozzuk meg. Véges és végtelen sokaság Ismérv: Olyan szempont(ok), amely(ek) alapján a sokaságot megfigyeljük, a sokaság egységeinek jellemzője.  Közös és megkülönböztető ismérv Ismérv változat: Az ismérv lehetséges kimeneteleit ismérv változatnak (tulajdonságnak) nevezzük. Alternatív ismérv: A két változattal rendelkező ismérvet alternatív ismérvnek nevezzük. 21 Elméleti kérdések – válaszok vázlatai

22 Mennyiségi ismérv: Méréses jellemző, kvantitatív változó. A sokaság egységeire vonatkozó számszerű megjelölést jelent, egy számmal írható le, amellyel matematikai műveletek végezhetők. Nem mennyiségi ismérv: A sokaság egységeire vonatkozóan valamilyen kategóriát rögzít, típusa szerint lehet időbeli, területi és minőségi ismérv.  Az időbeli ismérv a sokaság egységeire vonatkozó időponti vagy időtartam megjelölést jelent  A területi ismérv a sokaság egységeire nézve földrajzi elhatárolást fejez ki  minőségi ismérv (minősítéses jellemző) a sokaság egységeinek valamilyen minőségi tulajdonság szerinti megjelölése 22 Elméleti kérdések – válaszok vázlatai

23 3. Jellemezze a mérési skálák egyes típusait, írjon 2-2 példát! Nominális (névleges) skála  Legegyszerűbb mérési forma, számok kötetlen hozzárendelés dolgokhoz.  Az objektumokhoz rendelt szimbólumok, számok csak az objektumok, vagy azok osztályainak azonosítására szolgálnak (egyéb jelentésük nincs!)  Csak a megkülönböztethetőséget követeljük meg, így csak az egyenlőségi reláció értelmezhető (egyenlőségi axiómák)  Két típusa: az egyedi objektumok azonosító számozása; osztályok azonosítása (az egyes osztályokon belül lévő objektumok azonos számot kapnak)  Számítható statisztikai mutató: osztályok azonosítása esetén a gyakoriság, modális osztály 23 Elméleti kérdések – válaszok vázlatai

24 3. Jellemezze a mérési skálák egyes típusait, írjon 2-2 példát! Sorrendi (ordinális) skála  Az egységeket valamilyen közös tulajdonság alapján összehasonlítjuk, így a skála az egységek viszonylagos helyét is meghatározza  Az egyenlőségi reláció mellett a sorrendiségre vonatkozó relációk is érvényesek.  A sorrendi skálán mért egységek nincsenek egymástól egyenlő távolságra!  Minden olyan transzformáció végezhető, amely a skála eredeti sorrendjét változatlanul hagyja.  Számtani átlag és szórás nem számítható!!!!! Számítható a kvantilis, medián, rangkorrelációs együttható. 24 Elméleti kérdések – válaszok vázlatai

25 3. Jellemezze a mérési skálák egyes típusait, írjon 2-2 példát! Intervallum (különbség) skála  Rendelkezik a sorrendi skála tulajdonságaival és a skála bármelyik két pontja közötti különbség, távolság is értelmezhető.  Az egyenlőségi relációk és a sorrendiségre vonatkozó relációk érvényesek.  A közös és állandó mértékegység jellemzi és a számokat ennek alapján rendeljük a sorba rendezett dolgokhoz  Nincs rögzített nullpont, a skála nullpontját és mértékegységét szabadon választhatjuk meg.  A skála bármilyen lineáris transzformációja megengedett.  A mértani átlag és a relatív szórás kivételével valamennyi statisztikai jellemző és mutató számítható. 25 Elméleti kérdések – válaszok vázlatai

26 3. Jellemezze a mérési skálák egyes típusait, írjon 2-2 példát! Arányskála  Legmagasabb rendű, a legerősebb mérési formát jelenti.  Rendelkezik a korábbi skálák tulajdonságaival és teljesülnek az additivitási követelmények is.  A skálának valódi nullpontja van, és bármelyik két pontjának aránya független a mértékegységtől. 26 Elméleti kérdések – válaszok vázlatai

27 4. Ismertesse a leíró statisztika tárgyát, célját és mutassa be annak eszközrendszerét! Mi a különbség a diszkrét és folytonos mennyiségi ismérv között? LEÍRÓ vagy DESKRIPTÍV statisztika  A vizsgálat tárgyát képező jelenség tömör, számszerű jellemzését adja.  Nem lép túl a megfigyelés körén, de a megfigyelt adatok legjobb megértésére, bemutatására, összefoglaló jellemzésére törekszik. Területei: 1. adatgyűjtés 2. adatok ábrázolása 3. adatok csoportosítása, osztályozása 4. adatokkal végzett egyszerűbb aritmetikai műveletek 5. eredmények megjelenítése 27 Elméleti kérdések – válaszok vázlatai

28 Az egyedi mérésekből származó adatok (mennyiségi ismérvek) lehetnek diszkrétek és folytonosak.  Egy diszkrét mennyiségi ismérv csak véges vagy megszámlálhatóan sok, egymástól jól elkülöníthető értéket vehet fel. Egy folytonos mennyiségi ismérv valamely adott intervallumon belül bármilyen értéket felvehet. 28 Elméleti kérdések – válaszok vázlatai

29 5. Foglalja össze az egy mennyiségi ismérv szerinti osztályozás lényeges kérdéseit! Egy mennyiségi ismérv szerinti rendezés és osztályozás  X mennyiségi ismérv (X i változatai különbségi vagy arányskálán mért, valamilyen mértékegységgel rendelkező számértékek)  X a továbbiakban változó, X i (ismérv)érték Rangsor  A rangsor a megfigyelési egységeknek és/vagy azokhoz tartozó X i ismérvértékeknek monoton nemcsökkenő sorrendben történő felsorolása.  Készítésének célja: megkönnyítse a sokaság egységeinek X változó szerinti osztályozását Osztályozás eredménye:  Gyakorisági táblázat  Gyakorisági sorok ábrázolása  Grafikus kép, gyakorisági eloszlás 29 Elméleti kérdések – válaszok vázlatai

30 5. Foglalja össze az egy mennyiségi ismérv szerinti osztályozás lényeges kérdéseit! X ismérv szerinti osztályozás kérdései:  Az X változó diszkrét, és az általa felvehető értékek száma kicsi Annyi osztályt képezünk ahány különböző X érték lehetséges az i-edik osztály esetében fennáll az alsó és felső osztályhatár egybeesése  Az X változó folytonos, vagy diszkrét ugyan, de az általa felvehető különböző értékek száma nagy X lehetséges értékeinek tartományát osztályközökre bontjuk az i-edik osztályköz X i1 felső határa nem eshet egybe az (i+1)-dik osztályköz X i+1,0 alsó határával Hány osztályt képezzünk?  Információszerzés- és tömörítés egyensúlya  Egy osztályozás akkor megfelelő, ha az osztályok számának és határainak egy bizonyos sávon belüli változtatása nem nagyon befolyásolja a grafikus képet.  A gyakorlatban ehhez 5-15 osztály használata szinte mindig elegendő. 30 Elméleti kérdések – válaszok vázlatai

31 6. Melyek a mennyiségi sorok ábrázolásának főbb lépései? Röviden jellemezze az egyes lépéseket! A mennyiségi sorok grafikus ábrázolásának alapját a gyakorisági táblázat készítése jelenti. 1. Osztályba sorolás (folytonos adatok és nagyszámú diszkrét megfigyelés esetén); 2. gyakoriságok (f i ) megállapítása; 3. relatív gyakoriságok (g i ) megállapítása 4. összegzett (kumulált) gyakoriságok (fi’), illetve összegzett relatív gyakoriságok (gi’) megállapítása; 5. gyakorisági táblázat készítése (fi, gi, fi’, gi’ adataiból); 6. gyakorisági (relatív gyakorisági), illetve összegzett gyakorisági (relatív gyakorisági) hisztogramok (folytonos adatok esetén a poligon és az ogiva) felvétele (tapasztalati eloszlások elkészítése); 7. grafikus ábrázolás 31 Elméleti kérdések – válaszok vázlatai

32 Kevés értéket felvevő diszkrét ismérv 32

33 Sokféle értéket felvevő diszkrét ismérv vagy folytonos ismérv esetén 33 GYAKORISÁGI HISZTOGRAM (tapasztalati (empirikus) sűrűségfüggvény)

34 34 Sokféle értéket felvevő diszkrét ismérv vagy folytonos ismérv esetén KUMULÁLT RELATÍV GYAKORISÁGI HISZTOGRAM

35 7. Mutassa be a legfontosabb középérték mutatók osztályozásának szempontjait, jellemezze az alkalmazás előnyei és hátrányai szempontjából a legfontosabb mutatókat! Osztályozás:  Helyzeti: medián – módusz  Számított: számtani átlag, mértani átlag, harmonikus átlag, négyzetes átlag A legfontosabb középérték mutatók:  Medián  Módusz  Számtani átlag 35 Elméleti kérdések – válaszok vázlatai

36 Medián helyzeti középérték mutató a változó azon számértéke, amelynél az összes előforduló számérték fele kisebb, fele pedig nagyobb, így a rangsorba állított sokasági számértékeket két egyenlő gyakoriságú osztályra bontja Becsülhető osztályközös gyakorisági sorból is: Előnye:  Mindig egyértelműen meghatározható  Érzéketlen a szélsőértékekre, és nem függ a többi ismérvértéktől sem. Hátránya:  Nem használható, ha az adatsorban sok az egyforma ismérvérték Egyéb tulajdonsága : 36 Elméleti kérdések – válaszok vázlatai ha

37 Módusz helyzeti középérték, a tipikus ismérvérték diszkrét ismérv esetén a módusz a leggyakrabban előforduló ismérvérték, folytonos ismérv esetén a gyakorisági görbe maximumhelye. Előnye:  érzéketlen a szélsőértékekre,  nem függ sem az összes, sem a kiugró ismérvértékektől. Hátránya:  nem mindig határozható meg egyértelműen, és nem is mindig létezik  nagy bizonytalansággal becsülhető Egyéb tulajdonsága: nyers módusz, osztályköz megválasztása Becsülhető osztályközös gyakorisági sorból is: 37 Elméleti kérdések – válaszok vázlatai

38 38 Elméleti kérdések – válaszok vázlatai Számtani átlag számított középértékfajta az a szám, amellyel az átlagolandó számértékeket helyettesítve azok összege változatlan marad. Számítása: Előnye:  bármely alapadathalmazból egyértelműen meghatározható, minden alapadatot felhasznál Hátránya:  érzékeny a szélsőértékekre  nyesett átlag minimális, ha

39 8. Mutassa be az ingadozásmutatók osztályozásának szempontjait, jellemezze az alkalmazás szempontjából az egyes mutatókat! Osztályozás:  Abszolút és relatív  Az adatok egymástól vett eltérésein alapuló vagy egy kitüntetett értéktől való távolságot mérő mutatók A legfontosabb ingadozásmutatók:  Terjedelem, interkvantilis terjedelem  Tapasztalati szórás  Korrigált tapasztalati szórás  Relatív szórás 39 Elméleti kérdések – válaszok vázlatai

40 Terjedelem a szóródást az adathalmazban szereplő legnagyobb és legkisebb adat különbségeként jellemzi abszolút ingadozásmutató Előnye: a könnyű számítás Hátránya: értéke csak a két legszélsőségesebb ismérvértéktől függ, amelyeket sokszor a véletlen szeszélyeinek köszönhetünk. Interkvantilis terjedelem  csökkenti a véletlen szélsőértékeket (legkisebb és legnagyobb értéket) alakító szerepét  az adathalmaz két szélső k-adrendű kvantilisének különbsége 40 Elméleti kérdések – válaszok vázlatai

41 (Korrigált) tapasztalati szórás a szóródást az alapadatoknak egy kitüntetett értéktől (számtani átlagtól) való eltérésein keresztül méri abszolút ingadozásmutató A szórás az egyes X i ismérvértékek átlagtól vett d i eltéréseinek négyzetes átlaga: azt mutatja, hogy az egyes értékek átlagosan mennyire térnek el a számtani átlagtól. Olyan átlagos hiba, amit akkor követünk el, ha minden alapadatot a számtani átlaggal helyettesítünk. A számtani átlag tulajdonsága szerint ez a hiba minimális. 41 Elméleti kérdések – válaszok vázlatai

42 Relatív szórás relatív ingadozásmutató az ismérvértékek átlagtól vett átlagos eltérése százalékos formában kifejezve minél kisebb a relatív szórás, a számtani átlag annál jobban jellemzi az alapadatokat a szórás és a számtani átlag hányadosa, csak pozitív értékű alapadatok esetében számítható Alkalmazása: különböző sokaságok vagy ismérvek szóródásának összehasonlítására használják 42 Elméleti kérdések – válaszok vázlatai


Letölteni ppt "Konzultáció – Leíró statisztika 2014. október 22. Gazdaságstatisztika."

Hasonló előadás


Google Hirdetések