Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaTibor Botond Mezei Megváltozta több, mint 8 éve
1
Kvantitatív módszerek 2014 ősz MINTAVÉTEL, LEÍRÓ STATISZTIKA Kvantitatív módszerek 2014. szeptember 30.
2
Kvantitatív módszerek 2014 ősz Valószínűségszámítás - Matematikai statisztika Valószínűségszámítás: a véletlen tömegjelenségekben rejlő statisztikai törvényszerűségek vizsgálata Tömegjelenség: tetszőlegesen sokszor ismétlődő esemény Véletlen: többféle kimenetel lehetséges Valószínűségelmélet: ismert az eloszlásfüggvény és annak paraméterei valószínűséggel kapcsolatos kérdések megválaszolhatók Valóság: a paraméterek ismerete nélkül a kérdéses valószínűségeket nem tudjuk meghatározni A matematikai statisztika célja: következtetés tapasztalati (megfigyelési, mérési) adatokból események ismeretlen valószínűségeire, valószínűségi változók ismeretlen eloszlásfüggvényére vagy azok paramétereire. mintavétel, adatfeldolgozás, leíró statisztika, következtető statisztika (becslés és hipotézisvizsgálat) 2
3
Kvantitatív módszerek 2014 ősz Sokaság: a vizsgálat tárgyát képező egységek összessége Minta: valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés (mérés) eredménye Mintavétel Következtetés Matematikai statisztika lényege A megfigyelési eredmények a minta elemei, a megfigyelések száma a minta nagysága vagy elemszáma. 3 Mintavétel: a statisztikai sokaságból információszerzés céljából véletlenszerűen egyedi elemeket emelünk ki A minta elemei az alapsokaság eloszlásával megegyező eloszlású valószínűségi változók.
4
Kvantitatív módszerek 2014 ősz Mintavétel Cél: következtetéseket vonjunk le a teljes sokaságra vonatkozóan a sokaság részleges megismerése által NEM A MINTA KONKRÉT JELLEMZÉSE ÉRDEKEL BENNÜNKET. A MINTA CSAK EGY ESZKÖZ, AMELYNEK SEGÍTSÉGÉVEL KÖVETKEZTETNI KÍVÁNUNK A SOKASÁGRA, ILL. ANNAK TULAJDONSÁGAIRA. Így részleges megfigyelések eredményéből következtetünk a teljes sokaságra A statisztikai mintavételek és az ebből származó adatokat felhasználó elemzések mindig tartalmaznak hibákat. A statisztikai hiba a statisztika szükségszerű velejárója, és fontos annak számszerűsítési képesssége. 4
5
Kvantitatív módszerek 2014 ősz Mintavételi hiba Mintavétellel kapcsolatos hibák két nagy csoportja: Adatgyűjtéshez kapcsolódó hibák: pl. definíciós hibák, nemválaszolási hibák, végrehajtási hibák – NEM MINTAVÉTELI HIBA A technika fejlődésével sokféle módon lehet ellene védekezni A teljes sokaság megismeréséről való lemondás ára – MINTAVÉTELI HIBA olyan eljárásokat keresünk, hogy ez a lehető legkisebb legyen A mintavételi hiba annál kisebb, minél nagyobb a minta. 5
6
Kvantitatív módszerek 2014 ősz Mintavételi hiba A mintából számított bármely mutató értéke mintáról mintára változik. A mintából számított értékek a megfelelő sokasági jellemző körül szóródnak. Ez a szóródás kisebb minták esetében nagyobb, nagyobb minták esetében kisebb. A mintavételi hiba a vizsgált mutató lehetséges mintákból számított értékeinek átlagos eltérését mutatja a megfelelő sokasági értéktől. 6
7
Kvantitatív módszerek 2014 ősz Adatfelvételi módok 7 Adatfelvétel Teljes körű – csak véges sokaság esetén (pl. népszámlálás) Részleges Kísérleti eredmények gyűjtése Mintavételes megfigyelés Egyéb részleges megfigyelés Véletlen(szerű) kiválasztás Nemvéletlen(szerű) kiválasztás ismert vagy meghatározható a sokaság elemeinek mintába kerülési esélye reprezentativitás Mintavételi hiba számszerűsítési képessége
8
Kvantitatív módszerek 2014 ősz Véletlen mintavételi eljárások Statisztikai minta definíciója: valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés (mérés) eredménye Független, azonos eloszlású minta (FAE): a minta elemeknek azonos eloszlásúnak és függetlennek kell lennie homogén és végtelen nagy sokaságból veszünk véletlen, visszatevéses vagy visszatevés nélküli mintát vagy véges sokaságból egyenlő valószínűséggel visszatevéses mintát Gyakorlati alkalmazása: tömegtermelés minőségellenőrzése, általában nem áll teljes lista rendelkezésre, ezért részleges listákkal pótoljuk, ritka a gyakorlatban Mintanagyság meghatározása: 8
9
Kvantitatív módszerek 2014 ősz Egyszerű véletlen (EV) mintavétel Homogén, véges elemszámú sokaság esetén, visszatevés nélküli minta, minden lehetséges n elemű minta kiválasztásának azonos valószínűséget biztosítva Társadalmi-gazdasági elemzések esetén ritka, de viszonyítási alap EV minta készítése: 1. Komplett lista összeállítása 2. Mintanagyság meghatározása (sokaság szóródása, költségek, pontossági követelmények) 3. Kiválasztás tervezett véletlen módon (véletlenszám-generátor, véletlenszám- táblázat) Szisztematikus kiválasztás Teljes lista k=N/n lépésköz meghatározása, k 0 véletlen kiindulópont, a k lépésköz n-szeri felvétele Egyszerű, gyors eljárás, a minta mechanikusan kiválasztható Ha a lista a vizsgált ismérv szerint véletlenszerűen van sorba rendezve, akkor megegyezik a véletlen kiválasztással 9 Véletlen mintavételi eljárások
10
Kvantitatív módszerek 2014 ősz Szisztematikus kiválasztás problémái Nem lesz véletlen a minta, ha: ha a lista a vizsgált tulajdonság, jellemző szerint nem véletlenszerűen van sorba rendezve, hanem van közöttük sztochasztikus kapcsolat ha a lista a vizsgált ismérv szerint periodikus hullámzást mutat FAE vs. EV minta FAE visszatevéssel, az EV visszatevés nélkül készül Az FAE minta kényelmesebb elméleti tulajdonságokkal rendelkezik, az EV minta a gyakorlat számára hasznosabb. Nagy sokaság esetén e két eljárás közötti különbség elenyésző, egymással helyettesíthetőek 10 Véletlen mintavételi eljárások
11
Kvantitatív módszerek 2014 ősz Rétegzett (R) minta alkalmazása: Ha a sokaság véges és heterogén, s előzetes információink vannak arra nézve, hogy ezt a sokaságot hogyan lehet homogén csoportokba sorolni Feltétel a rétegképző ismérv és rétegenkénti listák ismerete A sokaságot homogén(ebb) részsokaságokra bontjuk (átfedésmentesen és teljesen), majd a rétegeken belül egymástól függetlenül egyszerű véletlen mintavételt végzünk. Előnye: Azonos mintanagyság mellett kisebb mintavételi hibát eredményez, mint az EV minta (ha jól választunk rétegképző ismérvet) A sokaság rétegeinek száma: M, az egyes rétegeken belül a sokaság N 1, N 2, …., N j, …, N M elemet tartalmaz. A minta elemszáma: n, az egyes rétegeken belül n 1, n 2, …., n j, …, n M elemű mintát veszünk: 11 Véletlen mintavételi módok
12
Kvantitatív módszerek 2014 ősz Rétegzett minta elosztásának formái: a minta teljes elemszámát hogyan osszuk szét az egyes rétegek között? Egyenletes elosztás: minden rétegbe azonos számú mintaelem kerül egyszerű eljárás ha a rétegek egyforma nagyságúak, akkor egyben arányos is lesz ha az egyes rétegek mutatóira is kíváncsiak vagyunk, akkor az egyes rétegek mintavételi hibáinak összege minimális Arányos elosztás: a mintába a sokasági arányoknak megfelelően választjuk meg az elemszámot (nagy gyakorlati jelentőség) egyszerű eljárás a mintában ugyanazok a súlyarányok érvényesülnek, mint a sokaságban alapvető mutatók mintavételi hibája minimális (ha a rétegenkénti sokasági szórások nem ismertek, és azonosnak tekinthetők) 12 Véletlen mintavételi módok
13
Kvantitatív módszerek 2014 ősz Neyman-féle optimális elosztás: Feltételezi a rétegenkénti sokasági szórások ismeretét Rögzített n mellett kedvezőbb mintát kapunk, ha a nagyobb szórású rétegekből nagyobb mintát veszünk. a főátlagot ilyen mintából számítva (adott n mellett) minimális mintavételi hibát kapunk Nehezebb végrehajtás Költségoptimális elosztás: a sokasági szórások ismerete mellett előre ismerjük az egyes rétegek megfigyelési egységköltségeit is j-edik rétegen belül egy elem átlagos megfigyelési költsége π j A teljes felvétel költségfüggvénye: Előre megadott C esetén az átlag mintavételi hibáját minimalizáló elosztás az azonos rétegnagyság és szórás esetén minél nagyobb a mintavétel egységköltsége, annál kisebb mintát kell venni az adott rétegből 13 Véletlen mintavételi módok
14
Kvantitatív módszerek 2014 ősz Csoportos mintavétel (CS) alkalmazása: Homogén, véges sokaságok esetén Nem áll rendelkezésre teljes lista, de nagyobb csoportokra igen A csoportok koncentráltságuk miatt olcsóbban megfigyelhetők, mint a hasonló számosságú, de nem koncentráltan előforduló egyedek Egyszerűbb és olcsóbb, mint az azonos nagyságú EV minta Ha a csoporton belüli homogenitás nagy, sok felesleges megfigyelést tartalmaz Ha a csoporton belüli heterogenitás nagy, akkor az EV mintával megegyező pontosságú Lépései: Csoportok közül választunk egyszerű véletlen mintavétellel A kiválasztott csoportot teljes körűen megfigyeljük Megjegyzés: R minta esetén a rétegen belüli homogenitás, CS minta esetén a csoportokon belüli heterogenitás a kedvező tulajdonság Az R minta azonos elemszám esetén az EV mintánál kisebb hibát eredményez, nagyobb költséggel, a CS minta nagyobb hibákhoz vezet, kisebb költséggel 14 Véletlen mintavételi módok
15
Kvantitatív módszerek 2014 ősz Többlépcsős mintavétel alkalmazása: Kétlépcsős változata: (1) csoportos mintavétel; (2) csoportokból is egyszerű véletlen minta Azonos mintanagyság mellett kisebb hibát eredményez, mint a csoportos mintavétel A mintaelosztás tervezése nem egyszerű feladat 15 Véletlen mintavételi módok Nemvéletlen mintavételi eljárások Ebben az esetben nincs biztosítva, hogy a minta a sokaságra valóban jellemző legyen Nem számszerűsíthető a mintavételi hiba Itt is cél, hogy a mintából a sokaságra következtessünk, van reprezentativitásra való törekvés, de az általánosítás kétes. Egyszerű végrehajtás, olcsó eljárások.
16
Kvantitatív módszerek 2014 ősz Nemvéletlen mintavételi eljárások Szisztematikus mintavétel: Amennyiben a megfigyelések a listán a vizsgált ismérvtől független sorrendben szerepelnek, akkor egyszerű véletlen mintának is tekinthető. Kvóta szerinti mintavétel: nem véletlenszerű a kiválasztás, de a sokaság bizonyos ismérvek szerinti megoszlását tartani kell. Ezen ismérvek szerint reprezentatív lesz, de más ismérvek szerint a választás önkényes, ez torzítja az összetételt. Koncentrált minta: A sokaságból egy fontosnak tekintett mennyiségi ismérv szerint azokat veszik a mintába, amelyek a sokaság nagy részét az ismérv szerint koncentrálják. Hólabda kiválasztás: ritka nehezen számba vehető sokaságok esetén Néhány kiválasztott egyedből indulnak, majd ezek mindegyike ismeretségi körében keresi az újabb mintaelemeket és így tovább Önkényes minta: Teljesen önkényes kiválasztása az elemeknek. 16
17
Kvantitatív módszerek 2014 ősz Mintavétel Következtetés Mintavétel LEÍRÓ STATISZTIKA KÖVETKEZTETŐ STATISZTIKA 17
18
Kvantitatív módszerek 2014 ősz Statisztikai módszertan ágai LEÍRÓ vagy DESKRIPTÍV statisztika A vizsgálat tárgyát képező jelenség tömör, számszerű jellemzését adja. Nem lép túl a megfigyelés körén, de a megfigyelt adatok legjobb megértésére, bemutatására, összefoglaló jellemzésére törekszik. Például: Népszámlálási adatok feldolgozása, elemzése, a népesség számával, összetételével kapcsolatos jellemzők közzététele, megjelenítése Gazdasági szervezetek legfontosabb adatainak közzététele statisztikai évkönyvekben Lakásépítésről, oktatásról készített statisztikai összefoglaló Vállalat gazdálkodásának vizsgálata 18
19
Kvantitatív módszerek 2014 ősz KÖVETKEZTETŐ statisztika Fő célja a mintából való következtetés, általánosítás a teljes sokaságra vonatkozóan. Például: Minőségellenőrzés Lakosság jövedelmi különbségeinek elemzése Ingatlan árbecslések Befektetési tanácsadások Könyvvizsgálat Mezőgazdaság 19 Statisztikai módszertan ágai
20
Kvantitatív módszerek 2014 ősz Leíró statisztika Feladatai: 1. adatgyűjtés 2. adatok ábrázolása 3. adatok csoportosítása, osztályozása 4. adatokkal végzett egyszerűbb aritmetikai műveletek 5. eredmények megjelenítése 20
21
Kvantitatív módszerek 2014 ősz 1. Adatgyűjtés Az egyedi mérésekből származó adatok (mennyiségi ismérvek) lehetnek diszkrétek és folytonosak. Egy diszkrét mennyiségi ismérv csak véges vagy megszámlálhatóan sok, egymástól jól elkülöníthető értéket vehet fel. Háztartások nagysága Gazdálkodó szervezetek nagysága Balesetek száma Mogyorós csokiban a mogyorók száma Adott időszak alatti meghibásodások száma Egy folytonos mennyiségi ismérv valamely adott intervallumon belül bármilyen értéket felvehet. Háztartások jövedelme Lakások alapterülete Gépkocsi abroncsok futásteljesítménye Bux index havi hozamadata 21
22
Kvantitatív módszerek 2014 ősz 2. Az adatok ábrázolása Eszközei: 22 oszlopdiagram vonaldiagram kördiagram sávdiagram
23
Kvantitatív módszerek 2014 ősz 3. Adatok csoportosítása, osztályozása Egy mennyiségi ismérv szerinti rendezés és osztályozás X mennyiségi ismérv (X i változatai különbségi vagy arányskálán mért, valamilyen mértékegységgel rendelkező számértékek) X a továbbiakban változó, X i (ismérv)érték Rangsor A rangsor a megfigyelési egységeknek és/vagy azokhoz tartozó X i ismérvértékeknek monoton nemcsökkenő sorrendben történő felsorolása. Készítésének célja: megkönnyítse a sokaság egységeinek X változó szerinti osztályozását Osztályozás eredménye Gyakorisági sor, gyakorisági eloszlás 23
24
Kvantitatív módszerek 2014 ősz 24 3. Adatok csoportosítása, osztályozása Az X szerint képzett osztály Osztály- közép Tapasz- talati Relatív alsófelsőgyakoriság határa X 10 X 11 X1*X1* f1f1 g1g1 X 20 X 21 X2*X2* f2f2 g2g2 X i0 X i1 Xi*Xi* fifi gigi …………… X k0 X k1 Xk*Xk* fkfk gkgk ÖsszesenN1 Osztályközhosszúság:
25
Kvantitatív módszerek 2014 ősz X ismérv szerinti osztályozás kérdései: Az X változó diszkrét, és az általa felvehető értékek száma kicsi Annyi osztályt képezünk ahány különböző X érték lehetséges az i-edik osztály esetében fennáll az alsó és felső osztályhatár egybeesése Az X változó folytonos, vagy diszkrét ugyan, de az általa felvehető különböző értékek száma nagy X lehetséges értékeinek tartományát osztályközökre bontjuk az i-edik osztályköz X i1 felső határa nem eshet egybe az (i+1)-dik osztályköz X i+1,0 alsó határával Hány osztályt képezzünk? A gyakorlatban ehhez 5-15 osztály használata szinte mindig elegendő. Osztályok számának meghatározása: 25 3. Adatok csoportosítása, osztályozása
26
Kvantitatív módszerek 2014 ősz A mennyiségi sorok grafikus ábrázolásának alapját a gyakorisági táblázat készítése jelenti. 1. Osztályba sorolás (folytonos adatok és nagyszámú diszkrét megfigyelés esetén); 2. gyakoriságok (f i ) megállapítása; 3. relatív gyakoriságok (g i ) megállapítása 4. összegzett (kumulált) gyakoriságok (fi’), illetve összegzett relatív gyakoriságok (gi’) megállapítása; 5. gyakorisági táblázat készítése (fi, gi, fi’, gi’ adataiból); 6. gyakorisági (relatív gyakorisági), illetve összegzett gyakorisági (relatív gyakorisági) hisztogramok (folytonos adatok esetén a poligon és az ogiva) felvétele (tapasztalati eloszlások elkészítése); 7. grafikus ábrázolás 26 3. Adatok csoportosítása, osztályozása
27
Kvantitatív módszerek 2014 ősz Példa – kevés számú diszkrét adat A Gazdaságstatisztika c. tárgyat a 2012 őszi félévben felvett hallgatók érdemjegyeinek gyakorisági táblázata 27 pálcikadiagram Diszkrét ismérv által felvehető értékek lépcső alakú diagram
28
Kvantitatív módszerek 2014 ősz Pálcikadiagram – diszkrét adat 28 ÉrdemjegyTapasztalati gyakoriság (f i ) Relatív gyakoriság (g i ) 1680,089 22800,368 32740,361 4910,120 5470,062 Összesen7601
29
Kvantitatív módszerek 2014 ősz Lépcső alakú diagram 29 ÉrdemjegyKumulált tapasztalati gyakoriság (f i ) Kumulált relatív gyakoriság (g i ) 1680,089 23480,458 36220,818 47130,938 57601
30
Kvantitatív módszerek 2014 ősz Nagyszámú folytonos adat A Budapesti Értéktőzsde Részvényindexének (BUX) 2005 márciusától 2013 júniusáig tartó időszak havi hozamainak értékeit az alábbi táblázatban foglaltuk össze. 30
31
Kvantitatív módszerek 2014 ősz Gyakorisági táblázat 31 alsó határfelső határ osztály közép fifi g i [%]f’ i g’ i [%] -20,00%-15,00%-17,5%22,02%2 -15,00%-10,00%-12,5%99,09%1111,11% -10,00%-5,00%-7,5%99,09%2020,20% -5,00%0,00%-2,5%2323,23%4343,43% 0,00%5,00%2,5%3232,32%7575,76% 5,00%10,00%7,5%1515,15%9090,91% 10,00%15,00%12,5%88,08%9898,99% 15,00%20,00%17,5%11,01%99100,00% összesen 99100,00% Gyakorisági hisztogram v. Gyakorisági vonaldiagram Kumulált (rel.) gyakorisági hisztogram v. Kumulált (rel.) gyakorisági vonaldiagram
32
Kvantitatív módszerek 2014 ősz Gyakorisági hisztogram 32 alsó határfelső határ osztály közép g i [%] -20,00%-15,00%-17,5%2,02% -15,00%-10,00%-12,5%9,09% -10,00%-5,00%-7,5%9,09% -5,00%0,00%-2,5%23,23% 0,00%5,00%2,5%32,32% 5,00%10,00%7,5%15,15% 10,00%15,00%12,5%8,08% 15,00%20,00%17,5%1,01% összesen 100,00% GYAKORISÁGI HISZTOGRAM (tapasztalati (empirikus) sűrűségfüggvény) Gyakoriság vonaldiagramja
33
Kvantitatív módszerek 2014 ősz Gyakorisági vonaldiagram 33 Gyakorisági görbe
34
Kvantitatív módszerek 2014 ősz Kumulált relatív gyakorisági hisztogram 34 alsó határfelső határ osztály közép g’ i [%] -20,00%-15,00%-17,5%2,02% -15,00%-10,00%-12,5%11,11% -10,00%-5,00%-7,5%20,20% -5,00%0,00%-2,5%43,43% 0,00%5,00%2,5%75,76% 5,00%10,00%7,5%90,91% 10,00%15,00%12,5%98,99% 15,00%20,00%17,5%100,00% összesen KUMULÁLT RELATÍV GYAKORISÁGI HISZTOGRAM Kumulált relatív gyakoriság vonaldiagramja
35
Kvantitatív módszerek 2014 ősz Kumulált relatív gyakoriság vonaldiagramja 35 Ogiva KUMULÁLT RELATÍV GYAKORISÁG VONALDIAGRAMJA (tapasztalati eloszlásfüggvény)
36
Kvantitatív módszerek 2014 ősz Tapasztalati eloszlások jellegzetességei Középérték mutatók: Helyzeti és számított (Kvantilisek) Ingadozásmutatók: Abszolút és relatív (Momentumok) Alakmutatók: Aszimmetria és lapultság (csúcsosság) Középértékekkel szembeni elvárások: Közepes helyzetűek Tipikusak Egyértelműen meghatározhatóak Könnyen értelmezhetőek 36
37
Kvantitatív módszerek 2014 ősz Medián helyzeti középérték mutató a változó azon számértéke, amelynél az összes előforduló számérték fele kisebb, fele pedig nagyobb, így a rangsorba állított sokasági számértékeket két egyenlő gyakoriságú osztályra bontja Becsülhető osztályközös gyakorisági sorból is: Előnye: Mindig egyértelműen meghatározható Érzéketlen a szélsőértékekre, és nem függ a többi ismérvértéktől sem. Hátránya: Nem használható, ha az adatsorban sok az egyforma ismérvérték Egyéb tulajdonsága : 37 ha A mediánt tartalmazó osztály bal végpontja. me annak a legelső osztályköznek a sorszáma, amelyre igaz, hogy A mediánt tartalmazó osztály hossza.
38
Kvantitatív módszerek 2014 ősz Módusz helyzeti középérték, a tipikus ismérvérték diszkrét ismérv esetén a módusz a leggyakrabban előforduló ismérvérték, folytonos ismérv esetén a gyakorisági görbe maximumhelye. Előnye: érzéketlen a szélsőértékekre, nem függ sem az összes, sem a kiugró ismérvértékektől. Hátránya: nem mindig határozható meg egyértelműen, és nem is mindig létezik nagy bizonytalansággal becsülhető Egyéb tulajdonsága: nyers módusz, osztályköz megválasztása Becsülhető osztályközös gyakorisági sorból is: 38 mo a legnagyobb gyakoriságú osztály(ok) sorszáma A móduszt tartalmazó osztály bal végpontja. A móduszt tartalmazó osztály hossza.
39
Kvantitatív módszerek 2014 ősz Számtani átlag számított középértékfajta az a szám, amellyel az átlagolandó számértékeket helyettesítve azok összege változatlan marad. Számítása: Előnye: bármely alapadathalmazból egyértelműen meghatározható, minden alapadatot felhasznál Hátránya: érzékeny a szélsőértékekre nyesett átlag 39
40
Kvantitatív módszerek 2014 ősz Számtani átlag Egyéb fontos tulajdonsága: 40 minimális, ha
41
Kvantitatív módszerek 2014 ősz Harmonikus átlag számított középértékmutató, az a szám, amellyel az átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad Alkalmazása: ha az értékek reciprokainak összege értelmezhető, leíró statisztikai viszonyszámok és indexszámítás 41
42
Kvantitatív módszerek 2014 ősz Mértani átlag számított középértékmutató, az a szám, amellyel az átlagolandó értékeket helyettesítve azok szorzata változatlan marad Alkalmazása: ha az értékek szorzata értelmezhető, illetve az átlagolandó értékek exponenciálisan nőnek vagy csökkennek az időbeli fejlődés átlagos ütemének vizsgálatakor idősor-elemzés 42
43
Kvantitatív módszerek 2014 ősz Négyzetes átlag számított középérték-mutató, az a szám, amellyel az átlagolandó értékeket helyettesítve azok négyzetösszege változatlan marad Hátránya: a kiugróan magas értékekre érzékenyen reagál Alkalmazása: ha az előjeleknek nincs jelentősége szórásszámítás 43
44
Kvantitatív módszerek 2014 ősz Kvantilisek a rangsorban olyan osztópontok (osztályhatárok), amelyek egyenlő relatív gyakoriságokat fognak közre Az X i/k i-edik k-ad rendű kvantilis az a szám, amelynél az összes előforduló ismérvértékek i/k-ad része kisebb, (1-i/k)-ad része pedig nagyobb, ahol k≥2 és i=1, 2,…, k-1. 44
45
Kvantitatív módszerek 2014 ősz Ingadozásmutatók Csoportosításuk: Az adathalmazban szereplő értékek változékonyságát az egyes értékek egymás közötti különbségein, vagy egyes értékeknek egy kitüntetett értéktől (középérték) való eltérésein keresztül ragadja meg. Mértékegységüket tekintve: Abszolút mutatók: mértékegysége megegyezik az alapadatokéval Relatív mutatók: mértékegység nélküli 45
46
Kvantitatív módszerek 2014 ősz Terjedelem a szóródást az adathalmazban szereplő legnagyobb és legkisebb adat különbségeként jellemzi abszolút ingadozásmutató Előnye: a könnyű számítás Hátránya: értéke csak a két legszélsőségesebb ismérvértéktől függ, amelyeket sokszor a véletlen szeszélyeinek köszönhetünk. Interkvantilis terjedelem csökkenti a véletlen szélsőértékeket (legkisebb és legnagyobb értéket) alakító szerepét az adathalmaz két szélső k-adrendű kvantilisének különbsége 46
47
Kvantitatív módszerek 2014 ősz (Korrigált) tapasztalati szórás a szóródást az alapadatoknak egy kitüntetett értéktől (számtani átlagtól) való eltérésein keresztül méri abszolút ingadozásmutató A szórás az egyes X i ismérvértékek átlagtól vett d i eltéréseinek négyzetes átlaga: azt mutatja, hogy az egyes értékek átlagosan mennyire térnek el a számtani átlagtól. Olyan átlagos hiba, amit akkor követünk el, ha minden alapadatot a számtani átlaggal helyettesítünk. A számtani átlag tulajdonsága szerint ez a hiba minimális. 47
48
Kvantitatív módszerek 2014 ősz Relatív szórás relatív ingadozásmutató az ismérvértékek átlagtól vett átlagos eltérése százalékos formában kifejezve minél kisebb a relatív szórás, a számtani átlag annál jobban jellemzi az alapadatokat a szórás és a számtani átlag hányadosa, csak pozitív értékű alapadatok esetében számítható Alkalmazása: különböző sokaságok vagy ismérvek szóródásának összehasonlítására használják 48
49
Kvantitatív módszerek 2014 ősz Átlagos abszolút különbség (G) A szóródást az ismérvértékek egymás közötti különbségein keresztül méri, abszolút ingadozásmutató Azt mutatja meg, hogy az X ismérv értékei átlagosan mennyire különböznek egymástól. A minden lehetséges módon párba állított ismérvértékek különbségeinek abszolút értékéből számított számtani átlag. Kényelmetlen a számítása Alkalmazási területe: koncentráció elemzés 49
50
Kvantitatív módszerek 2014 ősz Átlagos abszolút eltérés (Δ) A szóródást az értékeknek egy kitüntetett értéktől való eltéréseire támaszkodva jellemzi abszolút ingadozásmutató Az egyes ismérvértékek és a számtani átlag különbségeinek abszolút értékeiből számított számtani átlag 50
51
Kvantitatív módszerek 2014 ősz Momentumok Y i ismérvértékek vagy a d i eltérések helyett a alakú eltérések hatványait átlagolják, ahol A egy tetszőleges állandó. az Y ismérv vagy gyakorisági eloszlás A körüli r-edik momentumai: 51
52
Kvantitatív módszerek 2014 ősz Alakmutatók Csúcsosság: 52
53
Kvantitatív módszerek 2014 ősz Aszimmetria Pearson-féle mutatószám: 53
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.