Gazdaságstatisztika Bevezetés 2013. szeptember 11.
Valószínűségszámítás - Matematikai statisztika A valószínűségszámítás tárgya: a véletlen tömegjelenségekben rejlő statisztikai törvényszerűségek vizsgálata Tömegjelenség: tetszőlegesen sokszor ismétlődhetnek Véletlen: minden megismétlődésük többféle eredménnyel – kimenetellel járhat; ugyanakkor nem tudjuk megmondani, kiszámítani, melyik ismétlődés alkalmával melyik kimenetel következik be. A levonható törvényszerűségek statisztikai jellegűek, azaz nagyszámú végrehajtás során átlagosan érvényes törvények. A matematikai statisztika (a valószínűségszámítás egyik fejezete) célja: következtetés tapasztalati (megfigyelési, mérési) adatokból események ismeretlen valószínűségeire, valószínűségi változók ismeretlen eloszlásfüggvényére vagy azok paramétereire. 2013 ősz Gazdaságstatisztika
Sokaság: a vizsgálat tárgyát képező egységek összessége Matematikai statisztika lényege Sokaság: a vizsgálat tárgyát képező egységek összessége Következtetés A megfigyelési eredmények a minta elemei, a megfigyelések száma a minta nagysága vagy elemszáma. Minta: valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés (mérés) eredménye Mintavétel 2013 ősz Gazdaságstatisztika
Mintavétel A sokaság egy részének kiválasztását mintavételnek, a sokaság így kiválasztott részét pedig mintának nevezzük. Cél: segítségével következtetéseket vonjunk le a teljes sokaságra vonatkozóan. NEM A MINTA KONKRÉT JELLEMZÉSE ÉRDEKEL BENNÜNKET. A MINTA CSAK EGY ESZKÖZ, AMELYNEK SEGÍTSÉGÉVEL KÖVETKEZTETNI KÍVÁNUNK A SOKASÁGRA, ILL. ANNAK TULAJDONSÁGAIRA. Így részleges megfigyelések eredményéből következtetünk a teljes sokaságra A statisztikai mintavételek és az ebből származó adatokat felhasználó elemzések mindig tartalmaznak hibákat. A statisztikai hiba a statisztika szükségszerű velejárója, és fontos annak számszerűsítési képesssége. 2013 ősz Gazdaságstatisztika
Mintavételi hiba Mintavétellel kapcsolatos hibák két nagy csoportja: Adatgyűjtéshez kapcsolódó hibák: pl. pontatlan adatgyűjtés, hibás adatrögzítés, rossz válasz, nem kellő körültekintés – NEM MINTAVÉTELI HIBA A technika fejlődésével sokféle módon lehet ellene védekezni A teljes sokaság megismeréséről való lemondás ára – MINTAVÉTELI HIBA olyan eljárásokat keresünk, hogy ez a lehető legkisebb legyen 2012 ősz Gazdaságstatisztika
Mintavételi módok Az alapsokaságból többféleképpen választható ki egy n elemű minta: véletlen és nem véletlen mintavételi módok. A véletlen kiválasztás olyan kiválasztási eljárás, melynek során ismert vagy meghatározható a sokaság elemeinek mintába kerülési esélye. A mintavételi hiba számszerűsítése csak véletlen minta esetében valósítható meg. Reprezentativitás: azt jelenti, hogy a minta összetétele csak a véletlen hatások miatt tér el a sokaságétól, ezt is csak egy véletlen minta tudja biztosítani. 2013 ősz Gazdaságstatisztika
Véletlen mintavételi módok Visszatevéses egyszerű véletlen minta: a sokaságból egyenlő valószínűséggel, a visszatevéses technika miatt egymástól függetlenül veszünk mintát. Ritka a gyakorlatban, reprezentatív a véletlenség következtében, szükség van teljes listára Visszatevés nélküli egyszerű véletlen minta: a sokaságból egyenlő valószínűséggel vesszük a mintát, de egy sokasági elem csak egyszer kerülhet mintába, így a mintaelemek egymástól nem függetlenek. Gyakori, reprezentatív Következtetés pontossága függ a mintaelemszámtól, az eredeti sokaság heterogenitásától. Szükség van teljes listára Rétegzett minta: a sokaságot egy csoportképző ismérv szerint átfedésmentes, az egész sokaságot lefedő rétegekre bontjuk, majd minden rétegből egyszerű véletlen mintát veszünk. Olyan rétegképző ismérv kell, amely homogenizálja a részsokaságot, szükség van teljes listára Csoportos és többlépcsős minta: a sokaságot csoportokra bontjuk, és a csoportok közül választunk egyszerű véletlen mintát, és a csoport minden egysége bekerül a mintába. 2013 ősz Gazdaságstatisztika
Nemvéletlen mintavételi eljárások Szisztematikus mintavétel: pl. a sokaság minden 10. vagy 100. elemét vizsgáljuk meg. Amennyiben a megfigyelések a listán a vizsgált ismérvtől független sorrendben szerepelnek, akkor egyszerű véletlen mintának is tekinthető. Kvóta szerinti mintavétel: nem véletlenszerű a kiválasztás, de a sokaság bizonyos ismérvek szerinti megoszlását tartani kell. Ezen ismérvek szerint reprezentatív lesz, de más ismérvek szerint a választás önkényes, ez torzítja az összetételt. Koncentrált minta: A sokaságból egy fontosnak tekintett mennyiségi ismérv szerint azokat veszik a mintába, amelyek a sokaság nagy részét az ismérv szerint koncentrálják. Önkényes minta: Teljesen önkényes választása az elemeknek. Pl. szakértői megkérdezés. Egyszerűek, olcsóak, de a mintavételi hiba nagysága nem számítható. 2013 ősz Gazdaságstatisztika
A sokaság A vizsgálat tárgyát képező egységek összességét, halmazát statisztikai sokaságnak, populációnak nevezzük (általában nagy számosságú). Például: gazdasági szervezetek, foglalkoztatottak, tőkeállomány, beruházások, termelés, forgalom, értékpapírok, erdőállomány, lakosság, tanulók, lakások, járművek A sokaság legkisebb részeit egységeknek vagy egyedeknek nevezzük. A statisztikai sokaságoknak többféle típusa lehet: Álló: állapotot fejez ki, adatai időpontra értelmezhetőek Mozgó: folyamatot fejez ki, időtartamra értelmezhető Diszkrét: elkülönülő egységekből áll Folytonos: olyan tömegből áll, amelynek egységeit önkényesen határozzuk meg. Véges számosságú Végtelen számosságú 2012 ősz Gazdaságstatisztika
Ismérvek Ismérv: A sokaság egyedeit jellemző tulajdonság (pl. foglalkoztatottaknál a kereset nagysága, részvényeknél a hozam vagy az árfolyam) Olyan vizsgálati szempont, amely alapján a sokaság részekre bontható Közös ismérvek, megkülönböztető ismérvek Ismérvváltozat: valamely adott szempont szerinti lehetséges tulajdonságok, az ismérv lehetséges kimenetei Alternatív ismérv Ismérv fajták Mennyiségi Nem mennyiségi: Időbeli Területi Minőségi 2013 ősz Gazdaságstatisztika
Ismérvek méréselméleti vonatkozásai A mérés során bizonyos hozzárendelési szabályok alapján szimbólumokat, számokat rendelünk dolgokhoz, tulajdonságokhoz. A mérési skálákat, a mérés szintjét a hozzárendelési szabályok határozzák meg. A számok különféle relációk és műveletek szerint alkothatnak formális rendszert. A rendszert alkotó relációk és műveletek: az egyenlőség, a sorrendiség és az additivitás. l. vagy A=B vagy AB 2. ha A=B, akkor B=A 3. ha A=B és B=C, akkor A=C 4. ha AB, akkor B<A 5. ha AB és BC, akkor AC 6. ha A=P és B0, akkor A+BP 7. A+B=B+A 8. ha A=P és B=Q, akkor A+B=P+Q 9. (A+B)+C=A+(B+C) Egyenlőségi axiómák Sorrendiségi axiómák Additivitási axiómák 2013 ősz Gazdaságstatisztika
Nominális (névleges) skála Legegyszerűbb mérési forma, számok kötetlen hozzárendelés dolgokhoz. Két típusát ismerjük: az egyedi objektumok azonosító számozása; osztályok azonosítása (az egyes osztályokon belül lévő objektumok azonos számot kapnak). Az objektumokhoz rendelt szimbólumok, számok csak az objektumok, vagy azok osztályainak azonosítására szolgálnak (egyéb jelentésük nincs!) Csak a megkülönböztethetőséget követeljük meg, így csak az egyenlőségi reláció értelmezhető. l. vagy A=B vagy AB 2. ha A=B, akkor B=A 3. ha A=B és B=C, akkor A=C Példa: útlevélszám, repülőjáratok számozása, mezszámok Számítható statisztikai mutató: osztályok azonosítása esetén a gyakoriság, modális osztály 2013 ősz Gazdaságstatisztika
Sorrendi (ordinális) skála Az egységeket valamilyen közös tulajdonság alapján összehasonlítjuk, így a skála az egységek viszonylagos helyét is meghatározza, azaz rendezi azokat. Az egyenlőségi reláció mellett a sorrendiségre vonatkozó reláció is érvényes. 4. ha AB, akkor B<A 5. ha AB és BC, akkor AC A sorrendi skálán mért egységek nincsenek egymástól egyenlő távolságra! Számtani átlag és szórás nem számítható!!!!! Számítható a kvantilis, medián, rangkorrelációs együttható. Minden olyan transzformáció végezhető, amely a skála eredeti sorrendjét változatlanul hagyja. Példa: termékek minőségi osztályozása, kérdőíves felméréseknél 3, 5, 7 fokozatú skála, tűzveszélyességi osztály 2013 ősz Gazdaságstatisztika
Intervallum skála Rendelkezik a sorrendi skála tulajdonságaival + a skála bármelyik két pontja közötti különbség, távolság is értelmezhető. Nincs rögzített nullpont, a skála nullpontját és mértékegységét szabadon választhatjuk meg. A közös és állandó mértékegység jellemzi és a számokat ennek alapján rendeljük a sorba rendezett dolgokhoz. A skála bármilyen lineáris transzformációja megengedett. A mértani átlag és a relatív szórás kivételével valamennyi statisztikai jellemző és mutató számítható. Például: hőmérséklet, naptári idő, tengerszint feletti magasság 2013 ősz Gazdaságstatisztika
Arányskála Legmagasabb rendű, a legerősebb mérési formát jelenti. Rendelkezik a korábbi skálák tulajdonságaival és teljesülnek az additivitási követelmények is: 6. ha A=P és B0, akkor A+BP 7. A+B=B+A 8. ha A=P és B=Q, akkor A+B=P+Q 9. (A+B)+C=A+(B+C) A skálának valódi nullpontja van, és bármelyik két pontjának aránya független a mértékegységtől. Például: termelés, forgalom, jövedelem, kereset stb. mérése 2013 ősz Gazdaságstatisztika
Ismérvek és mérési skálák Mérési skála Területi Nominális skála Minőségi Sorrendi skála Mennyiségi Intervallum skála Időbeli Arányskála 2013 ősz Gazdaságstatisztika
Köszönöm a figyelmet! Kérdés?