Leíró statisztika, részekre bontott sokaság, becslés 2015.11.13 Árva Gábor PhD Hallgató.

Slides:



Advertisements
Hasonló előadás
I. előadás.
Advertisements

II. előadás.
BECSLÉS A sokasági átlag becslése
Gazdaságelemzési és Statisztikai Tanszék
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Mérési pontosság (hőmérő)
Gazdaságelemzési és Statisztikai Tanszék
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Közlekedésstatisztika
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
4. előadás.
III. előadás.
A középérték mérőszámai
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Statisztika II. III. Dr. Szalka Éva, Ph.D..
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
Egytényezős variancia-analízis
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Statisztika.
Készítette: Horváth Zoltán (2012)
Kvantitatív Módszerek
Kvantitatív módszerek
Valószínűségszámítás
Gazdaságstatisztika Bevezetés szeptember 11.
Gazdaságstatisztika 14. előadás.
RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
Következtető statisztika 9.
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Adatleírás.
I. előadás.
A kombinációs táblák (sztochasztikus kapcsolatok) elemzése
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Valószínűségszámítás II.
4. előadás.
A számítógépes elemzés alapjai
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Konzultáció – Leíró statisztika október 22. Gazdaságstatisztika.
I. Zárthelyi dolgozat Elméleti témakörök, típuspéldák Gazdaságstatisztika.
Kvantitatív módszerek Becsléselmélet október 15.
Kvantitatív módszerek 2014 ősz MINTAVÉTEL, LEÍRÓ STATISZTIKA Kvantitatív módszerek szeptember 30.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
Konzultáció – Részekre bontott sokaság vizsgálata, Becslés November 5. Gazdaságstatisztika.
Gazdaságstatisztika Becsléselmélet október 30. és november 5.
2. előadás Gyakorisági sorok
A számítógépes elemzés alapjai
Kvantitatív módszerek
Leíró statisztika gyakorló feladatok október 15.
Részekre bontott sokaság vizsgálata, gyakorló feladatok
MINTAVÉTEL, LEÍRÓ STATISZTIKA
Kvantitatív módszerek
Szóródási mérőszámok, alakmutatók, helyzetmutatók
II. előadás.
Kvantitatív módszerek MBA és Számvitel mesterszak
Becsléselmélet - Konzultáció
Nemparaméteres próbák
I. Előadás bgk. uni-obuda
2. előadás Gyakorisági sorok, Grafikus ábrázolás
Adatfeldolgozási ismeretek műszeres analitikus technikusok számára
5. előadás.
Gazdaságinformatikus MSc
A leíró statisztikák alapelemei
Mérések adatfeldolgozási gyakorlata vegyész technikusok számára
Adatfeldolgozási ismeretek környezetvédelmi-mérés technikusok számára
4. előadás.
Előadás másolata:

Leíró statisztika, részekre bontott sokaság, becslés Árva Gábor PhD Hallgató

Mai menetrend Elmélet: legfontosabb „címszavak”, (Nem 2 pontos definíció!!!) +kérdések! Számolás: 3 zh példa, tábla+kréta Leíró statisztika: folytonos és diszkrét Részekre bontott sokaság Becsléselmélet

Leíró statisztika-adatgyűjtés Skála típusok: Nominális: objektumok és osztályok azonosítása, egyenlőségi reláció Sorrendi: egységes viszonylagos helye, kisebb-nagyobb relációk Intervallum: A skála bármely két pontja közötti távolság is értelmezhető. Közös és állandó mértékegység, nincs valódi nullpontja. Arány: Valódi nullpont, additívitási tulajdonság bármely két pont aránya független a mértékegységtől.

Leíró statisztika-adatgyűjtés Diszkrét ismérvek: Véges, vagy megszámlálhatóan sok, egymástól jól elkülöníthető érték. Kevés ismérvérték: Az adatok minden egyes értéke önálló osztályt alkot Több ismérvérték: Osztályokba sorolt adatok Folytonos: Egy adott intervallumon bármilyen értéket felvehet. Az adatokat mindig osztályokba soroljuk.

Leíró statisztika Adatok ábrázolása-diszkrét ismérv Pálcikadiagram Lépcsős diagram

Leíró statisztika Adatok ábrázolása-folytonos ismérv Empirikus sűrűségfüggvény Empirikus eloszlásfüggvény

Leíró statisztika középérték mutatók Más számítási módszer diszkrét és folytonos ismérvek esetén: az adatok egyenkénti ismeretéből vagy osztályközös gyakorisági sorból becsülve. Típusai: Helyzeti: Az adatok közötti elhelyezkedésük alapján Medián: „a középső érték” Módusz: a leggyakrabban előforduló ismérvérték Számított: Az adatokkal kapcsolatos számszerű összefüggés: Számtani átlag, négyzetes átlag (szórásszámítás)

Leíró statisztika Ingadozás mutatók Csoportosításuk: Az adatok egymás közötti eltérése vagy egy kitüntetett értéktől való eltérés Relatív (mértékegység nélküli) és abszolult ingadozásmutatók Terjedelem Szórás, korrigált tapasztalati szórás: A szórás az egyes X i ismérvértékek átlagtól vett d i eltéréseinek négyzetes átlaga: azt mutatja, hogy az egyes értékek átlagosan mennyire térnek el a számtani átlagtól.

1. ZH példa Egy vasútvonalon egy hétig minden vonaton feljegyezték az utasok számát. Az eredményeket az alábbi táblázat tartalmazza Utasok számaVonatok száma (db)

1. ZH példa feladatai a) Készítsen gyakorisági táblázatot, ábrázolja a gyakorisági sort és a tapasztalati eloszlásképet! Értelmezze a gyakorisági táblázat 3. osztályához tartozó értékeket! b) Becsülje meg az átlagos utasszámot! c) Becsülje meg a helyzeti középérték mutatókat! d) Becsülje meg az átlagtól való átlagos eltérést!

Utasok száma Osztály- közép Vonatok száma (f) Relatív gyak. (g) Komm. Gyak. (f’) Komm. Rel. Gyak. (g’) , ,12180, ,28460, ,30760, ,16920, ,081001,00 Összesen100 1,00

Feladat megoldás Leíró statisztikai mutatók osztályközös gyakorisági sorból … értelmezze a gyakorisági táblázat 3. osztályához tartozó értékeket!... f: 28 olyan vonat volt a vizsgált időszakban, amelyen az utasok száma 60 és 90 között volt g: a vizsgált időszakban a megfigyelt vonatok 28 százalékán volt az utasok száma 60 és 90 között f’: a vizsgált időszakban 46 olyan vonat volt, amelyen legfeljebb 90-en utaztak g’: a vizsgált időszakban a megfigyelt vonatok 46 százalékán utaztak legfeljebb 90-en.

2. ZH példa Egy adott évben 100 építőipari vállalatnál a bekövetkezett halálos balesetek száma a következőképpen alakult. Balesetek száma Vállalatok száma Balesetek száma Vállalatok száma

2. ZH példa feladatai a) Készítsen gyakorisági táblázatot, ábrázolja a relatív és kumulált relatív gyakoriságot b) Mennyi a balesetek átlagos száma? c) Mennyi a balesetek mediánja? d) Mennyi a tipikus baleseti érték? e) Mennyi a balesetek szórása? ÉRTELMEZZE AZ EREDMÉNYT! MEGOLDÁS: Leíró statisztikai mutatók diszkrét adatokból=minden adat ismert

Balesetek száma Vállalatok száma Relatív Gyakoriság (g) Kom. Gyak (f’) Kom. Rel. Gyak (g’) 030, ,17200, ,28480, ,16640, ,18820,82 590,09910,91 630,03940, ,05990,99 800,00990,99 910,011001,00

Belső, külső és teljes eltérés Belső eltérés: Az egyedi ismérvértékek ingadoznak a saját részátlaguk körül Az ingadozás a csoportképző ismérven kívül minden más tényező hatásának tulajdonítható

Belső, külső és teljes eltérés Külső eltérés A csoportok (m darab) részátlagai ingadoznak a főátlag körül Az ingadozás a csoportképző ismérvnek tulajdonítható

Belső, külső és teljes eltérés Teljes eltérés SST=SSB+SSK Az Y ismérv teljes eltérése, változékonysága SSK nagyságú része a csoportképző ismérvtől függ (külső eltérések) SSB nagyságú része a más, kiemelten nem vizsgált tényezők hatásainak tudható be. Ez a szórásrész csak a belső eltérésektől függ.

Vegyes kapcsolat szorossága X csoportképző minőségi ismérv, és Y mennyiségi ismérv közötti kapcsolat szorossága Variancia vagy szórásnégyzethányados: Az Y ismérv szórásnégyzetének X ismérv által magyarázott hányada H szóráshányados: Kapcsolat szorosságának mérése 0-hoz vagy 1-hez való közelség alapján

3. ZH példa Egy városban és annak közvetlen környékén 1998-ban eladott lakások négyzetméterárairól a következő adatok állnak rendelkezésre: ÖvezetLakásárak eFt/nm ÁtlagokTapasztalati szórás Belváros180, 280, 260, 200, 260, 320, 220, ,2543,71 Külső kerületek140,200, 160, 180, Városkörnyék160, 150, 180, 130

3. ZH példa feladatai a) Határozza meg és értelmezze a részszórásokat! b) Határozza meg a belső szórást! Értelmezze az eredményt! c) Mekkora a külső szórás? Értelmezze az eredményt! d) Mekkora a teljes szórás? Értelmezze az eredményt! e) Jellemezze a lakásár és az övezet közötti kapcsolat szorosságát! MEGOLDÁS: Az övezet (elhelyezkedés) alapján részekre bontott sokaság vizsgálata

3 ZH példa értelmezése Részszórások: Az egyes belvárosi lakások árai átlagosan 43,71 eFt/nm- rel térnek el a belvárosi lakások átlagárától Az egyes külső kerületekben található lakások árai átlagosan 20 eFt/nm-rel térnek el az ezen övezetben található lakások átlagárától A városkörnyéki lakások árai átlagosan 18,028 eFt/nm- rel térnek el a városkörnyéki lakások átlagárától.

3 ZH példa értelmezése Belső szórás: Az egyes lakások árai átlagosan 33,063 eFt/nm-rel térnek el az övezetek átlagáraitól (a részátlagoktól). Külső szórás: Az egyes övezetek átlagárai (részátlagok) átlagosan 39,27 eFt/nm-rel térnek el az összes lakás átlagárától (a főátlagtól). Teljes szórás: Az egyes lakások árai átlagosan 51,33 eFt- tal térnek el az összes lakás átlagárától (a főátlagtól). Kapcsolat szorossága: H=0,765, közepesen erős kapcs.

Mintavételi vs. nem mintavételi hiba Nem mintavételi hiba: a statisztikai hibák közül a mintával kapcsolatos teendőkhöz kapcsolódó hiba, pl. hibás adatrögzítés. Mintavételi hiba: a statisztikai hiba azon része, amely részleges vizsgálatok, azaz a mintavétel során abból adódik, hogy nem a teljes sokaságot figyeljük meg. Tulajdonképpen a sokaság teljes megismeréséről való lemondás ára. A mintavételi hiba a mintaszám növelésével csökken.

Becslés Fischer-féle kritériumai Torzítatlanság: a becslés a szóban forgó paraméter- érték körül ingadozik. A becslés várható értéke éppen a becsülendő paraméter legyen. Torzítatlanság esetében abban lehetünk biztosak, hogy nincs semmilyen egyirányú, szisztematikus eltérés a becsülendő paramétertől. Konzisztencia (összetartó): a becslés ingadozása a szóban forgó paraméter-érték körül a minta elemszámát növelve csökken.

Becslés Fischer-féle kritériumai Hatásos: A becslések ingadozását (is) a szórásával mérjük. A becslés annál hatásosabb, minél kisebb a szórása. Elégséges: Lényegében minden információt tartalmaz a becsülendő paraméterről.

Tanult intervallumbecslési módszerek Várható értékre Ha az alapsokasági szórás ismeretes, vagy a mintaelemszám n>30: Standard normális eloszlás táblázat segítségével Ha az alapsokasági szórás nem ismert, és kis minta van: Student-táblázat segítségével Elméleti alapsokasági szórásra Sokasági arányra

4. ZH példa Az utasok számát vizsgáló 1) példában: Adjon 90%-os megbízhatóságú becslést a vonaton utazók várható értékére a minta adatai alapján! Értelmezze a kapott intervallumot! Ha az előző becslés pontosságát a harmadára szeretnénk csökkenteni, mekkora mintaelemszámra van szükség? Korábbi feladatból ismert:

5. ZH példa A balesetek számát vizsgáló 2) példa alapján: A minta adatai alapján 95%-os megbízhatósággal becsülje meg azon építőipari vállalatok arányát, ahol 6-nál több halálos baleset következik be! Ha az előző becslés pontosságát a harmadára kívánjuk csökkenteni, mekkora elemszámú mintát kellene vizsgálni?

5. Példa megoldása Aránybecslés azon vállalatok arányára, ahol 6-nál több halálos baleset következett be A mintában 6 ilyen vállalat van, 5 olyan, ahol 7 baleset történt, és 1, ahol 9, így p=0,06 Képletünk:

5 példa megoldása (2) 95 %-os megbízhatósági szinten tehát azon vállalatok aránya, ahol 6-nál több halálos baleset következik be, 0,0135 és 0,1065 között van. Mintanagyság:

5. Példa megoldása (3) Képletünk: Tehát 902 elemű mintát kell vennünk, ha a becslés pontosságát a harmadára kívánjuk csökkenteni.

6. ZH példa A lakásárakat vizsgáló 3) példa alapján szerkesszen 99%-os megbízhatósággal konfidencia intervallumot: A külső kerületek lakásárának szórására! Értelmezze az eredményt! A korábbi feladatból ismert: