Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Leíró statisztika, részekre bontott sokaság, becslés 2015.11.13 Árva Gábor PhD Hallgató.

Hasonló előadás


Az előadások a következő témára: "Leíró statisztika, részekre bontott sokaság, becslés 2015.11.13 Árva Gábor PhD Hallgató."— Előadás másolata:

1 Leíró statisztika, részekre bontott sokaság, becslés Árva Gábor PhD Hallgató

2 Mai menetrend Elmélet: legfontosabb „címszavak”, (Nem 2 pontos definíció!!!) +kérdések! Számolás: 3 zh példa, tábla+kréta Leíró statisztika: folytonos és diszkrét Részekre bontott sokaság Becsléselmélet

3

4 Leíró statisztika-adatgyűjtés Skála típusok: Nominális: objektumok és osztályok azonosítása, egyenlőségi reláció Sorrendi: egységes viszonylagos helye, kisebb-nagyobb relációk Intervallum: A skála bármely két pontja közötti távolság is értelmezhető. Közös és állandó mértékegység, nincs valódi nullpontja. Arány: Valódi nullpont, additívitási tulajdonság bármely két pont aránya független a mértékegységtől.

5 Leíró statisztika-adatgyűjtés Diszkrét ismérvek: Véges, vagy megszámlálhatóan sok, egymástól jól elkülöníthető érték. Kevés ismérvérték: Az adatok minden egyes értéke önálló osztályt alkot Több ismérvérték: Osztályokba sorolt adatok Folytonos: Egy adott intervallumon bármilyen értéket felvehet. Az adatokat mindig osztályokba soroljuk.

6 Leíró statisztika Adatok ábrázolása-diszkrét ismérv Pálcikadiagram Lépcsős diagram

7 Leíró statisztika Adatok ábrázolása-folytonos ismérv Empirikus sűrűségfüggvény Empirikus eloszlásfüggvény

8 Leíró statisztika középérték mutatók Más számítási módszer diszkrét és folytonos ismérvek esetén: az adatok egyenkénti ismeretéből vagy osztályközös gyakorisági sorból becsülve. Típusai: Helyzeti: Az adatok közötti elhelyezkedésük alapján Medián: „a középső érték” Módusz: a leggyakrabban előforduló ismérvérték Számított: Az adatokkal kapcsolatos számszerű összefüggés: Számtani átlag, négyzetes átlag (szórásszámítás)

9 Leíró statisztika Ingadozás mutatók Csoportosításuk: Az adatok egymás közötti eltérése vagy egy kitüntetett értéktől való eltérés Relatív (mértékegység nélküli) és abszolult ingadozásmutatók Terjedelem Szórás, korrigált tapasztalati szórás: A szórás az egyes X i ismérvértékek átlagtól vett d i eltéréseinek négyzetes átlaga: azt mutatja, hogy az egyes értékek átlagosan mennyire térnek el a számtani átlagtól.

10 1. ZH példa Egy vasútvonalon egy hétig minden vonaton feljegyezték az utasok számát. Az eredményeket az alábbi táblázat tartalmazza Utasok számaVonatok száma (db)

11 1. ZH példa feladatai a) Készítsen gyakorisági táblázatot, ábrázolja a gyakorisági sort és a tapasztalati eloszlásképet! Értelmezze a gyakorisági táblázat 3. osztályához tartozó értékeket! b) Becsülje meg az átlagos utasszámot! c) Becsülje meg a helyzeti középérték mutatókat! d) Becsülje meg az átlagtól való átlagos eltérést!

12 Utasok száma Osztály- közép Vonatok száma (f) Relatív gyak. (g) Komm. Gyak. (f’) Komm. Rel. Gyak. (g’) , ,12180, ,28460, ,30760, ,16920, ,081001,00 Összesen100 1,00

13 Feladat megoldás Leíró statisztikai mutatók osztályközös gyakorisági sorból … értelmezze a gyakorisági táblázat 3. osztályához tartozó értékeket!... f: 28 olyan vonat volt a vizsgált időszakban, amelyen az utasok száma 60 és 90 között volt g: a vizsgált időszakban a megfigyelt vonatok 28 százalékán volt az utasok száma 60 és 90 között f’: a vizsgált időszakban 46 olyan vonat volt, amelyen legfeljebb 90-en utaztak g’: a vizsgált időszakban a megfigyelt vonatok 46 százalékán utaztak legfeljebb 90-en.

14 2. ZH példa Egy adott évben 100 építőipari vállalatnál a bekövetkezett halálos balesetek száma a következőképpen alakult. Balesetek száma Vállalatok száma Balesetek száma Vállalatok száma

15 2. ZH példa feladatai a) Készítsen gyakorisági táblázatot, ábrázolja a relatív és kumulált relatív gyakoriságot b) Mennyi a balesetek átlagos száma? c) Mennyi a balesetek mediánja? d) Mennyi a tipikus baleseti érték? e) Mennyi a balesetek szórása? ÉRTELMEZZE AZ EREDMÉNYT! MEGOLDÁS: Leíró statisztikai mutatók diszkrét adatokból=minden adat ismert

16 Balesetek száma Vállalatok száma Relatív Gyakoriság (g) Kom. Gyak (f’) Kom. Rel. Gyak (g’) 030, ,17200, ,28480, ,16640, ,18820,82 590,09910,91 630,03940, ,05990,99 800,00990,99 910,011001,00

17

18 Belső, külső és teljes eltérés Belső eltérés: Az egyedi ismérvértékek ingadoznak a saját részátlaguk körül Az ingadozás a csoportképző ismérven kívül minden más tényező hatásának tulajdonítható

19 Belső, külső és teljes eltérés Külső eltérés A csoportok (m darab) részátlagai ingadoznak a főátlag körül Az ingadozás a csoportképző ismérvnek tulajdonítható

20 Belső, külső és teljes eltérés Teljes eltérés SST=SSB+SSK Az Y ismérv teljes eltérése, változékonysága SSK nagyságú része a csoportképző ismérvtől függ (külső eltérések) SSB nagyságú része a más, kiemelten nem vizsgált tényezők hatásainak tudható be. Ez a szórásrész csak a belső eltérésektől függ.

21 Vegyes kapcsolat szorossága X csoportképző minőségi ismérv, és Y mennyiségi ismérv közötti kapcsolat szorossága Variancia vagy szórásnégyzethányados: Az Y ismérv szórásnégyzetének X ismérv által magyarázott hányada H szóráshányados: Kapcsolat szorosságának mérése 0-hoz vagy 1-hez való közelség alapján

22 3. ZH példa Egy városban és annak közvetlen környékén 1998-ban eladott lakások négyzetméterárairól a következő adatok állnak rendelkezésre: ÖvezetLakásárak eFt/nm ÁtlagokTapasztalati szórás Belváros180, 280, 260, 200, 260, 320, 220, ,2543,71 Külső kerületek140,200, 160, 180, Városkörnyék160, 150, 180, 130

23 3. ZH példa feladatai a) Határozza meg és értelmezze a részszórásokat! b) Határozza meg a belső szórást! Értelmezze az eredményt! c) Mekkora a külső szórás? Értelmezze az eredményt! d) Mekkora a teljes szórás? Értelmezze az eredményt! e) Jellemezze a lakásár és az övezet közötti kapcsolat szorosságát! MEGOLDÁS: Az övezet (elhelyezkedés) alapján részekre bontott sokaság vizsgálata

24 3 ZH példa értelmezése Részszórások: Az egyes belvárosi lakások árai átlagosan 43,71 eFt/nm- rel térnek el a belvárosi lakások átlagárától Az egyes külső kerületekben található lakások árai átlagosan 20 eFt/nm-rel térnek el az ezen övezetben található lakások átlagárától A városkörnyéki lakások árai átlagosan 18,028 eFt/nm- rel térnek el a városkörnyéki lakások átlagárától.

25 3 ZH példa értelmezése Belső szórás: Az egyes lakások árai átlagosan 33,063 eFt/nm-rel térnek el az övezetek átlagáraitól (a részátlagoktól). Külső szórás: Az egyes övezetek átlagárai (részátlagok) átlagosan 39,27 eFt/nm-rel térnek el az összes lakás átlagárától (a főátlagtól). Teljes szórás: Az egyes lakások árai átlagosan 51,33 eFt- tal térnek el az összes lakás átlagárától (a főátlagtól). Kapcsolat szorossága: H=0,765, közepesen erős kapcs.

26

27 Mintavételi vs. nem mintavételi hiba Nem mintavételi hiba: a statisztikai hibák közül a mintával kapcsolatos teendőkhöz kapcsolódó hiba, pl. hibás adatrögzítés. Mintavételi hiba: a statisztikai hiba azon része, amely részleges vizsgálatok, azaz a mintavétel során abból adódik, hogy nem a teljes sokaságot figyeljük meg. Tulajdonképpen a sokaság teljes megismeréséről való lemondás ára. A mintavételi hiba a mintaszám növelésével csökken.

28 Becslés Fischer-féle kritériumai Torzítatlanság: a becslés a szóban forgó paraméter- érték körül ingadozik. A becslés várható értéke éppen a becsülendő paraméter legyen. Torzítatlanság esetében abban lehetünk biztosak, hogy nincs semmilyen egyirányú, szisztematikus eltérés a becsülendő paramétertől. Konzisztencia (összetartó): a becslés ingadozása a szóban forgó paraméter-érték körül a minta elemszámát növelve csökken.

29 Becslés Fischer-féle kritériumai Hatásos: A becslések ingadozását (is) a szórásával mérjük. A becslés annál hatásosabb, minél kisebb a szórása. Elégséges: Lényegében minden információt tartalmaz a becsülendő paraméterről.

30 Tanult intervallumbecslési módszerek Várható értékre Ha az alapsokasági szórás ismeretes, vagy a mintaelemszám n>30: Standard normális eloszlás táblázat segítségével Ha az alapsokasági szórás nem ismert, és kis minta van: Student-táblázat segítségével Elméleti alapsokasági szórásra Sokasági arányra

31 4. ZH példa Az utasok számát vizsgáló 1) példában: Adjon 90%-os megbízhatóságú becslést a vonaton utazók várható értékére a minta adatai alapján! Értelmezze a kapott intervallumot! Ha az előző becslés pontosságát a harmadára szeretnénk csökkenteni, mekkora mintaelemszámra van szükség? Korábbi feladatból ismert:

32 5. ZH példa A balesetek számát vizsgáló 2) példa alapján: A minta adatai alapján 95%-os megbízhatósággal becsülje meg azon építőipari vállalatok arányát, ahol 6-nál több halálos baleset következik be! Ha az előző becslés pontosságát a harmadára kívánjuk csökkenteni, mekkora elemszámú mintát kellene vizsgálni?

33 5. Példa megoldása Aránybecslés azon vállalatok arányára, ahol 6-nál több halálos baleset következett be A mintában 6 ilyen vállalat van, 5 olyan, ahol 7 baleset történt, és 1, ahol 9, így p=0,06 Képletünk:

34 5 példa megoldása (2) 95 %-os megbízhatósági szinten tehát azon vállalatok aránya, ahol 6-nál több halálos baleset következik be, 0,0135 és 0,1065 között van. Mintanagyság:

35 5. Példa megoldása (3) Képletünk: Tehát 902 elemű mintát kell vennünk, ha a becslés pontosságát a harmadára kívánjuk csökkenteni.

36 6. ZH példa A lakásárakat vizsgáló 3) példa alapján szerkesszen 99%-os megbízhatósággal konfidencia intervallumot: A külső kerületek lakásárának szórására! Értelmezze az eredményt! A korábbi feladatból ismert:

37


Letölteni ppt "Leíró statisztika, részekre bontott sokaság, becslés 2015.11.13 Árva Gábor PhD Hallgató."

Hasonló előadás


Google Hirdetések