Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaGyörgy Bognár Megváltozta több, mint 8 éve
1
Kvantitatív módszerek Becsléselmélet 2013. október 15.
2
Kvantitatív módszerek Hol járunk?
3
Kvantitatív módszerek Statisztika tárgya Sokaság Minta Mintavétel Következtetés F(x), M( ), D( ) …. F n (x), x, s, s* A vizsgálat tárgyát képező egységek összességét, halmazát statisztikai sokaságnak nevezzük. Statisztikai minta valamely változóra vonatkozó véges számú független megfigyelés eredménye.
4
Mintavétel Adott sokaság esetén egy meghatározott elemszámú mintát sokféleképpen lehet kiválasztani minden minta más és más összetételű lehet A mintajellemzők változók! Az egyes mintákból számított mutatók értéke mintáról mintára változik. A mintákból számított mutatók a sokasági mutató körül szóródnak. Ez a szóródás nagyobb minták esetében kisebb, vagyis jobban közelítik a sokasági értéket. Kvantitatív módszerek
5
Mintavétel – A becslés elmélete Minta-2 Minta-1 Minta-3 mintáról mintára változik maga is valósz. változó adott elméleti eloszlással, szórással stb. jellemezhető
6
Kvantitatív módszerek Következtetés hibái Mintából következtetünk !!! Elsőfajú hiba ( ) Másodfajú hiba ( ) Minta-2 Minta-1 Minta-3 Hibát követhetünk el !!! Sokaság A minta minősítése a sokaságról „jó” „rossz” „jó” „rossz” Nincs hiba e Elsőfajú hiba Másodfajú hiba
7
Alapfogalmak Statisztika: a mintaelemek egy tetszőleges, de ismeretlen paramétert nem tartalmazó függvénye Becslőfüggvény: olyan statisztika, ami valamely sokasági jellemző mintából történő meghatározására szolgál. A becsülni kívánt sokasági jellemző: Becslőfüggvénye egy mintából: Egy sokasági jellemzőre ált. több becslőfüggvény is készíthető. Kvantitatív módszerek
8
Becslés elmélete Minta-2 Minta-1 Minta-3 M( ) = ?, Me Pontbecslés Minta statisztika Mintavételi eloszlás f(x)
9
Becslési kritériumok - torzítatlanság Torzítatlan a becslőfüggvény, ha annak várható értéke megegyezik a becsülni kívánt sokasági jellemzővel: Két torzított becslőfüggvény közül azt tekintjük jobbnak, amelyiknél kisebb a torzítás abszolút értéke. Nincs szisztematikus, egyirányú eltérés a becslés és a becsült paraméter között. Kvantitatív módszerek f(x) torzítatlan torzított
10
Kvantitatív módszerek Példa - Torzítatlan becslés F(x), f(x), M( ), D( ) …., S 1 *, S 2 *, S 3 *, S 1, S 2, S 3
11
Becslési kritériumok - konzisztencia Konzisztens a becslőfüggvény, ha ingadozása a becsült paraméter körül a minta elemszámának növelésével egyre csökken. A becslőfüggvény értékei nagy minta esetén jól közelítsék a megfelelő sokasági jellemzőt. Kvantitatív módszerek f(x)
12
Becslési kritériumok - Hatásosság Két becslés közül a kevésbé ingadozót tekintjük hatásosabbnak. Kvantitatív módszerek f(x)
13
Kvantitatív módszerek Hatásos becslés (Normális el.) F(x), f(x), M( )= , D( )= Me 1 Me 2 Me 3 torzítatlan konzisztens elégséges Me
14
Becslési kritériumok - elégségesség A becslés elégséges, ha minden információt tartalmaz a paraméterre vonatkozóan. Nincs más olyan becslés, amely a paraméterről több információt szolgáltatna, mint az elégséges becslés. Kvantitatív módszerek
15
Pontbecslés Analógia elve: a mintából a becsülni kívánt jellemzővel megegyező tartalmú mutatót számítunk Mi történik, ha az analógia nem működik? Becslőfüggvények alkalmazása: a becslőfüggvénybe helyettesítjük a minta konkrét értékeit pontbecslés Pontbecslés módszerei: Maximum-likelihood módszer Legkisebb négyzetek módszere Momentumok módszere Grafikus paraméterbecslés Kvantitatív módszerek
16
Legkisebb négyzetek módszere Nem feltételezi a sokaság eloszlásának ismeretét, de azt igen, hogy van egy törvényszerűség, amely feltételezésünk szerint megfigyelési adatainkat előállította modell A LN módszere úgy határozza meg e modell paramétereit, hogy a tényleges és becsült paraméterrel illesztett modellek eltéréseinek négyzetösszege minimális legyen. A LN módszer a tényleges megfigyelések és a minta alapján becsült modell négyzetes távolságát minimálja. Eszköze a szélsőérték-számítás. Nem szolgáltat eleve bizonyítottan jó becsléseket. Alkalmazási lehetőségei nagyok, mivel az eloszlás típusától függetlenül alkalmazható. Regressziós modellek, trendek paramétereinek becslésére használják. Kvantitatív módszerek
17
Példa Egy közúti ellenőrzés során a közlekedésrendészet úgy találta, hogy 20 véletlenszerűen kiválasztott gépkocsi közül 6 volt műszaki hibás (hibás 1-es, hibátlan 0-s): 1 0 0 1 0 1 0 1 0 0 0 0 0 0 1 0 0 1 0 0 Feltételezve, hogy ez egy FAE minta, becsüljük a hibás járművek arányát az egész gépkocsiállományon belül! Modellünk most az, hogy az egyes mintaelemek várható értéke P: Keressük azt a -t, amelyhez a mintaelemek a legközelebb esnek. Kvantitatív módszerek
18
Momentumok módszere Momentum: a különféle átlagok és a szórásnégyzet általánosításának tekinthető, mert az Y i ismérvértékek vagy a d i eltérések helyett a alakú eltérések hatványait átlagolják, ahol „A” tetszőleges állandó. Jelölése: Eloszlások paramétereinek becslésére szolgál. Kiindulópontja: ismert típusú sokasági eloszlás paraméterei és momentumai kapcsolatba hozhatók egymással. A tapasztalati momentumokat a mintából kiszámítjuk, egyenlővé tesszük a paraméterekkel kifejezett sokasági momentumokkal, és következtetünk a sokasági paraméterekre. Másképpen: olyan sokasági momentumokat keres, amely mellett a sokaság és a minta megfelelő momentumai megegyeznek. Konzisztens becslőfüggvényeket eredményez. Kvantitatív módszerek
19
Maximum likelihood módszer (ML) Ismert sokasági eloszlást tételez fel, és e sokasági eloszlás ismeretlen paraméterét becsüli. Jó tulajdonságú becslőfüggvényeket eredményez. Az LF mutatja meg, hogy adott (ismert) eloszlás és különböző paraméterértékek esetében mennyire valószínű, hogy éppen a szóban forgó minta adódik a mintavétel eredményeképpen. Ez a valószerűség az ismeretlen paraméter(ek) függvénye: likelihood függvény (LF). LF ismeretében a feladat, olyan ismeretlen paraméter(eke)t keresni, amely(ek) mellett ez a függvény a maximumát veszi fel. Eloszlásfüggő, konzisztens és hatásos, nem mindig létezik az LF- nek maximuma. Kvantitatív módszerek
20
Példa Egy közúti ellenőrzés során a közlekedésrendészet úgy találta, hogy 20 véletlenszerűen kiválasztott gépkocsi közül 6 volt műszaki hibás (hibás 1-es, hibátlan 0-s): 1 0 0 1 0 1 0 1 0 0 0 0 0 0 1 0 0 1 0 0 Binomális eloszlású! Két paramétere van: n (rögzített) és P (becsülni kívánt) Mi a valószínűsége annak, hogy az első mintaelem 1 lesz! Tegyük fel, hogy ismerjük a becsülni kívánt P értéket, legyen: A keresett feltételes valószínűség: hiszen y 1 egy paraméterű binomiális eloszlásból származó változó, így annak a valószínűsége, hogy 1-et vesz fel, éppen Annak valószínűsége, hogy a második elem 0: Kvantitatív módszerek
21
Példa Annak a valószínűsége, hogy egy paraméterű binomiális eloszlásból éppen ez a minta adódjék: A likelihood függvény: Mikor lesz maximális? Adjunk a -nek (sokasági paraméternek) néhány feltételezett értéket! Kvantitatív módszerek 0,00,0000 0,10,0089 0,20,1091 0,30,1916 0,40,1244 0,50,0370
22
Grafikus paraméterbecslés Kvantitatív módszerek -ln[R(t)] t Alapelve: az eloszlásfüggvény „kiegyenesítése”
23
Kvantitatív módszerek Intervallumbecslés Minta-2 Minta-1 Minta-3 mintáról mintára változik maga is valósz. változó adott elméleti eloszlással, szórással stb. jellemezhető Emlékeztető
24
Intervallumbecslés Pontbecslés: az ismeretlen sokasági jellemző értékére egy mintából egyetlen pontot határoztunk meg, amely eleget tett valamilyen követelménynek. Intervallumbecslés: a minta alapján olyan intervallumot határozunk meg, amely előre megadott (nagy) valószínűséggel tartalmazza a becsülni kívánt jellemzőt. Kvantitatív módszerek Ismerjük pontbecslésünk valószínűségi tulajdonságait, és ezek segítségével egy adott megbízhatóságú intervallumot adunk meg a sokasági paraméterre.
25
Kvantitatív módszerek Intervallum becslés – várható érték Normális el. M( )= , D( )= 0 ismert n elemű FAE mintából számított számtani átlaggal becsüljük Normális eloszlás (Mintavételi eloszlás)
26
Kvantitatív módszerek Várható érték ( ) becslése 2 -ás szabály f(x) 95,44% -2 0 / n +2 0 / n
27
Kvantitatív módszerek Várható érték ( ) becslése
28
Ha a sokaság elméleti szórása (σ 0 ) ismert, akkor az átlag mintavételi eloszlása alapján tetszőlegesen kicsiny α>0 számhoz meghatározható olyan z α/2 mennyiség, hogy Minél nagyobb az 1-α=ε megbízhatósági szint, annál szélesebb intervallumot kapunk. Az intervallum hossza függ a mintanagyságtól és a sokasági szórástól. Kvantitatív módszerek
29
Intervallum szélessége Sokasági szórás Mintaszám Megbízhatósági szint
30
Várható érték becslése - szigma nem ismert Feltétel: a sokaság normális eloszlású, de nem ismerjük sem a várható értéket (μ-t), sem a sokasági szórást (σ 0 -t). Cél: becslést készíteni a várható értékre. Az átlag továbbra is normális eloszlású Az ismeretlen alapsokasági szórás (σ) becslésére a korrigált tapasztalati szórást használjuk fel (torzítatlan becslés.) helyett Student eloszlású valószínűségi változó ν=n-1 szabadsági fokkal. Kvantitatív módszerek
31
Várható érték becslése - szigma nem ismert t-eloszlás: Szimmetrikus DF paramétere a szabadságfok (DF) DF = n-1 nagy minták esetén közelít a standard normális eloszláshoz t-eloszlás: Szimmetrikus DF paramétere a szabadságfok (DF) DF = n-1 nagy minták esetén közelít a standard normális eloszláshoz
32
Kvantitatív módszerek Példa n = 10 s* = 5,9 év = 95% = 5% kétoldali becslés /2 = 2,5% t /2 = 2,26 DF = n-1=9 Adjunk becslést az MBA-re járó női középvezetők életkorára!
33
Példa Kvantitatív módszerek Adjunk becslést a kávé tömegének várható értékére! (Omniás példa). 1. nap n = 50 = 95% = 5% /2 = 2,5% DF = n-1=49 t /2 = 2,009
34
Példa Kvantitatív módszerek Adjunk becslést a kávé tömegének várható értékére! (Omniás példa). 2. nap n = 50 = 95% = 5% /2 = 2,5% DF = n-1=49 t /2 = 2,009
35
Sokasági arány becslése A sokaságon belül egyetlen (mennyiségi vagy minőségi) ismérv szerint 2 csoportba soroljuk a sokasági elemeket. A sokasági arány: P Torzítatlan becslőfüggvénye: Kvantitatív módszerek p = k/n Binomiális eloszlás M(p) = PD 2 (p) = P(1-P)/n Közelítjük normális eloszlással
36
Kvantitatív módszerek Példa n = 50 p = 8/50= 0,16 = 95% = 5% kétoldali becslés /2 = 2,5% z /2 = 1,96 Adjunk becslést a 102g feletti töltések arányára! (Omniás példa) – 1. nap
37
Kvantitatív módszerek Példa n = 100 p = 10/100= = 0,1 = 95% = 5% kétoldali becslés /2 = 2,5% z /2 = 1,96 Adjunk becslést az MBA-re járó női középvezetők arányára!
38
Sokasági variancia becslése σ 2 torzítatlan becslése: korrigált tapasztalati szórás Ekkor: változó n-1 szabadsági fokú chínégyzet-eloszlást követ. A chínégyzet-eloszlás: független standard normális eloszlású változók négyzetei összegének eloszlása. Egy paramétere van: ν, amely az összegezendő egymástól független valószínűségi változók számát jelenti. Csak pozitív értékeken értelmezzük, balra aszimmetrikus, a szabadságfok növelésével közelít a normális eloszláshoz. Következmény: a konfidencia intervallum nem lesz szimmetrikus a pontbecslésre! Kvantitatív módszerek
39
Sokasági variancia becslése Kvantitatív módszerek Normális el. Normális el. M( )= , D 2 ( )= 2 mintából becsüljük, s 2 s* 2 s 2 vagy s* 2 mintából becsüljük, s 2 s* 2 s 2 vagy s* 2 2 -eloszlású (Mintavételi eloszlás) !! - csak pozitív értékekre értelmezett - nem szimmetrikus !! - csak pozitív értékekre értelmezett - nem szimmetrikus !!
40
Példa Kvantitatív módszerek kétoldali becslés Adjunk becslést a töltési tömeg szórására! (Omniás példa) – 1. nap n = 50 = 95% s* = 0,7183g DF = 50-1=49 = 5% /2 = 2,5% 1- /2 = 97,5% 2 /2 = 71,42 2 1- /2 = 32,357
41
Példa Kvantitatív módszerek kétoldali becslés Adjunk becslést a töltési tömeg szórására! (Omniás példa) – 2. nap n = 50 = 95% s* = 0,841g DF = 50-1=49 = 5% /2 = 2,5% 1- /2 = 97,5% 2 /2 = 71,42 2 1- /2 = 32,357
42
Kvantitatív módszerek Példa n = 10 s* = 5,9 év = 95% = 5% kétoldali becslés /2 = 2,5% 2 /2 = 19,0 1- /2 = 97,5% DF = n-1=9 2 1- /2 = 2,7 Adjunk becslést a női középvezetők életkorának szórására!
43
Két várható érték különbségének becslése Két sokasági jellemzőt hasonlítunk össze úgy, hogy két minta áll rendelkezésünkre, és e két mintából következtetünk a két sokasági várható érték különbségére. Feltétel: a két sokaság független. független minták Mintanagyságok: n 1 és n 2 A két várható érték: μ 1 és μ 2 Feladat: a két várható érték különbségének becslése. Két eset: Ismertek a sokasági varianciák (σ 1 2 és σ 2 2 ) A sokasági varianciákat a mintákból kell becsülni. Kvantitatív módszerek
44
Két várható érték különbsége Kvantitatív módszerek Feltételezzük, hogy az alapsokaságok normális eloszlásúak, így a várható értékek különbsége is normális eloszlású. Ismertek a sokasági varianciák (σ 1 2 és σ 2 2 ) torzítatlan becslést ad
45
Kvantitatív módszerek Két várható érték különbsége Nem ismertek a sokasági varianciák Feltételezzük, hogy az alapsokaságok normális eloszlásúak, és a két szórásnégyzet megegyezik. Így kombinált becslést készítünk a közös szórásnégyzetre: Az ismeretlen sokasági szórásnégyzet torzítatlan becslőfüggvénye
46
Példa Kvantitatív módszerek Adjunk 95%-os becslést a töltési tömegek várható értéke közötti különbségre! (Omniás példa) – 1. és 2. nap n = 50 s* = 0,7183 g 1. nap 2. nap n = 50 s* = 0,841g
47
Kvantitatív módszerek Példa n = 10 s* = 5,9 év nők férfiak n = 22 s* = 6,7 év Adjunk 95%-os becslést az MBA-re járó női és férfi középvezetők átlagéletkorának különbségére!
48
Két sokasági arány különbsége Kvantitatív módszerek A minta akkor elég nagy, ha a intervallumok nem tartalmazzák sem a 0-t sem az 1-et Két sokaságban egy adott tulajdonsággal rendelkező egyedek arányát kívánjuk összehasonlítani. Elég nagy minták esetén a mintabeli arányok különbsége (p 1 -p 2 ) normális eloszlású
49
Példa Kvantitatív módszerek Adjunk 95%-os becslést a 101 g feletti töltési tömegek arányának különbségre! (Omniás példa) – 1. és 2. nap 1. nap n 1 = 50 k 1 = 35 p 1 = 35/50=0,7 n 2 = 50 2. nap k 2 = 6 p 2 = 6/50=0,12
50
Kvantitatív módszerek Példa n 2 = 41 nők férfiak n 1 = 59 k 1 = 22 p 1 = 22/59=0,373 k 2 = 10 p 2 = 10/41=0,244 Adjunk 95%-os becslést az MBA-re járó női és férfi középvezetők arányának a különbségére!
51
Mintaszám meghatározása Eddig feltételeztük, hogy rendelkezésünkre áll egy adott elemszámú minta a minta alapján kiszámoltuk az elméleti paramétert adott valószínűséggel tartalmazó intervallum határait. Az intervallum függ: minta elemszáma, megbízhatósági szint, sokasági szórás Fordítva is eljárhatunk: mekkora mintára van szükség, hogy egy adott pontosságot (Δ-t) elérjünk. Adott Δ mellett megadható az az n érték, melynél teljesül a megadott érték: Kvantitatív módszerek Δ
52
Mintaszám meghatározása Sokasági arány becslésénél: Két várható érték különbsége: Két sokasági arány különbsége:
53
Kvantitatív módszerek Példa Mekkora mintát kell vennünk, hogy az MBA hallgatók között 10% eltéréssel tudjuk kimutatni a középvezető nők és férfiak arányának különbségét? n 2 = 41 nők férfiak n 1 = 59 k 1 = 22 p 1 = 22/59=0,373 k 2 = 10 p 2 = 10/41=0,244 Mintanagyság:
54
Gyakorló példa Egy fogyasztási cikket árusító bolt valamely cikkre vonatkozó naponkénti értékesítési forgalmát 15 véletlenszerűen kiválasztott napon a következő számok mutatják darabban: 125, 142, 153, 130, 140, 170, 152, 125, 137, 152, 166, 172, 145, 131, 147 Tegyük fel, hogy ez a minta egy normális eloszlásból vett FAE mintának tekinthető, sőt korábbi tapasztalatok alapján azt is tudjuk, hogy a változó szórása 15,3. Adjunk 95%-os megbízhatósággal intervallumbecslést az ismeretlen sokasági várható értékre! Kvantitatív módszerek
55
Gyakorló példa A félliteres zacskós tejet automata csomagolja, és becsülni kívánjuk az automatán beállított átlagos töltési mennyiséget. Mintánk (FAE) mérési eredményei milliliterben: 495, 501, 503, 480, 485, 499, 510, 502, 492, 503 Feltételezzük a töltőmennyiség normális eloszlását, továbbá azt, hogy a töltőgép teljesítményének szórása korábbi tapasztalatok alapján 9 milliliter. Készítsünk 90%-os megbízhatósággal intervallumbecslést a beállított átlagos töltési mennyiségre! Kvantitatív módszerek
56
Gyakorló példa Oldjuk meg az előző példát úgy, hogy nem ismerjük a sokasági szórást! Készítsünk intervallumbecslést ugyancsak a várható értékre 90%-os megbízhatósággal! Kvantitatív módszerek
57
Gyakorló példa Egy laboratóriumban valamely hatéves korban beadandó védőoltás dózisának összeállításához 100 FAE módon kiválasztott gyermek testsúlyát mérte meg. A testsúly normális eloszlású valószínűségi változónak tekinthető. A mintából számított áltag: 20 kg, szórás: 1,78kg. Becsülje meg 95%-os megbízhatósági szinten: a 6 éves gyermekek átlagos testsúlyát a 21kg-nál súlyosabb gyermekek arányát Mekkora mintára van szükség, ha az átlagbecslés hibáját a felére akarjuk csökkenteni? Mekkora mintára van szükség, ha az átlagbecslés pontosságát 99%-os megbízhatósági szinten kívánjuk biztosítani? Kvantitatív módszerek Testsúly (kg)Gyermekek száma (fő) 15,1-174 17,1-1920 19,1-2155 21,1-2314 23,1-257 összesen100
58
Gyakorló példa A népszavazási kezdeményezéseket 100000 aláírás alapján tekintik érvényesnek. Az aláírások hitelességét mintavételes technikával ellenőrzik. Egy alkalommal egy kérdésben 140 000 aláírást gyűjtöttek össze. Egy 3000 elemű FAE minta alapján a hiteles aránya 70%- Az számít hitelesnek, aki csak egyszer szerepel a mintában és létezik, illetve az adott névhez tartozik a megadott személyi azonosító és lakcím. Tekinthető-e érvényesnek 99%-os megbízhatósággal a kezdeményezés? Hány hiteles aláírásnak kell lennie a mintában, hogy 99%-os megbízhatósággal egyértelműen hitelesnek nyilvánítható legyen a kezdeményezés? Kvantitatív módszerek
59
Gyakorló példa Egy 400 g-ra beállított mosópor-csomagoló automatának kívánjuk a pontosságát ellenőrizni. Előző adatfelvételek alapján feltételezhető, hogy a gép által töltött súly normális eloszlású valószínűségi változó, 10g szórással. Mekkora minta szükséges az átlagos töltőmennyiségi becsléséhez ±5g pontossági követelmény és 95%-os, illetve 98%-os megbízhatóság mellett? ±10g pontosság és 95%-os megbízhatóság mellett? Kvantitatív módszerek
60
Gyakorló példa A légi közlekedésben mintavételes technikával ellenőrzik az utasok átlagos testsúlyát (feltételezzük annak normális eloszlását). Egy 100 elemű minta eredménye: Átlag=78,6 kg Szórás=12,187 kg Becsülje meg 95%-os megbízhatósággal az utasok testsúlyának átlagát és szórását! Becsülje meg 95%-os megbízhatósággal a 80 kg feletti utasok arányát! Mekkora mintára lenne szükség az átlag- és aránybecslésnél, hogy a hibát a felére csökkentsük? Kvantitatív módszerek Testsúly (kg)Utasok száma (fő) -607 61-7016 71-8032 81-9028 91-10013 101-4
61
Gyakorló példa Különböző gyártmányú tehergépkocsikat működtetők közül függetlenül, véletlen mintát vettek az átlagéletkor különbségének a becsléséhez: Adjunk becslést 99%-os megbízhatósággal az átlagéletkor különbségére! Mekkora mintára lenne szükség, ha a becslés hibáját a harmadára kívánjuk csökkenteni? Kvantitatív módszerek GyártmányElemszámÁtlag életkor Életkor szórása A70124,5 B708,74,2
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.