A matematikai statisztika alapfogalmai

Slides:



Advertisements
Hasonló előadás
A fogyasztóvédelmi hatóság hatásköre, illetékessége és eljárása a villamosenergia-, földgáz-, víziközmű-, távhő- és hulladékgazdálkodási közszolgáltatás.
Advertisements

Gazdaságstatisztika, 2015 RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA Gazdaságstatisztika október 20.
Becsléselmélet - gyakorlat október 14.. Példa 1 - Feladatgyűjtemény Egy nagyvállalat személyzeti osztályvezetője azt gyanítja, hogy különbség van.
Oktatói elvárások, oktatói vélemények a hallgatókról Cserné dr. Adermann Gizella egyetemi docens DUE.
Kvantitatív módszerek Becsléselmélet október 7. és 9.
Paraméteres próbák- konzultáció október 21..
Kockázat és megbízhatóság
tananyag =előadások és gyakorlatok anyaga (írott és elmondott is)
Valószínűségi kísérletek
Bevezetés Biometria I. Molnár Péter Állattani Tanszék
Muraközy Balázs: Mely vállalatok válnak gazellává?
Leíró statisztika Becslés
Becslés gyakorlat november 3.
Mintavétel és becslés október 25. és 27.
Komplex természettudomány 9.évfolyam
IBM SPSS Statistics Regressziós elemzések
A közigazgatással foglalkozó tudományok
A szórás típusú egyenlőtlenségi mutatók
Egy üzemben sok gyártósoron gyártanak egy bizonyos elektronikai alkatrészt. Az alkatrészek ellenállását időnként ellenőrzik úgy, hogy egy munkás odamegy.
Szigorlati felkészítő Kvantitatív módszerek
Mintavétel és becslés október 27. és 29.
Becsléselmélet - Konzultáció
Alapfogalmak Adatelemzés.
Mintavételes eljárások
SZAKISKOLAI FEJLESZTÉSI PROGRAM
Kockázat és megbízhatóság
Kvantitatív módszerek
Eloszlásjellemzők I.: Középértékek
A mozgási elektromágneses indukció
Hipotézisvizsgálat.
Kvantitatív módszerek
Mintavételes eljárások
Nemparaméteres próbák 2.
V. Optimális portfóliók
Gazdaságstatisztika Korreláció- és regressziószámítás II.
Geostatisztika prof. Geresdi István szoba szám: E537.
Tartalékolás 1.
A Nemzeti Szakképzési és Felnőttképzési Intézet Konferenciája
FÜGGVÉNYEK Legyen adott A és B két nem üres (szám)halmaz. Az A halmaz minden eleméhez rendeljük hozzá a B halmaz pontosan egy elemét. Ezt az egyértelmű.
INFOÉRA 2006 Véletlenszámok
MINTAVÉTEL, LEÍRÓ STATISZTIKAI MUTATÓSZÁMOK
Összefüggés vizsgálatok
Varianciaanalízis- ANOVA (Analyze Of VAriance)
dr. Jeney László egyetemi adjunktus Európa regionális földrajza
Kvantitatív módszerek
Kvantitatív módszerek
Érték-, ár-, volumenindexek
Regressziós modellek Regressziószámítás.
Sztochasztikus kapcsolatok I. Asszociáció
A Box-Jenkins féle modellek
A nagyváros–vidék kettősség az európai térszerkezetben
Alapfogalmak Adatelemzés.
Matematikai statisztika előadó: Ketskeméty László
Gazdaságinformatikus MSc
3. előadás.
TÁRGYI ESZKÖZÖK ELSZÁMOLÁSA
SZAKKÉPZÉSI ÖNÉRTÉKELÉSI MODELL I. HELYZETFELMÉRŐ SZINT FOLYAMATA 8
Dr. Varga Beatrix egyetemi docens
A területi koncentráció mérése: Hirschman–Herfindahl index
Binomiális fák elmélete
Erasmus+ hallgatói mobilitásra jelentkezéshez
Paraméteres próbák Adatelemzés.
Lorenz-görbe dr. Jeney László egyetemi adjunktus
Kísérlettervezés 2018/19.
3. előadás.
Várhatóérték, szórás
Hipotéziselmélet Adatelemzés.
KOHÉZIÓS POLITIKA A POLGÁROK SZOLGÁLATÁBAN
Mintavételes eljárások
Vargha András KRE és ELTE, Pszichológiai Intézet
Előadás másolata:

A matematikai statisztika alapfogalmai Gazdaságinformatikai MSc

Dr Ketskeméty László előadása Alapfogalmak Sokaság, populáció, véletlen kísérlet Statisztikai minta, minta realizáció Statisztikai mintavétel Statisztika Paraméter Statisztikai becslés 2018.09.19. Dr Ketskeméty László előadása

Statisztikai sokaság, populáció A vizsgálat tárgyát képező nagyszámú de véges elemszámú egyedek halmaza. A halmaz egészének kevés adattal történő tömör jellemzése, és a populáció egyedeinek leírására bevezetett változók közötti kapcsolatok leírása a célunk. Arra nincs lehetőség (erőforrás), hogy a populáció minden egyes eleméről adatokat szerezzünk be. Magyarország állampolgárai - Egy egyetemi kar hallgatói - Az érvényes forgalmival rendelkező autók halmaza - Egy adott termék vásárlóinak halmaza - Egy TV csatorna nézőinek halmaza 2018.09.19. Dr Ketskeméty László előadása

Egy véletlen kísérlet megfigyelése A statisztikai elemzés tárgya lehet egy véletlen kísérlet is, ami időben változatlan körülmények között elvileg akárhányszor lejátszódhat. A valószínűségszámítás tárgyalásában ezt K–val jelöltük. A lottóhúzás Egy szerver működése Budapest januári átlaghőmérséklete Egy gyümölcsös terméshozama Egy új gyógyszer hatása Egy reklámkampány hatásossága Egy populáció egyedének véletlen kiválasztása 2018.09.19. Dr Ketskeméty László előadása

Statisztikai minta realizáltja A populáció egy kis elemszámú részhalmazára vonatkozó megfigyelések adatai. A minta úgy kell, hogy tükrözze a populáció tulajdonságait, ahogy a cseppben látjuk a tengert. Azaz a minta reprezentatív kell, hogy legyen. Egy felmérésbe bevont magyar állampolgárok halmaza - Egy adott előadásra belátogatott hallgatók halmaza - Adott biztosítóval szerződött autók halmaza - Egy adott napon megkérdezett vásárlók halmaza - Egy nézettségi felmérésbe bevont TV nézők halmaza - Budapest januári középhőmérséleteinek adatai 2018.09.19. Dr Ketskeméty László előadása

Mintavételezési eljárások A populáció minden egyes elemének ugyanakkora esélyt kell biztosítani a mintába kerüléshez. A minta elemszámának elég nagynak kell lennie ahhoz, hogy a következtetéseink átvihetők lehessenek a populációra is. Rétegzett mintavételezés: A populációt adott szempontok szerint csoportokba osztjuk, és a csoportok arányait a mintában is megtartjuk Véletlen mintavételezés: A mintába kerülő egyedeket sorsolással választjuk ki. 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Eset A minta egy eleme, az adatmátrix egy sora. Mintaelemszám Az adott minta elemeinek száma. Egy adatmátrix sorainak száma. Adatmátrix n db eset és p db változó adatainak mátrixba rendezett alakzata Változó A populáció egy mérhető jellemzője. Az adatmátrix egy oszlopa. 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Példák változókra - Magyarország állampolgárai: fizetés; kor; nem; párt stb. - Egy egyetemi kar hallgatói: gönygyölt tanulmányi átlag; neptun-kód; nem; szak; teljesített kreditek száma stb. - Az autók halmaza: gyorsulás; fogyasztás; lóerő; típus;... - Egy adott termék vásárlóinak halmaza: vélemény az árról; minőségről;... - Egy TV csatorna nézőinek halmaza: kor; nem; tetszési index; iskolázottság; stb. 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Statisztika A minta realizáció adataiból adott képlettel számolt adat a statisztika számított értéke. átlag, standard szórás, medián, kvartilis, ferdeség, lapultság, módusz, gyakoriság, próbastatisztikák, stb. 2018.09.19. Dr Ketskeméty László előadása

A matematikai statisztika alapmodellje a véletlen kísérlet  a lehetséges kimenetelek halmaza A a megfigyelhető események halmaza a lehetséges valószínűségi mértékek halmaza P Az elemzésünk célja, hogy ebből a halmazból kiválasszuk a tényleges valószínűséget! Legalább is egy jó helyettesítő egyedet. 2018.09.19. Dr Ketskeméty László előadása

A változó matematikai fogalma X:   R a vizsgált valószínűségi változó X-nek minden PP esetén megadható az eloszlásfüggvénye! FX ( t ) = P( X< t ) minden PP –re! F = {FX ( t ) : FX ( t ) = P( X< t ) minden PP –re} Feladatunk tehát, ebből a halmazból kiválasztani a valóságot legjobban leíró eloszlásfüggvényt! 2018.09.19. Dr Ketskeméty László előadása

A statisztikai minta fogalma Az X valószínűségi változóval azonos eloszlású, egymással teljesen független X1, X2,…, X n valószínűségi változók együttesét statisztikai mintának nevezzük. A matematikai modellben a minta tehát teljesen független, azonos eloszlású valószínűségi változók sorozata… A gyakorlati alkalmazásokban pedig n db szám! X eloszlásfüggvénye a minta eloszlásfüggvénye is. n a mintaelemszám. Xi a minta i-edik eleme. Egy mintavételezéskor tulajdonképpen megfigyeljük a K véletlen kísérletet, azaz megállapítjuk melyik   kimenetele realizálódott. Az X1() = x1, X2() = x2,…, X n() = xn szám n-est nevezzük a minta realizációjának. 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Egy példa I. Populáció Tekintsük az USA-ban, Európában és Japánban a 70-es, 80-as években gyártott gépjárművek halmazát! Változók mpg hány mérföldet tesz meg egy gallon üzemanyaggal engine hengerűrtartalom inch3-ben horse motorteljesítmény lóerőben weight az autó súlya fontban accel hány sec alatt éri el a 60 mph/hour sebességet year a gyártás éve (utolsó két számjegy: 19..) origin a gyártóhely: 1-USA, 2-Európa, 3-Japán cylinder a hengerek száma (3, 4, 5, 6, 8) 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Egy példa II. A populációhoz képzünk egy n=406 elemű mintát! Azaz az 1970 és 1982 között a térségekben le- gyártott gépjárművek közül kiválasztunk 406-ot és megmérjük a változókhoz tartozó értékeket. Az adatokat egy mátrixba foglaljuk. Az adatmátrixban olvasható adathalmaz lesz a minta- realizáció. Tudjuk, hogy a mintavételezéskor a vélet- lentől függött, hogy melyik autót vizsgáltuk meg, azaz kaphattunk volna másik adatmátrixot is! A statisztikai minta egy absztrakcióval nyert fogalom: a mintarealizáció csupán egy lehetséges értékfelvétele. 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Egy példa III. Az adatmátrix első 17 esete: 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Egy példa IV. értékcimkék 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Egy példa V. Gyakoriságok 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Egy példa VI. Gyakoriságok 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Egy példa VII. Gyakoriságok 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Egy példa VIII. A leíró statisztikák számított értékei: 2018.09.19. Dr Ketskeméty László előadása

A statisztika matematikai fogalma Legyen tn egy n-változós valós függvény. Akkor a statisztikai minta Tn=tn(X1,X2,…,Xn) függvényét nevezzük statisztikának. A statisztika egy valószínűségi változó, aminek eloszlásfüggvényét a minta eloszlásfüggvényéből lehet kiszámolni. A Tn=tn(X1,X2,…,Xn) szám (amikor az argumentumba a mintarealizáció értékeit helyettesítjük, a statisztika számolt értéke. 2018.09.19. Dr Ketskeméty László előadása

Az adatcentrumot jellemző statisztikák ÁTLAG (mean) MEDIÁN (median) A leggyakrabban előforduló érték a mintában MÓDUSZ (mode) 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása A szóródást jellemző statisztikák STANDARD SZÓRÁS (deviation) VARIÁCIÓ (variance) TERJEDELEM (range) 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Az eloszlást jellemző statisztikák FERDESÉG (skewness) 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Az eloszlást jellemző statisztikák LAPULTSÁG (curtosis) 2018.09.19. Dr Ketskeméty László előadása

A rendezett minta statisztikák I. 2018.09.19. Dr Ketskeméty László előadása

A rendezett minta statisztikák II. 2018.09.19. Dr Ketskeméty László előadása

A rendezett minta statisztikák III. Az empirikus eloszlásfüggvény , ahol Az empirikus eloszlásfüggvény minden x helyen egy lépcsős eloszlásfüggvény lesz. Ugyanakkor az eloszlásfüggvény a statisztikai minta függvénye is, azaz minden x helyen valószínűségi változó lesz 2018.09.19. Dr Ketskeméty László előadása

A matematikai statisztika alaptétele Glivenko-Cantelli-tétel Az empirikus eloszlásfüggvény 1 valószínűséggel, egyenletesen konvergál az eloszlásfüggvényhez. 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása A paraméter Tegyük fel, hogy a minta eloszlásfüggvénye képletét egy  paraméter konkretizálja. Ha ismerjük az értékét, meg tudjuk pontosan adni az eloszlásfüggvényt: F = {FX ( t, ) :   } Egy adott statisztikai minta segítségével a  paraméter megbecslése a célunk! 2018.09.19. Dr Ketskeméty László előadása

Példa paraméteres problémákra Egy joghurt zsírtartalmát ellenőrzik. A laborban  pontossággal meg tudják mérni a zsírtartalmat. A mérés a pontos érték körül a normális eloszlás szerint ingadozik. Ha vesznek egy mintát, akkor a minta eloszlása N(, )! 2. Egy brókerirodában m ügyfél kötvényeit kezelik. Egy ügyfél  valószínűséggel kér eladást/vételt az irodától. A napi tranzakciók száma Bin(m, ) eloszlást követ. 2018.09.19. Dr Ketskeméty László előadása

A paraméter becslése A  paraméter becsléséhez valamilyen alkalmas Tn statisztikát használunk: Tn  . Egy ismeretlen számot (a -át) egy valószínűségi változóval becsüljük! Mikor jó egy ilyen becslés??? 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása A paraméter becslése I. Torzítatlanság Valószínűségszámításból tanultuk, hogy egy valószínűségi változó az összes szám közül éppen a várható értéke körül ingadozik a legkisebb mértékben. A Tn statisztika a  paraméter torzítatlan becslése, ha ETn = . A torzítatlanság azt jelenti, hogy a becslő statisztika éppen a becsülendő paraméterérték körül fogja felvenni az értékeit. Lövészhasonlattal: „a találathoz a célkereszt jól van beállítva, nem hord félre a fegyver.” 2018.09.19. Dr Ketskeméty László előadása

A paraméter becslése II. A becsülendő paraméter, . Egy nem torzítatlan becslő statisztika realizáltjai. Ilyen statisztika torzított. Egy torzítatlan becslő statisztika realizáltjai a minta elemszám függvényében. 2018.09.19. Dr Ketskeméty László előadása

A paraméter becslése III. Aszimptotikus torzítatlanság Ha a torzítatlansági feltétel csak n esetben igaz: 2018.09.19. Dr Ketskeméty László előadása

A paraméter becslése IV. Konzisztencia Ha garancia van arra, hogy a minta elemszám növekedtével növekszik a becslés pontosságának valószínűsége, konzisztens becslésről beszélünk: A statisztika, mint valószínűségi változó sorozat, sztochasztikusan konvergál a  konstanshoz! 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása A paraméter becslése V. Csak a konstansnak lehet 0 a varianciája. Tehát, ha n elég nagy, a becslés gyakorlatilag a paramétert adja! Erős konzisztencia Azok a torzítatlan becslések, melyeknél a variancia a minta elemszám növekedtével 0-hoz tart: A Csebisev-egyenlőtlenségből következik, hogy az erősen konzisztens statisztikai becslések egyben konzisztensek is lesznek. A megfordítás általában nem igaz! 2018.09.19. Dr Ketskeméty László előadása

A paraméter becslése VI. Konzisztencia, erős konzisztencia A becslés és a paraméter eltérése az n növekedtével csökkenni fog! 2018.09.19. Dr Ketskeméty László előadása

A paraméter becslése VII. Hatásosság Két torzítatlan becslés közül nyilván a kisebb varianciájú a jobb, hiszen kisebb mértékben ingadozik a paraméter körül! Azaz, a Vn statisztika hatásosabb Wn-nél, ha Egy torzítatlan becslés akkor lesz hatásos, ha varianciája minden más torzítatlan becslés varianciájánál kisebb! Csak egyetlen hatásos becslés van! (Ezt kell megkeresni egy adott paraméter-becslési problémához!) 2018.09.19. Dr Ketskeméty László előadása

A paraméter becslése VIII. Hatásosság A torzítatlan becslések közül azt kell alkalmaznunk, amelyiknek a legkisebb a varianciája. Ez fog a legkisebb mértékben ingadozni a paraméter körül, ilyenkor kevesebb megfigyeléssel is jó becslés kapható. 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Példák becslésekre I. Legyen a becsülendő paraméter most az X várható értéke: Megmutatható, hogy az átlagstatisztika torzítatlan: 2018.09.19. Dr Ketskeméty László előadása

Dr Ketskeméty László előadása Példák becslésekre II. Ha még azt is tudjuk, hogy D2X <  , akkor az átlag erősen konzisztens is: A lineáris becslések között az átlag a hatásos: 2018.09.19. Dr Ketskeméty László előadása

Példák becslésekre III. Legyen a becsülendő paraméter most az X varianciája: Az empirikus szórásnégyzet aszimptotikusan torzítatlan, a korrigált empirikus szórásnégyzet pedig torzítatlan becslés! 2018.09.19. Dr Ketskeméty László előadása