Alapsokaság (populáció)

Slides:



Advertisements
Hasonló előadás
Hipotézis-ellenőrzés (Statisztikai próbák)
Advertisements

I. előadás.
II. előadás.
BECSLÉS A sokasági átlag becslése
Kvantitatív módszerek
Rangszám statisztikák
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Két változó közötti összefüggés
Általános statisztika II.
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
Mintavételes eljárások
III. előadás.
Az élővilág kutatásának matematikai, statisztikai eszköztára
PTE PMMK Matematika Tanszék dr. Klincsik Mihály Valószínűségszámítás és statisztika előadások Gépész-Villamosmérnök szak BSc MANB030, MALB030 Bevezető.
Regresszióanalízis 10. gyakorlat.
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
Hipotézisvizsgálat (1. rész) Kontingencia táblák
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. III. Dr. Szalka Éva, Ph.D..
Készítette: Kosztyán Zsolt Tibor
Kvantitatív módszerek
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
Nemparaméteres próbák Statisztika II., 5. alkalom.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Az F-próba szignifikáns
STATISZTIKA II. 2. Előadás
STATISZTIKA II. 6. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Kvantitatív Módszerek
Valószínűségszámítás
Gazdaságstatisztika 14. előadás.
Hipotézis vizsgálat (2)
Várhatóértékre vonatkozó próbák
Alapfogalmak.
Lineáris regresszió.
Adatleírás.
Folytonos eloszlások.
© Farkas György : Méréstechnika
I. előadás.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Bevezetés a méréskiértékelésbe (BMETE80ME19) Intervallumbecslések 2014/
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Valószínűségszámítás II.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
A számítógépes elemzés alapjai
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Kvantitatív módszerek Becsléselmélet október 15.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
Gazdaságstatisztika Becsléselmélet október 30. és november 5.
A számítógépes elemzés alapjai
Kvantitatív módszerek
II. előadás.
Becsléselmélet - Konzultáció
I. Előadás bgk. uni-obuda
A matematikai statisztika alapfogalmai
Gazdaságinformatikus MSc
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Előadás másolata:

Alapsokaság (populáció) az a halmaz, amelyre (amelynek elemeire) vonatkozóan szeretnénk megállapításokat tenni az alapsokaság mérete lehet végtelen (egy kísérletet elvileg végtelen sokszor megismételhetünk), vagy véges, de olyan nagy, hogy nem tudjuk minden elemét megvizsgálni ha az alapsokaság minden elemét „megmérjük” nincs szükség statisztikára

Minta az alapsokaság részhalmaza mérete akkora, hogy minden elemét meg tudjuk vizsgálni Mindig fontos tudnunk, hogy a vizsgált minta milyen alapsokaságot reprezentál!

Feladat Mondj egy példát (lehetőleg a saját vizsgálataidból) összetartozó alapsokaságra és mintára!

Mire ügyeljünk a mintavétel során? a populáció minden eleme azonos valószínűséggel kerüljön a mintába az egyik elem kiválasztása ne befolyásolja a többi kiválasztását  a minta elemei legyenek függetlenek

A statisztikai vizsgálat célja az alapsokaság valamilyen jellemzőjének becslése a mintából  becslés az alapsokaságra vonatkozó hipotézis ellenőrzése a mintából becsült értékek alapján  hipotézis vizsgálat

Becslés az alapsokaság jellemzői nem valószínűségi változók, hanem konstansok a mintából becsült értékek viszont valószínűségi változók

Milyen a jó becslés? torzítatlan konzisztens hatékony (efficiens) elégséges

Torzítatlan becslés Jelöljük az a paraméterre az minta alapján kapott becslést -nel A becslés torzítatlan, ha

Példák a torzítatlan becslésre a minta számtani átlaga a várhatóérték torzítatlan becslése egy esemény relatív gyakorisága torzítatlan becslése az esemény valószínűségének a korrigált empirikus szórásnégyzet torzítatlan becslése az alapsokaság varianciájának

Példák a torzított becslésre ez egy aszimptotikusan torzítatlan becslés, mert:

Példák a torzított becslésre Szimuláljuk a következő szituációt: a közösség két fajból áll, amelyek aránya 50-50%. A közösség diverzitása ln(2). Vegyünk 100 egyedből álló mintákat és becsüljük azokból a diverzitást! A mintákban az egyik faj egyedszáma X1=rbinom(100, 0.5), a második faj egyedszáma X2=100-X1. Számoljuk a minták diverzitását és ábrázoljuk az elméleti értékkel együtt!

Konzisztens becslés a becslés konzisztens, ha a minta méretének növekedésével aszimptotikusan konvergál a becsült értékhez, azaz tetszőlegesen kicsi pozitív  esetén Tétel: Ha a becslés torzítatlan és varianciája a mintaméret emelésével konvergál 0-hoz, akkor a becslés konzisztens

Példák a konzisztens becslésre a minta számtani átlaga a várhatóérték konzisztens becslése egy esemény relatív gyakorisága konzisztens becslése az esemény valószínűségének a korrigált empirikus szórásnégyzet konzisztens becslése az alapsokaság varianciájának (, ha létezik a valószínűségi változó negyedik momentuma)

Hatékony (efficiens) becslés Ha egy paraméternek több torzítatlan becslése is létezik, akkor ezek közül a legkisebb varianciájút a paraméter efficiens becslésének nevezzük. A minta számtani átlaga a várhatóérték efficiens becslése

Elégséges becslés A becslés akkor elégséges, ha a becsült paraméterre vonatkozó minden információt tartalmaz, ami a mintából kiolvasható A minta számtani átlaga a várhatóérték elégséges becslése

A becslés módszerei legnagyobb valószínűség (maximum likelihood) módszere momentumok módszere

Maximum likelihood becslés Likelihood függvény: annak valószínűsége, hogy Y1, Y2, …, Yn megfigyelt értéke(ke)t kapjuk, ha a keresett a paraméter értéke . (Ez egy feltételes valószínűség). A becslés során a függvény maximumát keressük. Példa: Milyen p paraméternél a legvalószínűbb, hogy 100 független kísérletből 54-szer kapunk kedvező eredményt? Használjátok a binom.xls filet!

Maximum likelihood becslés 2 Több azonos eloszlású, független megfigyelt érték esetén a minta likelihood függvénye az egyes értékekre számolt likelihood függvények szorzata. Sokszor kényelmesebb a likelihood függvény logaritmusával számolni. Ez a log-likelihood függvény. A minta log-likelihood függvénye a független megfigyelt értékek log-likelihood függvényeinek összege.

Mintaátlag szórása A mintából számolt átlag valószínűségi változó, ezért van várhatóértéke és szórása. Várhatóértéke megegyezik az alapsokaság várhatóértékével. Ha a minta elemei függetlenek, akkor az összegük szórása átlaguké pedig

Mintaátlag eloszlása normális eloszlású valószínűségi változók esetén a mintaátlag is normális eloszlású tetszőleges más eloszlás esetén a minta elemszámának növekedésével az átlag eloszlása aszimptotikusan a normális eloszláshoz tart

Khi-négyzet eloszlás n darab független, standard normális eloszlású valószínűségi változó négyzeteinek összege n szabadsági fokú khi-négyzet eloszlású valószínűségi változó ha Y=N(m,s), akkor

Khi-négyzet eloszlás 2 ha a standard n normális eloszlású valószínűségi változók nem függetlenek, de közöttük csak lineáris összefüggések vannak, négyzeteik összege továbbra is khi-négyzet eloszlású valószínűségi változó, de az eloszlás szabadsági foka a független (egymásból nem levezethető) lineáris összefüggések számával csökken ha Y=N(m,s), akkor

A becsült szórásnégyzet eloszlása

Konfidencia intervallum az alapsokaság várhatóértéke egy fix érték becslése a mintaátlag viszont valószínűségi változó  minden mintában más becslést kapunk a konfidencia intervallum a becsült érték körüli olyan intervallum, amit ha sok mintára kiszámolunk az esetek megadott (általában 95) százalékában tartalmazza a valós értéket

Konfidencia intervallum normális eloszlású változó várhatóértékére Ha az alapsokaság szórása ismert ahol ua/2 a standard normális eloszlás kritikus értéke a/2 szinten Ha a szórást a mintából becsüljük: ahol tn-1,a/2 az n-1 szabadsági fokú (Student-féle) t-eloszlás kritikus értéke a/2 szinten.

Feladat Az R-script segítségével szimulálj konfidencia intervallumokat a standard normális eloszlásból származó 10, 50 és 100 elemű mintákra. Vizsgáld meg, hogy hat-e a minta elemszáma azoknak az eseteknek a számára, amelyeknél a konfidencia intervallum nem fedi le a valódi átlagot! Mire hat a minta elemszáma?

Pontosság és megbízhatóság A konfidencia intervallum szélességét a becslés pontosságának nevezzük A konfidencia intervallumhoz tartozó 1-a értéket a becslés megbízhatóságának hívjuk. Rögzített mintaelemszám mellett a becslés megbízhatósága és pontossága fordítottan arányos A mintaszán növekedésével adott megbízhatóság mellett nő a becslés pontossága.