I. Előadás bgk. uni-obuda

Slides:



Advertisements
Hasonló előadás
Események formális leírása, műveletek
Advertisements

Hipotézis-ellenőrzés (Statisztikai próbák)
I. előadás.
II. előadás.
BECSLÉS A sokasági átlag becslése
Kvantitatív módszerek
Valószínűségszámítás
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Általános statisztika II.
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Közlekedésstatisztika
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Valószínűségszámítás
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Statisztika II. III. Dr. Szalka Éva, Ph.D..
Készítette: Kosztyán Zsolt Tibor
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Az F-próba szignifikáns
STATISZTIKA II. 2. Előadás
Statisztika.
Készítette: Horváth Zoltán (2012)
Kvantitatív Módszerek
Kvantitatív módszerek
Valószínűségszámítás
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 11. előadás.
Gazdaságstatisztika 18. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 14. előadás.
Gazdaságstatisztika 13. előadás.
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Gazdaságstatisztika 15. előadás.
Hipotézis vizsgálat (2)
Következtető statisztika 9.
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Alapfogalmak.
Adatleírás.
Dr Gunther Tibor PhD II/2.
I. előadás.
Valószínűségszámítás III.
Bevezetés a méréskiértékelésbe (BMETE80ME19) Intervallumbecslések 2014/
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Valószínűségszámítás II.
A számítógépes elemzés alapjai
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Kvantitatív módszerek Becsléselmélet október 15.
Leíró statisztika, részekre bontott sokaság, becslés Árva Gábor PhD Hallgató.
A számítógépes elemzés alapjai
Kvantitatív módszerek
Nemparaméteres próbák
II. előadás.
Kvantitatív módszerek MBA és Számvitel mesterszak
Becsléselmélet - Konzultáció
Gazdaságstatisztika konzultáció
Nemparaméteres próbák
Hipotézisvizsgálatok Paraméteres próbák
Szabályozott és képes termékek/szolgáltatások, folyamatok, rendszerek
Gazdaságinformatikus MSc
Adatfeldolgozási ismeretek környezetvédelmi-mérés technikusok számára
Mérések adatfeldolgozási gyakorlata vegyész technikusok számára
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
1.3. Hipotézisvizsgálat, statisztikai próbák
Előadás másolata:

I. Előadás http://siva. bgk. uni-obuda

Ismétlés Mintavételi terv Példa: A gyártó állítása szerint a szállítmányban a selejt valószínűsége .   A legfeljebb 5% selejtet tartalmazó szállítmányt az átvevő is elfogadja. - Az átvevő átveszi a szállítmányt, ha elemű mintában legfeljebb 2 selejtes terméket talál. Mekkora az átadó kockázata? - Az átvevő akkor is átveszi a szállítmányt, benne a selejtarány, de elemű mintában legfeljebb 2 selejtes terméket talál. Mekkora az átvevő kockázata? (Nyilvánvaló, hogy a mintát visszatevéssel választjuk. Miért?) Eredmény: ( 3,61%; 81,6% )

Ismétlés Normális eloszlás Példa: Egy gyártmány mérethibája normális eloszlású valószínűségi változó várható értékkel. Megállapítottuk, hogy a mérethiba 0,8 valószínűséggel nem éri el a 20 mm-es határt, amelyen belül a gyártmány még elfogadható minőségű. A termék első osztályú, ha a mérethiba abszolút értéke nem éri el a 10 mm-es határt. - Mekkora a valószínűsége, hogy egy véletlenszerűen kiválasztott termék első osztályú? - A termékek hány százaléka nem tér el a várható értéktől a szórás kétszeresénél jobban? (2 szabály) Eredmény: ( 1,625; 0,4778; ,9544 )

A matematikai statisztika tárgya A valószínűségszámításban egy esemény valószínűségét, egy valószínűségi változó eloszlásának típusát, várható értékét, szórását stb. elméleti megfontolások alapján tudtuk kiszámítani. A gyakorlatban egy-egy esemény valószínűségét, egy-egy valószínűségi változó pontos eloszlását, várható értékét, szórását stb. nem ismerjük, csak tapasztalati adatok statisztikai feldolgozásával tudunk rájuk következtetni. A matematikai statisztika a kísérleti adatokból ( a mintából ) kapható becslésekkel, a véletlen valószínűségi változó típusára, vagy az eloszlás jellemzőire a minta alapján feltett hipotézisekkel foglalkozik. Definíció. A matematikai statisztikában a vizsgálat tárgyát képező egyedek összességét a hozzájuk tartozó számértékekkel együtt statisztikai sokaságnak nevezzük.

A matematikai statisztika tárgya A minta megadása Definíció. A teljes sokaságból vizsgálatra kivett n elemet a hozzájuk tartozó számértékekkel együtt statisztikai mintának nevezzük. Mivel ugyanabból a sokaságból kivett újabb és újabb mintához más-más számértékek tartoznak, az értékek tekinthetők egymástól független, ugyanazon eloszlású valószínűségi változóknak is. A minta megadása a./ felsorolással: b./ gyakoriságokkal:

A minta megadása Módusz, medián c./ osztályokba sorolással: Módusz: A leggyakrabban előforduló elemet a minta móduszának nevezzük. pl.: a./ 4; b./ 2; c./ nincs Medián: Az adatokat monoton növekvő sorrendbe rendezve, a középső elem (ha van) a minta mediánja. Ha nincs középső elem (páros darabszám esetén), akkor a „két középső elem” számtani közepe a minta mediánja. pl.: a./ ; b./ 2; c./ nincs

A minta átlaga Terjedelem. A minta terjedelme a legnagyobb és a legkisebb elem különbsége. pl.: a./ 5; b./ 4; c./ nincs A minta átlaga  Definíció. A mintavételi változók ( mintaelemek ) számtani közepe a mintaátlag ( tapasztalati, empirikus várható érték ) : pl.: a./ 3,286

A minta átlaga Definíció. Ha a mintavétel során egy-egy mintaelem többször is előfordul, mégpedig összesen -szer ( gyakorisággal ), összesen -ször ( gyakorisággal ), összesen -szor ( gyakorisággal ), akkor a mintaátlag: Itt a gyakoriságok összege természetesen . pl.: b./ 2,46

A minta átlaga Tétel. A mintaátlagnak, mint valószínűségi változónak a várható értéke megegyezik a teljes statisztikai sokaság ( "elméleti sokaság" ) várható értékével, azaz Itt a  valószínűségi változó értékei a teljes sokaság értékei, az mintaelemek -vel azonos eloszlású valószínűségi változók ( i = 1, 2, ..., n ). Tétel. A mintaátlag szórásnégyzete és a teljes statisztikai sokaság ( ) közötti összefüggés: vagyis Tétel. Ha a teljes statisztikai sokaság normális eloszlású, akkor a mintaátlag is normális eloszlású, mégpedig ( az előbbiek alapján ) eloszlású.

A minta szórása Definíció. A minta szórásnégyzete: . Ha az mintaelemek az gyakoriságokkal vannak megadva, akkor a minta szórásnégyzete: . Tétel. A minta szórásnégyzetének, mint valószínűségi változónak a várható értéke: ( nem egyezik meg az alapsokaság szórásnégyzetével! ) Mivel várható értéke nem az alapsokaság szórásnégyzete, ezért a matematikai statisztikában a korrigált szórásnégyzetet használjuk.

A minta szórása Definíció. A korrigált tapasztalati szórásnégyzet: Tétel. A minta korrigált tapasztalati szórásnégyzetének várható értéke a teljes statisztikai sokaság szórásnégyzete, azaz . pl.: c./

Tapasztalati eloszlásfüggvény Definíció. Az mintaelemek közül azoknak a számát, amelyekre teljesül, hogy , jelöljük -el. Az ( x  R ) függvényt a minta eloszlásfüggvényének ( tapasztalati eloszlásfüggvényének ) nevezzük. Tétel. Az tapasztalati eloszlásfüggvény várható értéke x  R esetén: Megjegyzés.   Az előbbi tételben szereplő F függvény a teljes statisztikai sokaság eloszlásfüggvénye. (az u. n. elméleti eloszlásfüggvény) Az empirikus eloszlásfüggvény tehát a F elméleti eloszlásfüggvény jó közelítése. 

Tapasztalati sűrűségfüggvény Definíció. Osszuk fel a  mintabeli értékeire szóba jöhető intervallumot részintervallumokra. Az részintervallumokra eső mintaelemek számát jelöljük -vel. Az részintervallumon állandó függvényt tapasztalati sűrűségfüggvénynek ( a minta sűrűségfüggvényének) nevezzük. Megjegyzés. Mivel , ezért ha az n elég nagy és a részintervallumok elég kicsik, akkor a teljes sokaság f sűrűségfüggvényét a mintabeli sűrűségfüggvény jól közelíti.  

Példa a tapasztalati eloszlás- és sűrűségfüggvényre Példa: tapasztalati sűrűségfüggvény tapasztalati eloszlásfüggvény

Konfidencia-intervallumok

Konfidencia-intervallumok Ha az alapsokaság egy ismeretlen  paraméterére n elemű minta alapján becslést készítünk, akkor a  valódi értéke csak közelítőleg lesz egyenlő a becsléssel   ( pontbecslés ). Ha ismerjük, hogy a becsült milyen eloszlású, akkor meg tudunk adni olyan intervallumot, amely nagy valószínűséggel tartalmazza a valódi -t. Definíció. Az intervallumot az  paraméter becslésére szolgáló (1 - )100 % megbízhatósági szintű konfidencia intervallumnak nevezzük, ha . Itt az 1 -  magas 1-hez közeli valószínűséget jelent. Az meghatározásával intervallumbecslést adtunk -ra.  

Konfidencia-intervallumok Tétel. Tegyük fel, hogy a normális eloszlású alapsokaság  szórását ismerjük. Az alapsokaság m várható érétkét az n elemű minta átlagával becsüljük. Ekkor az m-re vonatkozó 1 -  szintű konfidencia intervallum: , azaz , ahol N( 0, 1 ) eloszlású valószínűségi változó, amelyet a „t” eloszlás táblázatból is meghatározhatunk. ( , %) Példa: Kekszcsomagokat mérve a következőket kapjuk : 397,3; 399,6; 401,0; 392,9; 396,8; 400,0; 397,6; 392,1; 400,8; 400,6. Feltételezve , hogy a csomagokban található keksz tömege normális eloszlású σ = 10 szórással, határozza meg 95 %-os szignifikancia szinten a konfidencia intervallumot!

Konfidencia-intervallumok Tétel. Tegyük fel, hogy ismert egy normális eloszlású alapsokaságból vett n elemű minta átlaga és korrigált szórása. Ekkor az m-re vonatkozó 1 -  valószínűségű konfidencia intervallum: , azaz , ahol Student eloszlású valószínűségi változó, amely nem csak az  -tól, hanem a minta elemszámától ( pontosabban az f = n - 1 szabadsági foktól ) is függ. Adott n és  esetén a értékét a Student-féle t eloszlás táblázatából kaphatjuk meg. Példa: Villanyégők élettartamát vizsgálva, azt normális eloszlásúnak találták. n = 15 égő élettartamát vizsgálva az élettartam átlaga órának, tapasztalati korrigált szórásnak óra adódott. 95%-os biztonsági szinten milyen konfidencia- intervallumba (megbízhatósági intervallumba) esik az egész sokaság várható értéke?