Szigorlati felkészítő Kvantitatív módszerek Üzleti Tudományok Intézet Menedzsment és Vállalatgazdaságtan Tanszék Minőség és Üzleti Statisztika Szakcsoport Címdia – 1. verzió Dr. Tóth Zsuzsanna Eszter 2016. február 25.
Szigorlati tételek A valószínűségszámítás tárgya, alapfogalmai Leíró statisztika Hipotézisvizsgálatok Elméleti eloszlások
A valószínűségszámítás tárgya, alapfogalmai A valószínűségszámítás tárgya, a valószínűség és a valószínűségi változó fogalma, jellemzői A valószínűségszámítás axiómarendszere Valószínűségszámítási tételek (feltételes valószínűség, teljes valószínűség tétele, Bayes-tétel)
A valószínűségszámítás tárgya Véletlen tömegjelenségekben rejlő statisztikai törvényszerűségek vizsgálata. Véletlen jelenség: olyan jelenség, amelynek a kimenetét a tekintetbe vett (rendelkezésre álló) feltételek nem határozzák meg egyértelműen. Tömegjelenség: olyan jelenség, amely nagy számban megy végbe egyszerre, vagy sokszor megismételhető.
A valószínűség fogalma A n f(A)
A valószínűségszámítás tárgya, a valószínűség és a valószínűségi változó fogalma, jellemzői Ha egy véletlen kísérlethez tartozó eseménytéren minden egyes elemi eseményhez hozzárendelünk egy valós számot, akkor ezt a hozzárendelést valószínűségi változónak nevezzük. A valószínűségi változó jellege Diszkrét: véges, vagy megszámlálhatóan vég- telen sok értéket vehet fel Folytonos: megszámlálhatatlanul végtelen sok értéket vehet fel
A valószínűségi változó jellemzői Diszkrét Folytonos Eloszlásfüggvény Valószínűségeloszlás fv. Sűrűségfüggvény Várható érték Elméleti szórás Medián Módusz F(k) F(x) pk — — f(x) M() M() D() D() Me Mo
A valószínűségszámítás axiómarendszere 1. axióma 0 P(A) 1 2. axióma P(H) = 1 3. axióma: addíciós tétel Ha A és B egymást kizáró események, akkor A ∙ B = 0 P(A + B) = P(A) + P(B)
Valószínűségszámítási tételek Feltételes valószínűség Egy esemény bekövetkezése milyen mértékben befolyásolja egy másik esemény bekövetkezését? Valószínűbb-e egy A esemény bekövetkezése, ha a B esemény már bekövetkezett? A kísérlet körülményeihez hozzávesszük a B esemény bekövetkezését, s ezzel a szóba jöhető események összességét leszűkítjük.
Valószínűségszámítási tételek Teljes valószínűség tétele Ha B1, B2, … Bn teljes eseményrendszert alkotnak és P(Bk)>0 (k=1,2,….n), A pedig egy tetszőleges esemény, akkor
Valószínűségszámítási tételek Bayes tétel Az okok valószínűségének tétele Ha B1, B2, … Bn teljes eseményrendszer és P(Bk)>0 (k=1,2,….n), A pedig egy tetszőleges esemény és P(A)>0, akkor
2. Leíró statisztika Mintavétel, mintavételi hiba, a minta adatainak feldolgozása A grafikus ábrázolás alapjai A legfontosabb középérték mutatók, ingadozásmutatók és alakmutatók jellemzői, az alkalmazás előnyei és hátrányai
Mintavétel, mintavételi hiba, a minta adatainak feldolgozása Matematikai statisztika tárgya: következtetés tapasztalati (megfigyelési-mérési) adatokból események ismeretlen valószínűségeire, valószínűségi változók ismeretlen eloszlásfüggvényére, vagy azok paramétereire. Sokaság: a vizsgálat tárgyát képező egységek összessége Statisztika minta: valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés eredménye: véges sok, azonos eloszlású független valószínűségi változó együttese. RÉSZLEGES MEGFIGYELÉSEK EREDMÉNYEIBŐL KÖVETKEZTETÜNK A SOKASÁGRA MINTAVÉTELI HIBA (a sokaság teljes megismeréséről való lemondás ára)
Mintavétel, mintavételi hiba, a minta adatainak feldolgozása F(x), M(), D() …. Fn(x), x, s, s* Következtetés Sokaság Minta Mintavétel
Mintavétel, mintavételi hiba, a minta adatainak feldolgozása Véletlen mintavételi eljárások! (a sokaság minden egyes egységére nézve előre megadható az elem mintába kerülésének a valószínűsége) A vizsgálat tárgyát képező jelenség tömör, számszerű jellemzése az adatok elemzése és rendezése alapján. Megfigyelt adatok bemutatása, összefoglaló jellemzése Sokoldalú eszköztár A minta adatainak áttekinthető formába rendezése Grafikus megjelenítés, ábrázolás A minta egyes számszerű értékeinek meghatározása Középérték mutatók: medián, módusz, számtani átlag Ingadozás mutatók: terjedelem, (korrigált) tapasztalati szórás Diszkrét és folytonos adatok
Grafikus ábrázolás alapjai Osztályba sorolás Gyakoriságok (fi) megállapítása Relatív gyakoriság (gi) megállapítása Összegzett (kumulált) gyakoriságok ill. relatív gyakoriságok (fi’; gi’) Gyakorisági táblázat Grafikus ábrázolás 16
Legfontosabb középérték mutatók Medián: helyzeti középérték – valódi középérték, a rangsor közepén található az az érték, amelynél az előforduló értékek fele kisebb, fele pedig nagyobb, érzéketlen a szélsőértékekre, nem függ az összes ismérvértéktől, egyértelműen meghatározható, mindig létezik ha sok az egyforma érték, nem tanácsos használni Módusz: helyzeti középérték – tipikus, diszkrét ismérv esetén a leggyakrabban előforduló ismérvérték, folytonos ismérv esetén pedig a gyakorisági görbe maximumhelye, érzéketlen a szélsőértékekre, nem mindig egyértelműen meghatározható, nem mindig létezik, elég nagy bizonytalansággal becsülhető
Legfontosabb középérték mutatók Számtani átlag: számított középérték – „az átlag”, bármely alapadathalmazból egyértelműen meghatározható, mindig létezik, érzékeny a szélsőértékekre nyesett átlag
Legfontosabb ingadozásmutatók Terjedelem: az adathalmazban szereplő legnagyobb és legkisebb adat különbsége, előnye a könnyű számítás, hátránya a kiugró értékekre való érzékenység interkvantilis terjedelemmutató abszolút ingadozásmutató
Legfontosabb ingadozásmutatók (Korrigált) tapasztalati szórás: az adathalmazunk változékonyságának legfontosabb mérőszáma, a szórás az átlagtól vett di eltérések négyzetes átlaga. Ennek megfelelően azt mutatja, hogy az értékek mennyire térnek el a számtani átlagtól
3. Hipotézisvizsgálatok A hipotézisvizsgálatok lényege, fajtái, a következtetés hibái A hipotézisvizsgálatok általános menete Paraméteres és nemparaméteres próbák, alkalmazásuk feltételei, módszerei
Hipotézisvizsgálatok lényege, fajtái Statisztikai hipotézisen a vizsgált sokaság(ok)ra (valószínűség-eloszlásra) vagy ennek paramétere(i)re vonatkozó valamilyen feltevést értünk. A hipotézisek helyességének mintavételi eredményekre alapozott vizsgálatát hipotézisvizsgálatnak nevezzük. A különféle hipotézisek vizsgálatára szolgáló eljárásokat statisztikai próbáknak vagy teszteknek hívjuk. A hipotézisvizsgálat annak mérlegelése, hogy az adott sokaságra megfogalmazott állítás mennyire hihető a mintavételi eredmények fényében.
Hipotézisvizsgálatok lényege, fajtái Nullhipotézis: az a sokaságra vonatkozó feltevés, amelynek igazságáról a hipotézisvizsgálat során közvetlenül meg kívánunk győződni. Alternatív vagy ellenhipotézis: a nullhipotézissel együtt minden lehetőséget kimerítő, azzal egymást kölcsönösen kizáró hipotézis, amelynek helysségéről közvetetten döntünk a hipotézisvizsálat során. A próbafüggvény a mintaelemek egy olyan függvénye, amelynek valószínűségi eloszlása a sokaság ismert tulajdonságait tekintetbe véve, H0 igazságát pedig feltételezve pontosan ismert. A próbafüggvényt eloszlásának ismerete teszi alkalmassá a H0 helyességének vizsgálatára.
Hipotézisvizsgálatok lényege, fajtái Elfogadási és elutasítási tartomány: A hipotézis helyességének ellenőrzése céljából a próbafüggvény lehetséges értékeinek tartományát alkalmas osztópontok segítségével két egymást át nem fedő – ún. diszjunkt – részre bontjuk: egy elfogadási és egy elutasítási tartományra. E két tartomány határait úgy választjuk meg, hogy a próbafüggvény a nullhipotézis fennállása esetén előre megadott nagy (1-α) valószínűséggel az elfogadási tartományba essen. Így a próbafüggvény értéke csak kicsi α valószínűséggel kerülhet a kritikus tartományba. Szignifikancia szint: a kritikus tartományba esés α valószínűségét szignifikancia szintnek nevezzük.
Hipotézisvizsgálatok lényege, fajtái
Hipotézisvizsgálatok lényege, fajtái Döntésünk H0-ról igaz nem Minta-1 Mintából következtetünk !!! Minta-2 Másodfajú hiba Nincs hiba Hibát követhetünk el !!! Minta-3 Elsőfajú hiba Másodfajú hiba () Elsőfajú hiba () Nincs hiba e
Hipotézisvizsgálatok általános menete Szakmai megfontolások alapján a hipotézisek (H0, H1) felállítása Megfelelő statisztikai próba kiválasztása, mintavétel, minta feldolgozása, elsőfajú hiba, kritikus érték meghatározása (elfogadási és elutasítási tartományok kijelölése) Próbastatisztika kiszámolása Összehasonlítás a kritikus értékkel Döntés a nullhipotézisről
Paraméteres és nemparaméteres próbák, alkalmazásuk feltételei, módszerei Mi a nullhipotézisük tárgya: Paraméterre és eloszlásra irányuló próbák Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek: A paraméteres próbák:a sokasági eloszlás típusára, egyes paramétereire vonatkozó elvárások A nemparaméteres próbák: legfeljebb a sokaság eloszlásának folytonosságát követeli meg Hány és mekkora minta szükséges a végrehajtásukhoz Egy, két vagy többmintás próbák Független (és páros mintás) próbák Kis- és nagymintás próbák (határ n=30)
Tanult hipotézisvizsgálatok térképe Paraméteres Nemparaméteres Illeszkedésvizs-gálat χ2 próbával Egymintás Kétmintás Többmintás Egymintás u-próba Kétmintás u-próba Cochran-próba Egymintás t-próba Kétmintás t-próba Egymintás sokasági szóráspróba F-próba
Nemparaméteres próbák Paraméteres és nemparaméteres próbák, alkalmazásuk feltételei, módszerei Nemparaméteres próbák A hipotézisvizsgálatoknak azon csoportját, ahol az eloszlás típusa nem ismert, és a H0 hipotézis magára az eloszlásra vonatkozik, nemparaméteres próbáknak nevezzük. Tanult nemparaméteres próba: Illeszkedésvizsgálat χ2 próbával
Nemparaméteres próbák, illeszkedésvizsgálat Arról döntünk, hogy valamely valószínűségi változó F (tapasztalati) eloszlása lehet-e adott F0 (elméleti) eloszlásfüggvénnyel jellemzett eloszlás Minták száma: egymintás Alkalmazás feltétele: nagymintás, diszkrét és folytonos eloszlásokra egyaránt Hipotézisek: H0: F = F0 H1: F ≠ F0 A próbafüggvény: A próbafüggvény eloszlása: χ2 eloszlás, DF=r-l-1
Egymintás paraméteres próbák Az egymintás próbák mindig egy adott sokaság valamely jellemzőjére vonatkozó feltevések helyességének ellenőrzésére szolgálnak. Ennek érdekében a rendelkezésre álló egyetlen mintából meghatározott jellemzőt (átlag, tapasztalati szórás) valamely feltételezett, vagy kívánatosnak tartott állapothoz viszonyítjuk. Így annak a kérdésnek a megválaszolására alkalmasak, hogy az a sokaság, amelyből a minta származik lehet-e olyan, mint amilyennek mi azt a nullhipotézisben feltételezzük. Tanult próbák: Egymintás várható értékre irányuló próba Egymintás sokasági szórásra irányuló próba
Egymintás sokasági szórásra irányuló Paraméteres próbák Egymintás sokasági szórásra irányuló Alkalmazási feltételek: normális eloszlású alapsokaság Nullhipotézis: Lehetséges ellenhipotézisek és elfogadási tartományok: A próbafüggvény χ2 eloszlású (DF=n-1):
Egymintás várható értékre irányuló Paraméteres próbák Egymintás várható értékre irányuló Az alkalmazási feltételek függvényében kétféle próba: egymintás u-próba 0 ismert, nagy mintával dolgozunk (n>30 és a 0-t a korrigált tapasztalati szórással becsüljük) egymintás t-próba 0 nem ismert,, és kis mintánk van Nullhipotézis: H0: =m0, vagyis a várható érték egy adott m0 értékkel egyenlő. Lehetséges ellenhipotézisek: H1: ≠m0 H1: > m0 H1: < m0
Egymintás várható értékre irányuló u-próba Paraméteres próbák Egymintás várható értékre irányuló u-próba Alkalmazás feltétele: normális eloszlású alapsokaság (ismert σ0, vagy n>30) A próbafüggvény N(0;1) eloszlású: Egymintás várható értékre irányuló t-próba Alkalmazás feltétele: normális eloszlású alapsokaság (nem ismert σ0, és n<30) A próbafüggvény Student eloszlású:
Tesztelendő paraméter Alkalmazási feltételek Hipotézisek Próbafüggvény Próbafügg-vény eloszlása Sokasági várható érték Sokasági eloszlás normális sokasági szórás ismert H0: = m0 H1: (1) ≠ m0 (2) > m0 (3) < m0 standard normális (z) sokasági szórás nem ismert Student t-eloszlás (DF=n-1) Sokasági variancia (szórás) H0: σ = σ0 (1) σ ≠ σ0 (2) σ > σ0 (3) σ < σ0 χ2-eloszlás
Paraméteres próbák Kétmintás próbák A kétmintás próbák: két meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb.) sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. A kétmintás próbák két sokaság egymással való összehasonlítását szolgálják. A sokaságok időben, térben vagy bármilyen más tekintetben különbözhetnek egymástól. Tanult próbák: Kétmintás, a sokasági varianciák egyezésére irányuló próba (F-próba) Két, független mintás, várható értékek egyezésére irányuló u-, ill. t- próba
Kétmintás próbák – F-próba Paraméteres próbák Kétmintás próbák – F-próba Alkalmazási feltétel: normális eloszlású, független alapsokaságok Nullhipotézis: Ellenhipotézis: A próbafüggvény F-eloszlású (DF1, DF2, DF1,2=n1,2 -1) Táblázataink is egyoldali próbára vonatkoznak (mégpedig F, DF1, DF2) kritikus értékeit adják meg. A két alapeloszlásból vett n1 és n2 elemű minták korrigált tapasztalati szórásai torzítatlan becslései az alapsokasági szórásoknak. ahol s1*2>s2*2
Kétmintás várható értékre irányuló próbák Paraméteres próbák Kétmintás várható értékre irányuló próbák Két sokaságból két független minta Az alkalmazási feltételek függvényében kétféle próba: kétmintás u-próba Ismert 1 és 2, vagy nagy minták (n1,2>30 és az ismeretlen alapsokasági szórásokat a korrigált tapasztalati szórásokkal becsüljük) kétmintás t-próba Nem ismert 1 és 2, és kis mintáink van Nullhipotézis: H0: 1=2 (vagyis a két sokasági várható érték egyenlő) Lehetséges ellenhipotézisek: H1: 1 ≠ μ2 H1: 1 > μ2 H1: 1 < μ2
Kétmintás várható értékre irányuló próbák Paraméteres próbák Kétmintás várható értékre irányuló próbák Kétmintás u-próba Alkalmazás feltétele: normális eloszlású alapsokaságok, ismert alapsokasági varianciák A próbafüggvény N(0,1) eloszlású: Kétmintás t-próba Alkalmazás feltétele: normális eloszlású alapsokaságok, ismeretlen alapsokasági varianciák kis minták esetén akkor kezelhető, ha az ismeretlen szórásokról tudjuk, hogy azok egyenlők (F-PRÓBA) A próbafüggvény Student eloszlású:
Paraméteres próbák Többmintás próbák A többmintás próbák annak a kérdésnek a vizsgálatára használhatók, hogy több – meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb.) – sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. A többmintás próbák kettőnél több sokaság egymással való összehasonlítására szolgálnak. Tanult próba: Több sokasági szórás (variancia) összehasonlítása (Cochran-próba)
Többmintás szórás próba (Cochran próba) Paraméteres próbák Többmintás szórás próba (Cochran próba) A szórások között talált legnagyobb érték tekinthető-e a többivel azonos eloszlásból származónak. Alkalmazási feltétel: normális eloszlású alapsokaságok, azonos n elemszámú minták (r db sokaságból r db mintánk van) Nullhipotézis: A próbafüggvény:
4. Elméleti eloszlások A valószínűségi változó fogalma, az eloszlásfüggvény és sűrűségfüggvény Diszkrét elméleti eloszlások (binomiális, Poisson) alkalmazási területei, tulajdonságai Folytonos elméleti eloszlások (exponenciális, Gauss) alkalmazási területei, tulajdonságai
A valószínűségi változó fogalma, eloszlásfüggvény, sűrűségfüggvény Ha egy véletlen kísérlethez tartozó eseménytéren minden egyes elemi eseményhez hozzárendelünk egy valós számot, akkor ezt a hozzárendelést valószínűségi változónak nevezzük. A valószínűségi változó jellege Diszkrét: véges, vagy megszámlálhatóan vég- telen sok értéket vehet fel Folytonos: megszámlálhatatlanul végtelen sok értéket vehet fel
F(x) = P( < x ); F(k) = P( < k) Eloszlásfüggvény F(x) = P( < x ); F(k) = P( < k) Tulajdonságai: Monoton növekvő: F(a) F(b), ha a < b Balról folytonos, szakadáshelyein a függvényérték a baloldali határértékkel egyezik meg.
Sűrűségfüggvény f(x) = F’(x) Tulajdonságai: f(x) 0
Diszkrét elméleti eloszlások Binomiális eloszlás Ha egy kísérlet során az „A” esemény bekövetkezését, ill. be nem következését vizsgáljuk – azaz alternatív, két kimenetelű eseményről beszélünk -, s az „A” esemény bekövetkezési valószínűsége P(A) = p, és a kísérletet n-szer egymástól függetlenül megismételjük, akkor ha a vizsgált valószínűségi változó az A esemény bekövetkezésének száma, a valószínűség-eloszlását binomiális eloszlásnak nevezzük.
Diszkrét elméleti eloszlások Poisson eloszlás A kis valószínűségű, vagy ritka események eloszlástörvényének is nevezik. Adott időszak alatt bekövetkező egymástól független véletlen események számát írja le, illetve az ún. véletlen pontelhelyezkedések számát, adott felületen, hosszon, térfogatban stb. Binomiális eloszlás helyettesítése: ha n és p 0 valamint np = áll., akkor a binomiális eloszlás helyettesíthető np = paraméterű Poisson-eloszlással.
Folytonos elméleti eloszlások Exponenciális eloszlás Véletlen hosszúságú időtartamok eloszlása: Emlékezetnélküli Várható érték = szórás A várható értéke nem a leggyakoribb érték
Folytonos elméleti eloszlások Normális eloszlás Leggyakoribb eloszlás a menedzsment területén Arányos skálán mérhető termékjellemzők Több tényező összegződése révén előálló mennyiségek eloszlása Véletlen jellegű mérési hibák matematikai leírása Technológiai folyamatok irányítási algoritmusának kialakítása
Folytonos elméleti eloszlások Normális eloszlás - standardizálás A standard normális eloszlás jelentőségét az adja, hogy bármely N(,) eloszlás F(x) eloszlás függvénye mindig kifejezhető az N(0,1) eloszlás (u) eloszlásfüggvényével: F(x)=(u) Mivel a standard normál eloszlás 0 körül szimmetrikus, ezért: (-u)=1-(u)
Köszönjük a figyelmet!