Matematikai alapok és valószínűségszámítás

Slides:



Advertisements
Hasonló előadás
Nevezetes eloszlások, normál eloszlás
Advertisements

Összetett kísérleti tervek és kiértékelésük:
Események formális leírása, műveletek
A pedagógiai kutatás módszertana
I. előadás.
II. előadás.
Statisztika II. I. Dr. Szalka Éva, Ph.D..
Valószínűségszámítás
2006. február 17. Valószínűségszámítás és statisztika II. Telefonos feladat Egy kalapban van két korong, az egyiknek mindkét oldala piros, a másiknak.
Eseményalgebra Eseményalgebra.
3. Két független minta összehasonlítása
Rangszám statisztikák
Valószínűségszámítás
Matematikai Statisztika VIK Doktori Iskola
Két változó közötti összefüggés
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
Mintavételes eljárások
III. előadás.
Valószínűségszámítás
Regresszióanalízis 10. gyakorlat.
Nem-paraméteres eljárások, több csoport összehasonlítása
Valószínűségszámítás
Kvantitatív módszerek
Matematikai alapok és valószínűségszámítás
Matematikai alapok és valószínűségszámítás
Véletlenszám generátorok
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Statisztika.
Távhőrendszerek hőforrásai Hőigények meghatározása Hőszállítás Épületenergetika B.Sc. 6. félév 2009 február 23.
Kvantitatív Módszerek
Kvantitatív módszerek
Gazdaságstatisztika 11. előadás.
Gazdaságstatisztika 10. előadás.
Gazdaságstatisztika Bevezetés szeptember 11.
Gazdaságstatisztika 12. előadás.
Gazdaságstatisztika 13. előadás.
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Alapfogalmak.
avagy Négy halálos lórugás egy év alatt! Mit tesz a kormány?
Folytonos eloszlások.
Binomiális eloszlás.
Dr Gunther Tibor PhD II/2.
Valószínűségszámítás
I. előadás.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Mintavételes Eljárások.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Valószínűségszámítás III.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
x1 xi 10.Szemnagyság: A szemnagyság megadásának nehézségei
Valószínűségszámítás II.
Többdimenziós valószínűségi eloszlások
Közúti és Vasúti Járművek Tanszék. A ciklusidők meghatározása az elhasználódás folyamata alapján Az elhasználódás folyamata alapján kialakított ciklusrendhez.
 A matematikai statisztika a természet és társadalom tömeges jelenségeit tanulmányozza.  Azokat a jelenségeket, amelyek egyszerre nagyszámú azonos tipusú.
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Valószínűségszámítás és statisztika előadások
II. előadás.
Kvantitatív módszerek MBA és Számvitel mesterszak
Nemparaméteres próbák
I. Előadás bgk. uni-obuda
Valószínűségi változó, eloszlásfüggvény
Gazdaságinformatikus MSc
Előadás másolata:

Matematikai alapok és valószínűségszámítás Valószínűségi eloszlások

Bevezetés Mint a valószínűség tárgyalása során már említettük, a tudományos életben megfigyeléseket teszünk, illetve kísérleteket végzünk különféle jelenségek pontosabb leírására, összefüggések feltárására. Általában, ha egy kísérletet végzünk, az többféle különböző eredményre vezethet, és az, hogy egy adott esetben éppen mi lesz az eredmény, a véletlenen is múlik. Például, ha a vizsgálandó jellemző az iskolai végzettség, akkor egy személy (megfigyelési egység) kiválasztása egy kísérletnek tekinthető, amelynek eredményeként bekövetkezik a vizsgálni kívánt változó valamilyen értéke. Minthogy a megfigyelési egység kiválasztása a statisztikában jellemzően véletlenszerűen történik, a változó adott kísérletben bekövetkező értéke is veletlenszerű lesz, ezért a statisztikai változókat véletlen változóknak is nevezzük.

Bevezetés Arról is volt már szó korábban, hogy egy statisztikai (véletlen) változó akkor jól definiált, ha: Ismert az értékkészlete (mik a lehetséges értékei a változónak) Minden megfigyelési egységhez hozzárendelhető a változó egy, és csakis egy értéke.

A valószínűség eloszlása Egy megfigyelési egység véletlenszerű kiválasztásakor a vizsgálandó változónak bekövetkezik valamilyen értéke, ami egy eseménynek tekinthető. A változó értékei tehát események, melyekre igaz, hogy egymást kölcsönösen kizáró (diszjunkt) események, és hogy ezen diszjunkt események uniója a biztos eseményt adja. Ha a populációból véletlenszerűen kiválasztunk egy megfigyelési egységet, akkor a változó különböző értékei bizonyos valószínűséggel következnek be. A változó értékei valószínűségének összege 1 lesz a fentiekben leírtaknak megfelelően.

A valószínűség eloszlása Ahhoz, hogy egy statisztikai változót pontosan ismerjünk, ismernünk kell az adott változó eloszlását, azaz azt, hogy milyen módon oszlik meg az egységnyi valószínűség a változó különböző értékei között. A változók eloszlása elméletileg végtelen sokféle lehet, azonban szerencsére a gyakorlatban kezelhető számú speciális, jól definiált eloszlás valamelyike jellemző a változók túlnyomó többségére.

Diszkrét változók valószínűségi eloszlása Egy statisztikai változót akkor tekinthetünk diszkrétnek, ha csak véges (kis) számú, egymástól jól elkülönülő értéket vehet fel. Diszkrét változók esetén a változó eloszlását ismerni annyit jelent, mint ismerni az adott változó értékeit és az értékekhez tartozó valószínűségeket. Például, ha ismert egy populációban a nemek aránya, ezáltal relatív gyakorisága, vagyis valószínűsége, akkor azt mondhatjuk, hogy tökéletesen ismerjük a biológiai nem változót.

A Binomiális eloszlás Tekintsük az alábbi, gyakori kísérleti elrendezést: n számú kísérletet, vagy próbát végzünk Minden kísérlet eredménye sikerként vagy kudarcként fogható fel A siker valószínűsége, p, próbáról próbára állandó Az egyes próbák egymástól függetlenek Az ilyen kísérleti elrendezés esetén a változó Binomialis eloszlást követ n és p paraméterekkel. Jelölése: B(n,p). A különböző paraméterekkel jellemezhető binomiális eloszlások egymástól különbözőek lesznek.

A Binomiális eloszlás Példa: pénzérmét dobunk egymás után négyszer Kérdés: hányszor lesz fej a dobás eredménye a négy dobásból? Ez a kérdésfeltevés egy statisztikai változót definiál, amit nevezhetünk például ‘fejek száma’ változónak. Lehetséges kimenetek: 0, 1, 2, 3, 4 ? Mi a valószínűsége ezeknek a kimeneteknek?

A Binomiális eloszlás Annak, hogy 4-szer lesz fej a 4 dobásból p(4)=1/16 a valószínűsége. Ez a kimenet csak egyféleképpen fordulhat elő. 3 fej valószínűsége már p(3)=4/16 mert 3 fej négyféle elrendezésben fordulhat elő. 2 fej valószínűsége már p(2)=6/16 lesz, mert ez a kimenet hatféleképpen eshet meg. Ugyanígy a további kimenetekre is kiszámolható, hogy milyen valószínűséggel fordulhatnak elő.

A Binomiális eloszlás A binomiális eloszlásnak tehát két fontos paramétere van, a próbák száma, n és az egyes próbák esetén a siker (azaz a bennünket érdeklő kimenet) valószínűsége, p. Ahogy n nő, úgy nő a lehetséges kimenetek száma, úgy oszlik meg egyre több érték között a valószínűség. Amennyiben p = 0.5 a binomiális eloszlás szimmetrikus lesz, egyéb esetekben pedig aszimmetrikus, annál aszimmetrikusabb, minél inkább eltér a valószínűség 0.5-től 0 vagy 1 irányába. Fontos, hogy az egyes kimenetek diszjunkt események, uniójuk pedig a teljes eseményt adja, azaz uniójuk valószínűsége 1.

Példánkban a binomiális eloszlás a következőképpen adható meg:

A B(4, 0.5) eloszlás grafikus reprezentációja

Kumulatív valószínűség Az egyes értékek valószínûsége mellett a kumulatív valószínûség is meghatározható, ami egy adott érték vagy annál kisebb érték bekövetkezésének valószínûségét adja meg. A kumulatív valószínûség nagyon fontos szerepet játszik a statisztikában, pontosabban a statisztikai hipotézisvizsgálatok során. A következő dián a példánkban szereplő Binomialis eloszlás esetén az értékek kumulatív valószínűségei láthatók.

A B(4, 0.5) eloszlás kumulatív valószínűségei

A B(4, 0.5) eloszlás kumulatív valószínűségei grafikusan

Néhány Binomiális eloszlás grafikus reprezentációja: B(10, 0.5)

B(10, 0.25)

B(10, 0.75)

Kumulatív valószínűségi táblázat és használata A különböző binomialis eloszlások értékeihez tartozó kumulatív valószínűségek megtalálhatók táblázatba foglalva, illetve kiszámíthatóak például az R statisztikai szoftver használatával. Táblázatok használatakor meg kell keresni azt a táblázatot, amelyik a keresett paraméterekkel rendelkező binomiális eloszláshoz tartozik, és ebben meg kell keresni a kérdéses értékhez tartozó kumulatív valószínűségi értéket. Az R szoftver esetén a pbinom(érték,n,p) parancs alkalmazásával kaphatjuk meg az ‘érték’-hez tartozó kumulatív valószínűséget, az n és p paraméterekkel leírható Binomiális eloszlás esetén.

A normál eloszlás Folytonos változók esetén az eloszlás meghatározása nem olyan egyszerű, mint diszkrét változók esetén. Ebben az esetben nem sorolhatók fel a változó értékei, mert végtelen sok érték lehet, és az egyes konkrét értékek valószínűsége rendkívül csekély. Folytonos változók esetén nem a konkrét értékek valószínűségét, hanem egy adott szakaszra esés valószínűségét adjuk meg, tehát például annak a valószínűségét, hogy az IQ 109.5 és 110.5 közé esik. Folytonos változók esetén is végtelen sokféle eloszlás képzelhető el, de vannak bizonyos kitüntetett eloszlások, melyek közül a legjelentősebb a normál eloszlás. A normál eloszlást szokás Gauss-görbének, vagy haranggörbének is nevezni.

Néhány normál eloszlás sűrűségfüggvénye:

A Normál eloszlás A normál eloszlásnak, a binomiális eloszláshoz hasonlóan, szintén két jellemző paramétere van, az átlag, µ, (az eloszlás helye), és a szórás, σ (az eloszlás skála paramétere). A normál eloszlás jelölése: N( µ, σ) A normál eloszlás sűrűségfüggvénye a következőképpen írható fel:

A Normál eloszlás Normál eloszlás esetán is igaz az, hogy az egyes értékek diszjunkt esemányeknek tekinthetők, és uniójuk a biztos eseményt adja, azaz az értékek valószínűségének összege 1. Tehát a sűrűségfüggvény alatti terület 1 lesz, mert ez adja meg a biztos esemény bekövetkezésének valószínűségét. Annak valószínűségét, hogy egy érték egy bizonyos szakaszra esik, a sűrűségfüggvény adott szakasz fölé eső része alatti területként definiálhatjuk.

Kumulatív eloszlásfüggvény Folytonos változók eloszlásai, így a normál eloszlás esetén is definiálható a kumulatív valószínűség, ami tehát egy adott érték vagy annál kisebb érték bekövetkezésének valószínűsége.

Normál eloszlás kumulatív eloszlásfüggvénye:

Normál eloszlás A természetben nagyon sok változóról elmondható, hogy normál eloszlást (vagy legalábbis jó közelítéssel normál eloszlást) követ. Ennek oka, hogy számtalan változó nagyszámú faktor átlagos hatásának eredményeként alakul ki. Ennek tudományos alapjául a centrális határeloszlás elmélet szolgál, mely szerint ha sokszor veszünk megfelelően nagy, azonos elemszámú mintát, akkor a minták átlagai mindig normál eloszlást követnek, függetlenül az eredeti eloszlástól. Ha például a testmagasságot, mint véletlen változót tekintjük, elmondható, hogy sok gén működése befolyásolja az értékét, de egyéb, például környezeti hatások, vagy táplálkozási szokások, stb. is hatással vannak rá.

Normál eloszlás Az átlag körüli értékek előfordulásának valószínűsége lényegesen nagyobb lesz, mint extrémebb értékek előfordulásáé, mert átlagos, vagy ahhoz közeli értékek a befolyásoló faktorok értékeinek lényegesen többféle kombinációjának eredményeképpen kialakulhatnak, mint extrémebb értékek. (Extrémebb értékek bekövetkezéséhez az szükséges, hogy az egyes befolyásoló faktorok értékei is extrémek legyenek, aminek kisebb a valószínűsége, mint annak, hogy a faktorok értékei vegyesen extrémek, kevésbé extrémek, vagy éppen a másik szélsőséget képviselik.)

Standardizálás, z-értékek Bár sok változó követ normál eloszlást, a különböző változók legtöbbször nem azonos, vagy összehasonlítható egységekben vannak kifejezve. Bizonyára mindenki számára nyilvánvaló, hogy a 71 kg-os testsúly közvetlenül nem hasonlítható össze a Beck Depression Invetory-n (BDI; egy gyakran használt depresszió kérdőív) elért 16-os pontszámmal.

Standardizálás, z-értékek Tegyük fel, hogy egy diák a statisztika vizsgán 60 pontot szerez, az anatómia vizsgán pedig 70-et. A statisztika pontszámok átlaga 50, szórása 5, az anatómia pontszámok átlaga 55, szórása 10. Melyik vizsgán teljesített jobban a diák? Ahhoz, hogy ezt a kérdést meg tudjuk válaszolni, a két eloszlást "közös nevezőre" kell hozni. Ennek módja, ha a kérdéses értékeket standardizáljuk, azaz a nyers pontértékekből kiszámoljuk a z-értéket.

Standardizálás, z-értékek Tehát, ha adott egy normál eloszlású véletlen változó, X, (X ~ N( µ, σ) ) akkor ezen X változó egy x értékéhez tartozó z érték a következőképpen számolható: Ha egy normál eloszlást követő változó minden értékét standardizáljuk, akkor az így kapott z értékek normál eloszlást fognak követni 0 átlaggal, és 1 szórással, függetlenül az eredeti normál eloszlás paramétereitől. A 0 átlagú, 1 szórású normál eloszlást standard normál eloszlásnak nevezzük, és N(0,1) –el jelöljük.

Standardizálás, z-értékek Visszatérve kiinduló példánkhoz, a következőket ismerjük: Tehát a példában szereplő diák statisztikából teljesített jobban.

Kumulatív valószínűségi táblázat és használata A standard normál eloszlás (z) értékeihez tartozó kumulatív valószínűségek is megtalálhatók táblázatba foglalva, illetve kiszámíthatóak például az R statisztikai szoftver használatával. Normál eloszlások esetén elegendő a standard normál eloszlást alkotó z értékek kumulatív valószínűségi értékeit táblázatba foglalni, mivel bármely normál eloszlás átalakítható standard normál eloszlásúra. Az R szoftver esetén a pnorm(érték,µ,σ) parancs alkalmazásával kaphatjuk meg az ‘érték’-hez tartozó kumulatív valószínűséget, az µ és σ paraméterekkel leírható Normál eloszlás esetén.