Matematikai alapok és valószínűségszámítás

Matematikai alapok és valószínűségszámítás
Valószínűségi eloszlások

Bevezetés Mint a valószínűség tárgyalása során már említettük, a tudományos életben megfigyeléseket teszünk, illetve kísérleteket végzünk különféle jelenségek pontosabb leírására, összefüggések feltárására. Általában, ha egy kísérletet végzünk, az többféle különböző eredményre vezethet, és az, hogy egy adott esetben éppen mi lesz az eredmény, a véletlenen is múlik. Például, ha a vizsgálandó jellemző az iskolai végzettség, akkor egy személy (megfigyelési egység) kiválasztása egy kísérletnek tekinthető, amelynek eredményeként bekövetkezik a vizsgálni kívánt változó valamilyen értéke. Minthogy a megfigyelési egység kiválasztása a statisztikában jellemzően véletlenszerűen történik, a változó adott kísérletben bekövetkező értéke is veletlenszerű lesz, ezért a statisztikai változókat véletlen változóknak is nevezzük.

Bevezetés Arról is volt már szó korábban, hogy egy statisztikai (véletlen) változó akkor jól definiált, ha: Ismert az értékkészlete (mik a lehetséges értékei a változónak) Minden megfigyelési egységhez hozzárendelhető a változó egy, és csakis egy értéke.

A valószínűség eloszlása
Egy megfigyelési egység véletlenszerű kiválasztásakor a vizsgálandó változónak bekövetkezik valamilyen értéke, ami egy eseménynek tekinthető. A változó értékei tehát események, melyekre igaz, hogy egymást kölcsönösen kizáró (diszjunkt) események, és hogy ezen diszjunkt események uniója a biztos eseményt adja. Ha a populációból véletlenszerűen kiválasztunk egy megfigyelési egységet, akkor a változó különböző értékei bizonyos valószínűséggel következnek be. A változó értékei valószínűségének összege 1 lesz a fentiekben leírtaknak megfelelően.

A valószínűség eloszlása
Ahhoz, hogy egy statisztikai változót pontosan ismerjünk, ismernünk kell az adott változó eloszlását, azaz azt, hogy milyen módon oszlik meg az egységnyi valószínűség a változó különböző értékei között. A változók eloszlása elméletileg végtelen sokféle lehet, azonban szerencsére a gyakorlatban kezelhető számú speciális, jól definiált eloszlás valamelyike jellemző a változók túlnyomó többségére.

Diszkrét változók valószínűségi eloszlása
Egy statisztikai változót akkor tekinthetünk diszkrétnek, ha csak véges (kis) számú, egymástól jól elkülönülő értéket vehet fel. Diszkrét változók esetén a változó eloszlását ismerni annyit jelent, mint ismerni az adott változó értékeit és az értékekhez tartozó valószínűségeket. Például, ha ismert egy populációban a nemek aránya, ezáltal relatív gyakorisága, vagyis valószínűsége, akkor azt mondhatjuk, hogy tökéletesen ismerjük a biológiai nem változót.

A Binomiális eloszlás Tekintsük az alábbi, gyakori kísérleti elrendezést: n számú kísérletet, vagy próbát végzünk Minden kísérlet eredménye sikerként vagy kudarcként fogható fel A siker valószínűsége, p, próbáról próbára állandó Az egyes próbák egymástól függetlenek Az ilyen kísérleti elrendezés esetén a változó Binomialis eloszlást követ n és p paraméterekkel. Jelölése: B(n,p). A különböző paraméterekkel jellemezhető binomiális eloszlások egymástól különbözőek lesznek.

A Binomiális eloszlás Példa: pénzérmét dobunk egymás után négyszer
Kérdés: hányszor lesz fej a dobás eredménye a négy dobásból? Ez a kérdésfeltevés egy statisztikai változót definiál, amit nevezhetünk például ‘fejek száma’ változónak. Lehetséges kimenetek: 0, 1, 2, 3, 4 ? Mi a valószínűsége ezeknek a kimeneteknek?

A Binomiális eloszlás Annak, hogy 4-szer lesz fej a 4 dobásból p(4)=1/16 a valószínűsége. Ez a kimenet csak egyféleképpen fordulhat elő. 3 fej valószínűsége már p(3)=4/16 mert 3 fej négyféle elrendezésben fordulhat elő. 2 fej valószínűsége már p(2)=6/16 lesz, mert ez a kimenet hatféleképpen eshet meg. Ugyanígy a további kimenetekre is kiszámolható, hogy milyen valószínűséggel fordulhatnak elő.

A Binomiális eloszlás A binomiális eloszlásnak tehát két fontos paramétere van, a próbák száma, n és az egyes próbák esetén a siker (azaz a bennünket érdeklő kimenet) valószínűsége, p. Ahogy n nő, úgy nő a lehetséges kimenetek száma, úgy oszlik meg egyre több érték között a valószínűség. Amennyiben p = 0.5 a binomiális eloszlás szimmetrikus lesz, egyéb esetekben pedig aszimmetrikus, annál aszimmetrikusabb, minél inkább eltér a valószínűség 0.5-től 0 vagy 1 irányába. Fontos, hogy az egyes kimenetek diszjunkt események, uniójuk pedig a teljes eseményt adja, azaz uniójuk valószínűsége 1.

Példánkban a binomiális eloszlás a következőképpen adható meg:

A B(4, 0.5) eloszlás grafikus reprezentációja

Kumulatív valószínűség
Az egyes értékek valószínûsége mellett a kumulatív valószínûség is meghatározható, ami egy adott érték vagy annál kisebb érték bekövetkezésének valószínûségét adja meg. A kumulatív valószínûség nagyon fontos szerepet játszik a statisztikában, pontosabban a statisztikai hipotézisvizsgálatok során. A következő dián a példánkban szereplő Binomialis eloszlás esetén az értékek kumulatív valószínűségei láthatók.

A B(4, 0.5) eloszlás kumulatív valószínűségei

A B(4, 0.5) eloszlás kumulatív valószínűségei grafikusan

Néhány Binomiális eloszlás grafikus reprezentációja: B(10, 0.5)

B(10, 0.25)

B(10, 0.75)

Kumulatív valószínűségi táblázat és használata
A különböző binomialis eloszlások értékeihez tartozó kumulatív valószínűségek megtalálhatók táblázatba foglalva, illetve kiszámíthatóak például az R statisztikai szoftver használatával. Táblázatok használatakor meg kell keresni azt a táblázatot, amelyik a keresett paraméterekkel rendelkező binomiális eloszláshoz tartozik, és ebben meg kell keresni a kérdéses értékhez tartozó kumulatív valószínűségi értéket. Az R szoftver esetén a pbinom(érték,n,p) parancs alkalmazásával kaphatjuk meg az ‘érték’-hez tartozó kumulatív valószínűséget, az n és p paraméterekkel leírható Binomiális eloszlás esetén.

A normál eloszlás Folytonos változók esetén az eloszlás meghatározása nem olyan egyszerű, mint diszkrét változók esetén. Ebben az esetben nem sorolhatók fel a változó értékei, mert végtelen sok érték lehet, és az egyes konkrét értékek valószínűsége rendkívül csekély. Folytonos változók esetén nem a konkrét értékek valószínűségét, hanem egy adott szakaszra esés valószínűségét adjuk meg, tehát például annak a valószínűségét, hogy az IQ és közé esik. Folytonos változók esetén is végtelen sokféle eloszlás képzelhető el, de vannak bizonyos kitüntetett eloszlások, melyek közül a legjelentősebb a normál eloszlás. A normál eloszlást szokás Gauss-görbének, vagy haranggörbének is nevezni.

Néhány normál eloszlás sűrűségfüggvénye:

A Normál eloszlás A normál eloszlásnak, a binomiális eloszláshoz hasonlóan, szintén két jellemző paramétere van, az átlag, µ, (az eloszlás helye), és a szórás, σ (az eloszlás skála paramétere). A normál eloszlás jelölése: N( µ, σ) A normál eloszlás sűrűségfüggvénye a következőképpen írható fel:

A Normál eloszlás Normál eloszlás esetán is igaz az, hogy az egyes értékek diszjunkt esemányeknek tekinthetők, és uniójuk a biztos eseményt adja, azaz az értékek valószínűségének összege 1. Tehát a sűrűségfüggvény alatti terület 1 lesz, mert ez adja meg a biztos esemény bekövetkezésének valószínűségét. Annak valószínűségét, hogy egy érték egy bizonyos szakaszra esik, a sűrűségfüggvény adott szakasz fölé eső része alatti területként definiálhatjuk.

Kumulatív eloszlásfüggvény
Folytonos változók eloszlásai, így a normál eloszlás esetén is definiálható a kumulatív valószínűség, ami tehát egy adott érték vagy annál kisebb érték bekövetkezésének valószínűsége.

Normál eloszlás kumulatív eloszlásfüggvénye:

Normál eloszlás A természetben nagyon sok változóról elmondható, hogy normál eloszlást (vagy legalábbis jó közelítéssel normál eloszlást) követ. Ennek oka, hogy számtalan változó nagyszámú faktor átlagos hatásának eredményeként alakul ki. Ennek tudományos alapjául a centrális határeloszlás elmélet szolgál, mely szerint ha sokszor veszünk megfelelően nagy, azonos elemszámú mintát, akkor a minták átlagai mindig normál eloszlást követnek, függetlenül az eredeti eloszlástól. Ha például a testmagasságot, mint véletlen változót tekintjük, elmondható, hogy sok gén működése befolyásolja az értékét, de egyéb, például környezeti hatások, vagy táplálkozási szokások, stb. is hatással vannak rá.

Normál eloszlás Az átlag körüli értékek előfordulásának valószínűsége lényegesen nagyobb lesz, mint extrémebb értékek előfordulásáé, mert átlagos, vagy ahhoz közeli értékek a befolyásoló faktorok értékeinek lényegesen többféle kombinációjának eredményeképpen kialakulhatnak, mint extrémebb értékek. (Extrémebb értékek bekövetkezéséhez az szükséges, hogy az egyes befolyásoló faktorok értékei is extrémek legyenek, aminek kisebb a valószínűsége, mint annak, hogy a faktorok értékei vegyesen extrémek, kevésbé extrémek, vagy éppen a másik szélsőséget képviselik.)

Standardizálás, z-értékek
Bár sok változó követ normál eloszlást, a különböző változók legtöbbször nem azonos, vagy összehasonlítható egységekben vannak kifejezve. Bizonyára mindenki számára nyilvánvaló, hogy a 71 kg-os testsúly közvetlenül nem hasonlítható össze a Beck Depression Invetory-n (BDI; egy gyakran használt depresszió kérdőív) elért 16-os pontszámmal.

Tegyük fel, hogy egy diák a statisztika vizsgán 60 pontot szerez, az anatómia vizsgán pedig 70-et. A statisztika pontszámok átlaga 50, szórása 5, az anatómia pontszámok átlaga 55, szórása 10. Melyik vizsgán teljesített jobban a diák? Ahhoz, hogy ezt a kérdést meg tudjuk válaszolni, a két eloszlást "közös nevezőre" kell hozni. Ennek módja, ha a kérdéses értékeket standardizáljuk, azaz a nyers pontértékekből kiszámoljuk a z-értéket.

Tehát, ha adott egy normál eloszlású véletlen változó, X, (X ~ N( µ, σ) ) akkor ezen X változó egy x értékéhez tartozó z érték a következőképpen számolható: Ha egy normál eloszlást követő változó minden értékét standardizáljuk, akkor az így kapott z értékek normál eloszlást fognak követni 0 átlaggal, és 1 szórással, függetlenül az eredeti normál eloszlás paramétereitől. A 0 átlagú, 1 szórású normál eloszlást standard normál eloszlásnak nevezzük, és N(0,1) –el jelöljük.

Visszatérve kiinduló példánkhoz, a következőket ismerjük: Tehát a példában szereplő diák statisztikából teljesített jobban.

Kumulatív valószínűségi táblázat és használata
A standard normál eloszlás (z) értékeihez tartozó kumulatív valószínűségek is megtalálhatók táblázatba foglalva, illetve kiszámíthatóak például az R statisztikai szoftver használatával. Normál eloszlások esetén elegendő a standard normál eloszlást alkotó z értékek kumulatív valószínűségi értékeit táblázatba foglalni, mivel bármely normál eloszlás átalakítható standard normál eloszlásúra. Az R szoftver esetén a pnorm(érték,µ,σ) parancs alkalmazásával kaphatjuk meg az ‘érték’-hez tartozó kumulatív valószínűséget, az µ és σ paraméterekkel leírható Normál eloszlás esetén.

Matematikai alapok és valószínűségszámítás

Hasonló előadás

Az előadások a következő témára: "Matematikai alapok és valószínűségszámítás"— Előadás másolata:

Hasonló előadás

Projectumról

Visszajelzés

Bejelentkezés

A társadalmi hálózaton keresztül belépni:

Matematikai alapok és valószínűségszámítás

Hasonló előadás

Az előadások a következő témára: "Matematikai alapok és valószínűségszámítás"— Előadás másolata:

Hasonló előadás

Projectumról

Visszajelzés