Valószínűségszámítás - Statisztika
P Két kockával dobunk, összeadjuk az értékeket Mindegyik érték előfordulási valószínűsége azonos Teljes eseménytér
Mekkorák a valószínűségek? P(2)=1/36 P(3)=2/36 P(4)=3/36 P(5)=4/36 P(6)=5/36 P(7)=6/36 P(8)=5/36 P(9)=4/36 P(10)=3/36 P(11)=2/36 P(12)=1/36
Sűrűség - eloszlásfüggvény SűrűségfüggvényEloszlásfüggvény
Mi annak a valószínűsége, hogy a kapott érték 6nál kisebb? P(ξ≤5)=? f(2)+f(3)+f(4)+f(5)F(5)
Mi annak a valószínűsége, hogy a kapott érték 3 és 5 között lesz? P(3≤ξ≤5)=? f(3)+f(4)+f(5) F(5)-F(2)
Diszkrét-folytonos valószínűségi változó Diszkrét: pl kockadobás Folytonos: pl. palackban a folyadék,testsúly
Standard normális eloszlás Standardizálás SűrűségfüggvényEloszlásfüggvény
1, 2, 3 szórás intervallumához tartozó valószínűségek
Diszkrét változó normális eloszlása (normalitásvizsgálat)
P(a≤ξ≤b)=? ab ab P(a≤ξ≤b) (a sűrűségfüggvény területe a és b között) P(a≤ξ≤b)=F(b)-F(a) Példa terület
Hipotézisvizsgálat H o – Nullhipotézis A vizsgált változó átlaga statisztikai szempontból megegyezik az előre megadott m értékkel Vagy A vizsgált minták átlagai megegyeznek Vagy A változók között nincs kapcsolat, összefüggés (korreláció) Döntés: hipotézisvizsgálattal P≥PszignifikanciaP<Pszignifikancia H o elfogadomH o elutasítom
Különbségvizsgálat Korrelációanalízis 1 változó 2 vagy több változó Kérdés: Van-e különbség az adatsorok között? Kérdés: Van-e kapcsolat- korreláció a változók között? H 0 -nullhipotézis: Nincs különbség az adatsorok között! Nincs kapcsolat-korreláció a változók között!
Két összetartozó minta összehasonlítása Két mérés, egy minta – Kísérlet Előtt-Után ElőttUtán Eltérés Páros t-próba – Egymintás t próba a különbségekre Példa
t= 2,36 t (0,05;4) =2,776 < p (t=2,36) =0,077>0,05 H 0 -t elfogadjuk 2,36 t (0,05;4) =2,776
t- (student) eloszlás SűrűségfvEloszlásfv.
Döntés a konfidenciaintervallum alapján Konfidenciaintervallum: (átlag – t SE, átlag + t SE ) 95%-os konfidenciaintervallum: t (0,05;4) =2,776 átlag=1,6 SD=1,51 SE=0,675 95%CI=(1,6-2,7760,675; 1,6+2,7760,675) 95%CI=(-0,27; 3,47) Ha H0 igaz, akkor a 0 benne van a konfidencia- intervallumban H 0 -t elfogadjuk SE a minta átlagának szórása
Két összetartozó minta összehasonlítása II. Vizsgált személy Testsúly a diéta előtt Testsúly a diéta után Különbség Átlag90,886,84 SD10,799,253,333 Páros t-próba – Egymintás t próba a különbségekre Példa
t( 0,05;4) =2,262 (two tailed) 3,795 t>t (0,05;4) H 0 -t elutasítjuk p (f=9,t=3,795) =0,00425<p 0 =0,05 H 0 -t elutasítjuk Biostatisztika Fidy Judit dr., Makara Gábor dr. (2005) InforMed 2002 Kft.
1 mintás t próba – adott értékhez viszonyított eltérés Egy gyárban egy gépnek 500 gr töltőanyagot kell a konzervekbe juttatnia minden töltéskor. A töltőanyag egyenetlenségéből adódóan a gép néha kicsit többet, néha kicsit kevesebbet tölt, mint 500 gr. Arra vagyunk kíváncsiak, hogy a gép átlagos "teljesítménye" 500 gr-nak mondható-e. Kiveszünk 10 konzervet a futószalagról és megmérjük mindben a töltőanyag súlyát. Az eredmények rendre 483, 502, 498, 496, 502, 483, 494, 491, 505, 486. Azt látjuk, hogy a töltőanyag súlya többnyire valóban nem tér el az 500 gr-tól nagyon, az átlag = 494. Példa
tp=t 0.05 =2,262 t ≈ 2,36 miatt 2,3 > 2,262 = azaz t ≥ tp teljesül. H 0 -t elutasítjuk
Két független minta összehasonlítása 2 mintás t próba Vizsgálati csoport Vizsgált személy Testsúlyv áltozás Diéta Átlag4 SD3,333 Kontroll Átlag1 SD2,145 Nem kritérium az azonos elemszám
Jelölje m és n a két minta elemszámát n+m-2 a szabadságfok A szabadságfok= =19. A táblabeli kritikus érték t (0.05,19) = 2,093. t<t 0,05 H 0 -t elfogadjuk t=2,046 p (f=19,t=2,046) =0,054>p 0 =0,05 2,046 2,093
Korreláció - regresszióanalízis Kérdés: Van-e kapcsolat két (vagy több) változó között? Milyen „erős” a kapcsolat, lehet-e számszerüsíteni? Példa: XY
r: korrelációs együttható XY
r 2 =0.839 t=3.93 t (0.05;4) =2.776 t>t (0.05;4) p=0.02 H 0 -t elutasítom Van kapcsolat, korreláció!
Regressziós egyenes XY