Kvantitatív módszerek Hipotézisvizsgálatok Paraméteres próbák.

Slides:



Advertisements
Hasonló előadás
Hipotézis-ellenőrzés (Statisztikai próbák)
Advertisements

4. Két összetartozó minta összehasonlítása
I. előadás.
II. előadás.
BECSLÉS A sokasági átlag becslése
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Rangszám statisztikák
Feladat Egy új kísérleti készítmény hatását szeretnék vizsgálni egereken. 5 féle dózist adnak be 5 vizsgált egérnek, de nem sikerült mindegyik egérnek.
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Környezeti statisztika Dr. Huzsvai László egyetemi docens Debrecen2008.
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Statisztika II. V. Dr. Szalka Éva, Ph.D..
Regresszióanalízis 10. gyakorlat.
Varianciaanalízis 12. gyakorlat.
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Kvantitatív módszerek 8. Hipotézisvizsgálatok I. Nemparaméteres próbák Dr. Kövesi János.
Nemparaméteres próbák Statisztika II., 5. alkalom.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
STATISZTIKA II. 6. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Kvantitatív Módszerek
Kvantitatív módszerek
Valószínűségszámítás
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika Hipotézisvizsgálatok Nemparaméteres próbák II. 17. előadás.
Gazdaságstatisztika 18. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Hipotézis vizsgálat.
t A kétoldalú statisztikai próba alapfogalmai
Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek.
Paleobiológiai módszerek és modellek 4. hét
I. előadás.
A szóráselemzés gondolatmenete
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Kvantitatív módszerek Becsléselmélet október 15.
Gazdaságstatisztika Becsléselmélet október 30. és november 5.
Gazdaságstatisztika Hipotézisvizsgálatok Paraméteres próbák november 19., november 20., november 26.
Kvantitatív módszerek
Konzultáció november 19. Nemparaméteres próbák, egymintás próbák
Paraméteres próbák- gyakorlat
Hipotézisvizsgálatok Paraméteres próbák
Hipotézisvizsgálatok
Nemparaméteres próbák
Kiváltott agyi jelek informatikai feldolgozása 2016
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
II. előadás.
Kvantitatív módszerek MBA és Számvitel mesterszak
Becsléselmélet - Konzultáció
Gazdaságstatisztika konzultáció
Kvantitatív módszerek
Nemparaméteres próbák
I. Előadás bgk. uni-obuda
III. zárthelyi dolgozat konzultáció
Hipotézisvizsgálatok Paraméteres próbák
Sztochasztikus kapcsolatok I. Asszociáció
Nemparaméteres próbák
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
1.3. Hipotézisvizsgálat, statisztikai próbák
3. Varianciaanalízis (ANOVA)
Előadás másolata:

Kvantitatív módszerek Hipotézisvizsgálatok Paraméteres próbák

A próbák osztályozása Mi a nullhipotézisük tárgya: – paraméteres és nemparaméteres próbák Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek: – A paraméteres próbák alkalmazási feltételei között szerepelnek a sokaság eloszlásának típusára, egyes paramétereire vonatkozó kívánalmak – A nemparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásának folytonosságát követeli meg Hány és mekkora minta szükséges a végrehajtásukhoz – Egy, két vagy többmintás próbák – Független és páros mintás próbák – Kis- és nagymintás próbák

Az egymintás próbák mindig egy adott sokaság valamely jellemzőjére vagy valamely változó szerinti eloszlására vonatkozó feltevések helyességének ellenőrzésére szolgálnak. A rendelkezésre álló egyetlen minta jellegzetességeit valamely feltételezett vagy kívánatos állapothoz viszonyítják. Így annak a kérdésnek a megválaszolására alkalmasak, hogy az a sokaság, amelyből a minta származik lehet-e olyan, mint amilyennek mi azt a nullhipotézisben feltételezzük. – Egymintás várható értékre irányuló próba – Egymintás sokasági szórásra irányuló próba – Egymintás sokasági arányra irányuló próba Egymintás próbák

Szórásnégyzetre irányuló próba Alkalmazási feltétel: normális eloszlású alapsokaság H 0 helyessége esetén a próbafüggvény n-1 szabadságfokú χ 2 - eloszlást követ. H 0 :  2 =  0 2 (H 0 :  =  0 ) n = mintaszám s * = a mintából számolt korrigált tapasztalati szórás

A próba végrehajtásának kritikus értékei Kétoldali H 1 :    0  2 1-  /2 <  2 sz <  2  /2 H 1 :  >  0  2 sz <  2  H 1 :  <  0  2 sz >  2 1-  Bal oldali Jobb oldali Elfogadási tartomány

Példa Egy élelmiszeripari cég egyik gyártósora margarint tölt műanyag dobozokba. Ismert, hogy a gyártósorról lekerülő dobozok nettó töltősúlya normális eloszlású 4 gramm szórással. Az előírás szerint a dobozok átlagos töltősúlyának 250 grammnak kell lenni. A gyártósorról lekerülő termékekből egy 10 elemű FAE mintát veszünk, amelyeknek grammban kifejezett töltősúlya a következő: 255, 242, 245, 253, 249, 251, 250, 255, 245, 246 Ellenőrizzük a minta felhasználásával a megfogalmazott nullhipotézisek teljesülését 10%-os szignifikancia szinten! egymintás, sokasági szórásra és várható értékre vonatkozó próba

Példa megoldása H 0 :  = 4 (  2 = 4 2 ) H 1 :  ≠ 4 (  2 ≠ 4 2 )  /2 = 0,05; DF = 9;  2  /2 =16,92;  2 1-  /2 =3,325 Elfogadási tartomány: 3,325<  2 sz <16,9 H 1 :  > 4 (  2 > 4 2 )  = 0,1; DF = 9;  2  =14,684 Elfogadási tartomány:  2 sz <14,684 A próbastatisztika értéke:  2 sz mindkét ellenhipotézis mellett az elfogadási tartományba esik, ezért H 0 -t 10%-os szignifikancia szinten elfogadjuk. n=10 s*= 4,508 gramms* 2 = 20,32

Gyakorló példa Egy esztergagép-gyártó feltételezi, hogy a gépei nagyon pontosan (kis szórással) dolgoznak. Ezt a feltevését azzal támasztja alá, hogy a megmunkált alkatrészek közelítőleg normális eloszlású átmérőjének varianciája: σ 0 2 =0,01. Egy 31 elemből álló kísérleti szériában a varianciára s* 2 =0,012 adódott. Tekinthető-e hamisnak a gyártó által megadott variancia adat? (5%)

Gyakorló példa Egy konzervgyárban burgonyát használnak fel. Csomagolási okok miatt a burgonyák súlya nem nagyon szóródhat. Másfelől a gyárat a súlykülönbségek is érdeklik, mert a különböző burgonyákat futószalag-módszerrel tudják kiválogatni. Ezért az átlagos súlykülönbségnek (szóródásnak) 5 grammnak kell lennie. Az „A” termelő által felajánlott burgonyából vett n=16 elemű mintában a szórásra s*=3,8 gramm adódott. A „B” termelő által ajánlott n=101 elemű minta alapján s*=6,6 gramm adódott. Ellenőrizze 1%-os szignifikancia szinten, hogy az átlagos súlykülönbség lehet-e 5 gramm!

Várható értékre irányuló próbák Egymintás z-, vagy t- próba. H 0 : μ=m 0, vagyis a várható érték egy adott m 0 értékkel egyenlő. Egymintás z-próba alkalmazási feltétele: – A véletlen minta ismert σ 2 varianciájú normális eloszlásból származik – a standardizált mintaátlag a minta nagyságára való tekintet nélkül N(0,1) eloszlást követ:

Várható értékre irányuló próbák Egymintás t-próba alkalmazási feltétele: A véletlen minta normális eloszlású sokaságból származik nem követeli meg a sokasági eloszlás szórásának ismeretét Ha a H 0 helyes, és a sokaság eloszlása valóban normális, akkor a próbafüggvény n-1 szabadságfokú Student t-eloszlást követ: DF=n-1

Várható értékre irányuló próbák H 1 : μ  μ 0 -z α/2 < z sz < z α/2 Elfogadási tartomány -t α/2 < t sz < t α/2 Kétoldali KritikusElfogadási α/2 1-α Kritikus α/2 z  /2 /t  /2 -z  /2 /-t  /2

Várható értékre irányuló próbák H 1 : μ > μ 0 z sz < z  Bal oldali Jobb oldali t sz < t  H 1 : μ < μ 0 z sz >- z  t sz >- t  Kritikus Elfogadási α 1-α -z  /-t  KritikusElfogadási α 1-α z  /t  Elfogadási tartomány

z-próbat-próba egyoldalikétoldaliegyoldalikétoldali H0H0  = m 0 H1H1  > m 0 ( < m 0 )   m 0  > m 0 ( < m 0 )   m 0 próba- statisz- tika Elutasí- tási tarto- mány z sz > z  (z sz < -z  ) z sz z /2 t sz > t  (t sz < -t  ) t sz < -t /2 vagy t sz > t /2 feltételek  ismert v. n > 30 DF=n-1

Példa Egy élelmiszeripari cég egyik gyártósora margarint tölt műanyag dobozokba. Ismert, hogy a gyártósorról lekerülő dobozok nettó töltősúlya normális eloszlású 4 gramm szórással. Az előírás szerint a dobozok átlagos töltősúlyának 250 grammnak kell lenni. A gyártósorról lekerülő termékekből egy 10 elemű FAE mintát veszünk, amelyeknek grammban kifejezett töltősúlya a következő: 255, 242, 245, 253, 249, 251, 250, 255, 245, 246 Ellenőrizzük a minta felhasználásával a megfogalmazott nullhipotézisek teljesülését 10%-os szignifikancia szinten! egymintás, sokasági várható értékre irányuló próba

Példamegoldása Példa megoldása n = 10 H 0 :  = 250g H 1 :  < 250g H 1 :  ≠ 250g t-próbát használhatunk:  = 0,1  t  = -1,383α/2= 0,05  t  /2 = ±1,833 elfogadási tartomány: -1,383 < t sz; -1,833< t sz <1,833 a próbastatisztika értéke: Mivel t sz mindkét alternatív hipotézis mellett az elfogadási tartományba esik, H 0 -t 10 %-os szignifikancia szinten elfogadjuk. s*= 4,508g

Gyakorló példa Egy konzervgyárban a sűrített paradicsomot automata gép tölti dobozokba. A dobozok névleges súlya 450 gramm, a súly megengedett szórása 10 gramm. A súly szerinti eloszlás normálisnak tekinthető. A gyár az egyik szállítmányból 25 elemű mintát vett, a mintában a dobozok átlagos súlya 446 gramm volt, a szórás pedig 11 gramm. Ellenőrizze 5%-os szignifikancia szinten, hogy a töltősúly szórása lehet-e 10 gramm! Ellenőrizze a névleges töltősúlyra vonatkozó hipotézist 3%-os szignifikancia szinten! Ellenőrizze a névleges töltősúlyra vonatkozó hipotézist 5%-os szignifikancia szinten feltéve, hogy a sokasági szórásról nem áll rendelkezésre információ!

Sokasági arányra irányuló nagymintás próba Legyen a sokaság bizonyos tulajdonságú egységeinek aránya, illetve előfordulási valószínűsége P, és az arra vonatkozó nullhipotézis: H 0 : P=P 0. Ha a sokaságból vett minta olyan nagy, hogy akkor a próbafüggvény:

Példa Egy olvadó biztosítékokat gyártó cég feltételezi, hogy a működésképtelen biztosítékok aránya legfeljebb 0,1. Ezt a feltevést kell egy 144 elemű minta alapján megvizsgálnunk 5%-os szignifikancia szinten. A mintában a selejtes termékek száma 25. A nullhipotézis és az ellenhipotézis: H 0 : P=0,1 és H 1 : P>0,1

Példa Mivel 144·0,1=14>10 és 144·(1–0,1)=129,6>10, a nagymintás eljárás alkalmazható. A próba jobboldali kritikus tartománnyal hajtandó végre.  =0,05, z α =1,64. Az egyoldali alternatív hipotézis alapján meghatározott elfogadási tartomány: z sz <1,64 A próbafüggvény adott mintára vonatkozó értéke: Mivel a z sz >1,64, ezért a nullhipotézist, vagyis a gyártó cég feltételezését elvetjük, a selejtarány 5%-os szignifikancia szinten meghaladja a 10%-ot.

Gyakorló példa Valamely felsőoktatási intézmény hallgatóinak legfeljebb 10%-a balkezes a feltételezésünk szerint. Egy írásbeli vizsgán 100 hallgató közül 12-en bal kézzel írtak. Ellenőrizze 5%-os szignifikancia szinten, hogy elfogadható-e a balkezesek arányára vonatkozó hipotézis!

Annak a kérdésnek a vizsgálatára használhatók, hogy két vagy több sokaság különbözik-e egymástól valamely adat tekintetében. A két-, ill. többmintás próbák két vagy több sokaság összehasonlítását szolgálják. A sokaságok időben, térben vagy bármilyen más tekintetben különbözhetnek egymástól. – Két, független mintás, várható értékek egyezésére irányuló z-, ill. t- próba, Welch- próba – Páros mintás, a várható értékek különbségére irányuló próba – Kétmintás, a sokasági varianciák egyezésére irányuló próba – Kétmintás, a sokasági arányok egyezésére irányuló próba – Többmintás, a szórások egyezésére irányuló próba (Cochran próba) – Többmintás, a várható értékek egyezésére irányuló próba (varianciaanalízis) Két- és többmintás próbák

Páros mintás próba Páros minta fogalma: a két minta elemei nem függetlenek egymástól (pl. ugyanaz a mérőeszköz, ugyanaz az alkatrész, ember stb.), vagyis az egyik minta elemeinek kiválasztása maga után vonja a másik minta elemeinek kiválasztását  a két minta nagysága egyforma. Az egymásnak megfeleltethető elemeik különbségét képezzük, és e különbségeket már egyetlen minta adatainak tekintjük. Az összetartozó elemek különbsége: d i =y i -x i, ha e különbségek eloszlása az elempárokból álló sokaságban normális, vagy mindkét minta nagy, akkor a nullhipotézis helyessége a megfelelő bal, két- vagy jobb oldali alternatív hipotézissel szemben az egymintás várható érték próbákkal vizsgálható. H 0 : μ d =δ 0 μ d az elempárokhoz tartozó különbségek feltételezett várható értéke

Szükség van a két minta megfeleltetett elemeiből képzett különbségek varianciájára, vagy annak mintából számított torzítatlan becslésére: A próbafüggvény n-1 szabadságfokú Student t-eloszlást követ: DF = n-1 Páros minták várható értékének összehasonlítása H 0 :  A =  B (vagy  A ˗  B =  d =0) H 1 :  A ≠  B (  d ≠0);  A >  B (  d >0);  A <  B (  d <0);

Példa Egy sportcipőket gyártó cég szeretné meghatározni, hogy egy új típusú cipő („A”) élettartama nagyobb-e az előzőtől („B”)? Felkértek tíz kocogót, hogy teszteljék a termékeket. Az eredményeket [az élettartamokat hetekben mérve] a következő táblázat mutatja (az élettartamok normális eloszlást követnek). Kocogó Minta A cipő B cipő %-os megbízhatósági szinten feltehető-e az élettartamok különbözősége?

Példa megoldása H 0 :  A =  B H 1 :  A >  B (jobb oldali) n = didi Az eltérések átlaga: Az elfogadási tartomány: 1,83 > t sz Mivel t sz az elutasítási tartományba esik, H 0 -t 5%-os szignifikancia szinten nem fogadjuk el, azaz az új cipők élettartama valóban nagyobb, mint a régieké. A különbségek korrigált tapasztalati szórása:  = 0,05DF = n-1 = 10-1 = 9  t  = 1,83

Gyakorló példa Két fájdalomcsillapító (A és B) hatását vizsgáljuk 8 betegen mérve a fájdalom megszűnéséig eltelt időt. 5%-os szignifikancia szinten van-e különbség a két fájdalomcsillapító között? BetegAB 13,23,8 21,61 35,78,4 42,83,6 55,55 61,23,5 76,17,3 82,94,8

F-próba Alkalmazási feltétele: független normális eloszlású alapsokaságok Az F-eloszlás két egymástól független χ 2 eloszlású valószínűségi változó hányadosának az eloszlása. Sűrűségfüggvénye a χ 2 eloszláséhoz hasonlóan nem szimmetrikus. H 0 :  Y 2 =  X 2 H 1 :  Y 2 >  X 2 H 0 helyessége esetén a próbafüggvény DF 1 =n 1 -1 és DF 2 =n 2 -1 szabadságfokú F-eloszlást követ. DF 1 a számláló, DF 2 pedig a nevező szabadságfoka

F-próba ellenhipotézise H 1 :  Y >  X Jobb oldali Elfogadási tartomány KritikusElfogadási α 1-α

Példa Egy bizonyos szerelési művelet elvégzésére egy üzem munkatársait két eltérő módszerrel tanították be. Egy idő után a kétféle módszerrel betanított munkások közül egymástól függetlenül egy- egy mintát vettek, s egy adott 8 órás műszakban minden munkásnak feljegyezték a teljesítményét. A két mintán belül a munkások átlagos teljesítménye és a teljesítmények szórása az alábbi módon alakult. Ellenőrizzük annak a hipotézisnek a helyességét 1%-os szignifikancia szinten, hogy az Y és X módon betanított munkások teljesítményének szórása egyforma! A betanítás módszere MintanagyságAz egy műszak alatt összeszerelt darabok ÁtlagaSzórása Y X

Példa A számláló DF 1 = 11-1=10, a nevező DF 2 = 16-1=15. A kritikus érték: 3,8 A nullhipotézis 1%-os szignifikancia szinten elfogadható. H 0 :  X =  Y H 1 :  x >  Y

Gyakorló példa Egy gyümölcs-nagykereskedő olasz narancsot (A) szállít, mely a csekély méretkülönbségek miatt normál csomagolásban árusítható. Ajánlatot kap olcsóbb, spanyol narancsra (B). Az A és a B varianciájának a szállító adatai szerint azonosnak kell lennie. 31 elemű mintákat vettek, az olasz narancsok átmérőjének szórása 0,9, a spanyolé 1,0. 1%-os szignifikancia szinten vizsgáljuk meg, hogy van-e eltérés a kétfajta narancsok átmérőjének szórása között!

Várható értékre irányuló próbák Két sokaságból külön-külön, egymástól függetlenül vett minta! A nullhipotézis helyessége most is attól függően vizsgálható, hogy milyen információkkal rendelkezünk a sokaságról: kétmintás z-próba, kétmintás t-próba, Welch- próba

Két független minta várható értékének az összehasonlítása Nullhipotézisünk minden esetben: H 0 : μ 1 = μ 2 Kétmintás z-próba alkalmazási feltétele: ha ismerjük az alapsokasági szórásokat (σ 1,σ 2 ), vagy ha nem ismerjük, de nagy mintával dolgozunk (n 1 >30 és n 2 >30, és az elméleti szórásokat s * -gal becsüljük) A próbafüggvény H 0 helyessége esetén N(0,1) eloszlást követ:

Gyakorló példa Kétféle (A és B) márkájú autógumi élettartamát (a megtett km- ben mérve) kell összehasonlítanunk. A vizsgálathoz mintavételt hajtunk végre, mely a következő adatokat adja: „A” esetében: n=100, átlag km, szórás 4000 km „B” esetében: n=45, átlag km, szórás 3000 km. 5%-os szignifikancia szinten vizsgáljuk meg, hogy van-e különbség a kétfajta gumi élettartama között!

Kétmintás t-próba alkalmazási feltétele: ha nem ismerjük az alapsokasági szórást, de feltehető a szórások egyezése kis minták esetében akkor kezelhető, ha az ismeretlen szórásokról tudjuk, hogy azok egyformák (F-próba!!!!). A próbafüggvény H 0 helyessége esetén DF=n Y +n X -2 szabadságfokú Student-eloszlást követ: Két független minta várható értékének az összehasonlítása DF=n Y +n X -2 A két sokaság egyforma varianciájának a két minta együttes felhasználásával nyert kombinált becslése.

z-próbat-próba egyoldalikétoldaliegyoldalikétoldali H0H0  1 =  2 H1H1  1 >  2 ( 1 <  2 ) 1  21  2  1 >  2 ( 1 <  2 ) 1  21  2 próba- statisz- tika Eluta- sítási tarto- mány z sz > z  (z sz < -z  ) z sz z /2 t sz > t  (tsz < -t  ) t sz t /2 Feltéte- lek  1 és  2 ismert v. n 1 és n 2 > 30 1 =  2 DF=n 1 +n 2 -2 F-próba!

Példa Egy bizonyos szerelési művelet elvégzésére egy üzem munkatársait két eltérő módszerrel tanították be. Egy idő után a kétféle módszerrel betanított munkások közül egymástól függetlenül egy-egy mintát vettek, s egy adott 8 órás műszakban minden munkásnak feljegyezték a teljesítményét. A két mintán belül a munkások átlagos teljesítménye és a teljesítmények szórása az alábbi módon alakult. Ellenőrizzük annak a hipotézisnek a helyességét 1%-os szignifikancia szinten az Y betanítási mód jobb az X-nél! A betanítás módszere Minta- nagyság Az egy műszak alatt összeszerelt darabok ÁtlagaSzórása Y X

Példa DF= =25  t α =2,485  t sz <t α  1,519<2,485 A nullhipotézis 1%-os szignifikancia szinten elfogadható, nincs eltérés a két betanítási mód között.

Welch-próba Amikor a két szórás egyezése nem tehető fel (vagyis F sz >F krit ):

Aránypróba H 0 : P 1 =P 2, A próbafüggvény nagy minták és H 0 helyessége esetén standard normális eloszlást követ, ahol a vizsgált eseménynek a két minta egyesítésével nyert mintából számított relatív gyakorisága..

Példa Egy közvélemény-kutató cég 1000 elemű, állítása szerint az ország teljes felnőtt lakosságát reprezentáló FAE mintákkal dolgozik. Két – időben egymást két hónappal követő – közvélemény-kutatás eredménye szerint az egyik politikust a lakosság 62, ill. 68%-a tartotta rokonszenvesnek. 5%-os szignifikancia szinten állítható-e, hogy a lakosság rokonszenve növekedett az adott politikus iránt? H 0 : P 1 =P 2 H 1 : P 1 <P 2

H 0 : P 1 =P 2 H 1 : P 1 <P 2  =0,05  z  = –1,645 Elfogadási tartomány: z sz > –1,645 A próbastatisztika értéke:Példa Mivel z sz <–1,645, ezért a H 0 hipotézist 5%-os szignifikancia szinten elutasítjuk, vagyis a lakosság rokonszenve az adott politikus iránt nem növekedett.

Gyakorló példa Valamely bűncselekmény-típus áldozataira vonatkozó rendőrségi feljegyzésekből vett elemű minta adatai két egymást követő évben: Év60 évnél fiatalabbak aránya (%) Az életkor (év) ÁtlagaSzórása A sokaságok normális eloszlása feltételezhető. Ellenőrizze 5%-os szignifikancia szinten, hogy Változott-e a 60 éven aluli áldozatok aránya? (aránypróba) Csökkent-e az életkor szórása? (F-próba) Nőtt-e az áldozatok átlagos életkora? (kétmintás z-próba)

Több szórás összehasonlítása Kettőnél több, normális eloszlást követő valószínűségi változó szórásainak összehasonlítására. Ha a minták elemszáma az egyes mintákban nem azonos, akkor Bartlett-próbát alkalmazhatunk. Ha a minták elemszáma minden mintában azonos, akkor Cochran-próbát alkalmazhatunk. n 1 = n 2 = n 3 =…..= n r = n

Cochran-próba A szórások között talált legnagyobb érték tekinthető-e a többivel azonos eloszlásból származónak. Feltétel: az alapeloszlás normális, azonos elemszámú minták. A mintaelemszám „n” (DF = n-1), r darab különböző minta korrigált szórásnégyzetét pedig s 1 *2, s 2 *2, …s r *2 - tel, utóbbiak közül a legnagyobb legyen s max *2. g krit

Példa Műselyem szakítóerő vizsgálatánál (n=10) kapott r=20 vizsgálat adataiból számolt korrigált tapasztalati szórások között található-e kiugró érték? Az adatokat az alábbi táblázat tartalmazza: i s i *2 24,98,421,28,08,46,026,326,76,812,5 i s i *2 12,511,44,822,222,616,110,99,660,510,9 H 0 : a szórások nem különböznek H 1 : a legnagyobb szórás különbözik a többitől

Példa megoldása n = 10; r = 20 i s i *2 24,98,421,28,08,46,026,326,76,812,5 i s i *2 12,511,44,822,222,616,110,99,660,510,9  = 5% g kr =0,136DF = n-1= 10-1=9 Mivel g sz >g krit, ezért a H o t 5%-os szignifikancia szinten elutasítjuk. a legnagyobb szórás (19.) szignifikánsan eltér a többitől.

Példa folytatása A 19. mintát kivéve, ismételjük meg a próbát! n = 10r = 19 DF(f) = n-1= 10-1= 9  = 5% g 95 =0,140 A H 0 nullhipotézist elfogadjuk, az i=8-as minta szórása (5 ill. 1%-os szinten) szignifikánsan nem tér el a többi szórástól.

Varianciaanalízis H 0 :  1 =  2 =  3 =…. =  r H 1 : nem minden várható érték egyforma Egyszeres osztályozású varianciaanalízis Feltételek: normális eloszlású alapsokaságokból egymástól függetlenül vett minták, alapsokasági szórások egyezése H 0 fennállása azt jelenti, hogy nincs kapcsolat x és a sokaságokat megkülönböztető (minőségi) ismérv között. H 1 fennállása azt jelenti, hogy a két ismérv között van kapcsolat. H 0 elvetése azt is jelenti, hogy a sokaságban x és a csoportképző ismérv között vegyes kapcsolat áll fenn.

Varianciaanalízis Képezzük az összes megfigyelés számtani átlagát! Teljes négyzetösszeg: Csoportok közötti négyzetösszeg: Csoportokon belüli négyzetösszeg: H 0 :  1 =  =…=  r H 1 : nem minden várható érték egyforma

Négyzetösszeg neve Négyzet- összegek SzabadságfokSzórás becslése F értékp-érték csoportok közötti (SSK) r-1sk2sk2 s k 2 /s b 2 p csoporton belüli (SSB) n-rsb2sb2 -- Teljes (SST) n Anova tábla H 0 helyességére támaszkodva belátható, hogy az próbafüggvény F(r-1;n-r) eloszlást követ. A próba jobboldali kritikus tartománnyal hajtandó végre. Átlagos külső (eltérés)négyzetösszeg Átlagos belső (eltérés)négyzetösszeg

Példa Egy áruházláncnál megvizsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fizetett összeg. Minden boltban kiválasztottak 6 véletlen mintát. A vásárláskor fizetett összegeket az alábbi táblázat mutatja [dollárban]: 1. bolt2. bolt3. bolt 12,0515,179,48 23,9418,526,92 14,6319,5710,47 25,7821,47,63 17,5213,5911,90 18,4520,575,92 Feltételezve, hogy a kifizetések normális eloszlásúak, s szórásuk egyenlő, van-e különbség a 3 üzlet között?

Példa megoldása H 0 :  1 =  2 =  3 H 1 : legalább az egyik várható érték eltér a többitől n 1 = n 2 = n 3 = 6r = 3 (minták száma) Az átlagok boltonként: $18,73 $18,14 $8,72 az összes adat átlaga: $15,2.

Anova tábla Négyzet- összegek DFSzórásF értékp érték Csoportok közötti 378,42189,213,260,0005 Csoporton belüli 214,11514,3-- Teljes 592,517---

Példa megoldása Az F sz számított értéke tehát 13,26.  = 0,05a számláló szabadságfoka: 2 a nevező szabadságfoka: 15 A kritikus érték: F kr = 3,68 Mivel F sz >>F kr a H 0 hipotézist 5 %-os szignifikancia szinten elutasítjuk, azaz az átlagok ill. legalább egy átlag szignifikánsan különbözik a többitől. Esetünkben ez értelemszerűen a 3. bolt, ahol az egy vásárlásnál kifizetett összeg nagysága átlagosan kevesebb, mint a fele a másik két bolt átlagának.

Gyakorló példa Egy gyártó cég három gumiabroncs típus tartósságát az egy mm kopásra jutó megtett út alapján méri. Az 5-5 elemű véletlen minta adatai: TípusMérési eredmény (ezer km) A43724 B85386 C Vizsgáljuk meg 5%-os szignifikancia szint mellett, hogy a három típus azonos tartósságú-e!

Gyakorló példa Egy nagyvárosban a mackósajt áralakulását vizsgálták különböző típusú véletlenszerűen kiválasztott helyeken. Az áradatok eloszlásának normalitása, ill. a szórások egyezősége feltételezhető. Az eredmények: Vizsgáljuk meg 5%-os szignifikancia szint mellett, hogy van-e különbség az egyes bolttípusok átlagáraiban! BolttípusMegfigyelt boltok száma Megfigyelt árak (Ft/db) Hipermarket435,37,37,38 Szupermarket438,40,45,50 Kisbolt734,45,47,47,50,51,55 Összesen15