Normális eloszlású, ismert szórású sokaság.

Slides:



Advertisements
Hasonló előadás
Hipotézis-ellenőrzés (Statisztikai próbák)
Advertisements


II. előadás.
BECSLÉS A sokasági átlag becslése
A társadalmi tényezők hatása a tanulásra
Kvantitatív Módszerek
Erőállóképesség mérése Találjanak teszteket az irodalomban
MATEMATIKA Év eleji felmérés 3. évfolyam
Kvantitatív módszerek
3. Két független minta összehasonlítása
Az új történelem érettségiről és eredményeiről augusztus Kaposi József.
Utófeszített vasbeton lemez statikai számítása Részletes számítás
A tételek eljuttatása az iskolákba
Két változó közötti összefüggés
Általános statisztika II.
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Statisztika II. V. Dr. Szalka Éva, Ph.D..
1. IS2PRI2 02/96 B.Könyv SIKER A KÖNYVELÉSHEZ. 2. IS2PRI2 02/96 Mi a B.Könyv KönyvelésMérlegEredményAdóAnalitikaForintDevizaKönyvelésMérlegEredményAdóAnalitikaForintDeviza.
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Szerkezeti elemek teherbírásvizsgálata összetett terhelés esetén:
Sárgarépa piaca hasonlóságelemzéssel Gazdaság- és Társadalomtudományi kar Gazdasági és vidékfejlesztési agrármérnök I. évfolyam Fekete AlexanderKozma Richárd.
DRAGON BALL GT dbzgtlink féle változat! Illesztett, ráégetett, sárga felirattal! Japan és Angol Navigáláshoz használd a bal oldali léptető elemeket ! Verzio.
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Statisztika II. III. Dr. Szalka Éva, Ph.D..
szakmérnök hallgatók számára
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
STATISZTIKA II. 6. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
A évi demográfiai adatok értékelése
Logikai szita Izsó Tímea 9.B.
LENDÜLETBEN AZ ORSZÁG A Magyar Köztársaság kormánya.
Kvantitatív Módszerek
Valószínűségszámítás
7. Házi feladat megoldása
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika Hipotézisvizsgálatok Nemparaméteres próbák II. 17. előadás.
Gazdaságstatisztika 18. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
t A kétoldalú statisztikai próba alapfogalmai

Diszkrét változók vizsgálata
Két kvantitatív változó kapcsolatának vizsgálata
A klinikai transzfúziós tevékenység Ápolás szakmai ellenőrzése
QualcoDuna interkalibráció Talaj- és levegövizsgálati körmérések évi értékelése (2007.) Dr. Biliczkiné Gaál Piroska VITUKI Kht. Minőségbiztosítási és Ellenőrzési.
TÁRSADALOMSTATISZTIKA Sztochasztikus kapcsolatok II.
1. Melyik jármű haladhat tovább elsőként az ábrán látható forgalmi helyzetben? a) A "V" jelű villamos. b) Az "M" jelű munkagép. c) Az "R" jelű rendőrségi.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Kvantitatív módszerek
1 Az igazság ideát van? Montskó Éva, mtv. 2 Célcsoport Az alábbi célcsoportokra vonatkozóan mutatjuk be az adatokat: 4-12 évesek,1.
Kvantitatív módszerek
Konzultáció november 19. Nemparaméteres próbák, egymintás próbák
Paraméteres próbák- gyakorlat
Hipotézisvizsgálatok Paraméteres próbák
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
II. előadás.
Becsléselmélet - Konzultáció
Gazdaságstatisztika konzultáció
Kvantitatív módszerek
I. Előadás bgk. uni-obuda
Hipotézisvizsgálatok Paraméteres próbák
1.3. Hipotézisvizsgálat, statisztikai próbák
Előadás másolata:

Normális eloszlású, ismert szórású sokaság. Példa: A kávékivonatot automata tölti az üvegekbe. Előző adatfelvételekből ismeretes, hogy a gép által töltött tömeg normális eloszlású valószínűségi változónak tekinthető, 1 g szórással. A gép pontosságának ellenőrzésére vett 16 elemű mintában (FAE-minta) az üvegekben lévő kávé-granulátum tömege (gramm): 55, 54, 54, 56, 57, 56, 55, 57, 54, 56, 55, 54, 57, 54, 56, 50. Készítsen 95%-os megbízhatósággal intervallumbecslést az átlagos töltőtömegre a megadott feltételek alapján. 1. lépés mintaátlag: 2. lépés: szórás: 3. lépés standard hiba:

Z értéke az I. Táblázatból 95%-nál: 1,96 4. lépés Z értéke az I. Táblázatból 95%-nál: 1,96 5. lépés a hibahatár: 6. lépés a konfidencia intervallum: azaz {54,51; 55,49} Tehát 95%-os megbízhatósággal az átlagos töltőtömeg 54,51 és 55,49 gramm közé esik.

Előfordulás a mintában, (fi) Normális eloszlású, ismeretlen szórású sokaság, nagy minta. Példa: 1250 elemű sokaságból 125 elemű EV mintát veszünk az alma piaci árának megfigyelésére. egységár, FT/kg, (xi) Előfordulás a mintában, (fi) 30 10 35 20 38 50 45 40 60 5 125 N = 1250 n = 125 1. lépés mintaátlag:

Előfordulás a mintában, (fi) egységár, FT/kg, (xi) Előfordulás a mintában, (fi) 30 10 -10 100 1000 35 20 -5 25 500 38 50 -2 4 200 45 40 5 60 400 2000 125 4700 2. lépés szórás:

3. lépés standard hiba:

4. lépés Z értéke az I. Táblázatból 95%-nál: 1,96 5. lépés hibahatár: 6. lépés konfidencia intervallum: azaz {38,977; 41,023}

Normális eloszlású, ismeretlen szórás és kis minta. Példa: A félliteres zacskós tej töltési mennyiségének ellenőrzésére 10 elemű FAE mintát veszünk. A sokaság szórását nem ismerjük. Milyen intervallumba esik az átlagos töltősúly 95%-os valószínűség mellett? Töltősúly 1 495 -2 4 2 501 16 3 503 6 36 480 -17 289 5 485 -12 144 499 7 510 13 169 8 502 25 9 492 -5 10 Σ 4970 748 1. lépés mintaátlag: 2. lépés szórás:

a konfidencia intervallum: 3. lépés standard hiba: 4. lépés „t” kikeresése, (fordítva kell keresni, mint a „z” esetében), a 0,95-höz tartozó értéket keressük a III. Táblázat megfelelő szabadságfokú sorában. szabadságfok v = n-1 = 9 t = 2,2622 5. lépés hibahatár: 6. lépés a konfidencia intervallum: {490,47; 503,53}

Ismeretlen eloszlás, ismert szórás (kis minta). (Csebisev egyenlőtlenség) A korai paradicsom ármegfigyelésére kiválasztottak 225 árusítóhelyet. A kiválasztott mintában a paradicsom átlagára 180 Ft/kg volt. A mintaátlagok eloszlásáról nincs információnk. A minta szórása 45 Ft/kg. Határozzuk meg a paradicsom piaci átlagárának konfidencia intervallumát 95%-os megbízhatósággal, a Csebisev-féle egyenlőtlenség felhasználásával! s = 45; n = 225; 1-α = 0,95; α = 0,05; 1. lépés mintaátlag: 2. lépés szórás: s = 45 3. lépés a standard hiba: 4. lépés a standard hiba szorzószáma "k".

a konfidencia intervallum: 5. lépés a hibahatár: 6. lépés a konfidencia intervallum: 180 ± 13,416 azaz [166,6; 193,4]

Szimmetrikus eloszlás, ismert szórás. (GAUSS-féle egyenlőtlenség) Az előző példából csak a standard hiba szorzószáma változik: A konfidencia intervallum: 180 ± 8,944 = 188,9;171

Értékösszeg becslés. 1. lépés mintaátlag: Az átlagra kapott becslést, illetve a konfidencia intervallum alsó és felső értékét megszorozzuk a sokaság elemszámával. Példa: A magyarországi kocsmai verekedések vizsgálatára véletlenszerűen, visszatevéses módszerrel, 100 kocsmát választottak ki az ország területén. Egy adott napon megfigyelt eredményeket a következő táblázat tartalmazza: Tegyük fel, hogy a sokasági szórás 1,7. A verekedők száma, xi Kocsmák száma, fi fixi 9 2 15 30 3 17 51 4 22 88 5 23 115 6 8 48 7 42 100 374 Feladat: Összesen hány ember verekedett kocsmákban az adott napon 95%-os meg-bízhatósággal, ha Magyarországon 85 000 kocsma található? 1. lépés mintaátlag:

Z értéke az I. Táblázatból 95%-nál: 1,96 2. lépés szórás: 3. lépés standard hiba: 4. lépés Z értéke az I. Táblázatból 95%-nál: 1,96 5. lépés a hibahatár: 6. lépés a konfidencia intervallum az átlagra: azaz {3,37; 4,03} 7. lépés a konfidencia intervallum az értékösszegre: képlet alapján 85 000 x 3,37 = 286 450 fő 85 000 x 4,03 = 342 550 fő

Sokasági arány becslése. Példa: Egy 9000 lakosú városban közvélemény kutatást végeztek az inflációs várakozásokról. Az 1800 megkérdezett közül 630-an számítanak a tervezettnél nagyobb áremelkedésre. Határozza meg, hogy 95%-os valószínűséggel milyen határok közé esik a tervezettnél nagyobb áremelkedésre számítók aránya. N = 9000 n = 1800 a kedvező esetek száma= k = 630 1. lépés arány a mintában: 1-p = 0,65 2. lépés szórás a mintából: 3. lépés a standard hiba: (EV)

4. lépés a "z" meghatározása a táblázatból: 95%-os valószínűségnél z = 1,96; 5. lépés a hibahatár megállapítása: 6. lépés a konfidencia intervallum: p ± Δ = 0,35 ± 0,0196 [0,3304; 0,3696]

A minta nagyságának meghatározása. Példa: Mekkora nagyságú EV mintát kell venni egy 12500 elemszámú sokaságból a sokaság várható értékének becsléséhez, hogy 95%-os valószínűség mellett a hiba ne haladja meg az 1,08 hibahatárt, ha az alapsokaság szórása 6,16. N= 12500; σ= 6,16; Δ= 1,08; z= 1,96

Becslés rétegzett mintából. átlagbér, eFt a mintában Példa: Egy vállalat dolgozóinak kereseti adatai. rétegek Teljes sokaság minta átlagbér, eFt a mintában Szórás Nj nj σj Fizikai 1440 125 48 5 Adminisztratív 240 25 72 10 Műszaki 720 50 96 15 összesen 2400 200 Határozzuk meg 95%-os valószínűséggel a sokaság átlagbérének konfidencia intervallumát. Ha "j" számú réteg van, akkor Nj = a j-edik réteg elemszáma nj = a j-edik réteg elemszáma a mintában σj = a j-edik réteg szórása 1. lépés a mintából számított átlag:

a konfidencia intervallum: 2. lépés a standard hiba: 3. lépés a "z" meghatározása a táblázatból: 95%-os valószínűségnél z = 1,96 4. lépés a hibahatár: 5. lépés a konfidencia intervallum: [63,44; 66,16]

Hipotézisvizsgálat. A sokaságból vett minta alapján azt vizsgáljuk, hogy helyes-e a sokaságra vonatkozó feltételezésünk. A tesztelni kívánt feltételezés: a null-hipotézis. A szemben álló hipotézis: az alternatív hipotézis. A null-hipotézisünk helyességének megállapításához próbafüggvényt használunk. A próbafüggvénynek a mintából számított értéke alapján hozzuk meg a döntésünket.

A függvény értékkészletét kettéválasztjuk: A nullhipotézis helyessége esetén a próbafüggvény értéke adott valószínűséggel az elfogadási tartományba esik. A nullhipotézis helytelensége esetén a próbafüggvény értéke a visszautasítási tartományba esik. Döntésünket adott valószínűség mellett hozzuk. Ez a megbízhatósági szint (1-α, pl. 95%). Annak a valószínűsége, hogy helyes nullhipotézis esetén a próbafüggvény értéke a visszautasítási tartományba esik, az a szignifikancia szint (α, pl. 5%). Elsőfajú hiba: elvetjük a null-hipotézist, noha megfelel a valóságnak. Másodfajú hiba: elfogadjuk a null-hipotézist, noha az nem felel meg a valóságnak.

(Ismert szórású normális eloszlás) Egymintás „Z” próba. (Ismert szórású normális eloszlás) Egy ellenőrző vizsgálatnál a 100 dkg-osnak feltüntetett csomagokból választottak egy 50 elemű FAE mintát. A minta átlag 98 dkg volt. Az alapsokaság szórása előzetes vizsgálatokból ismert 3 dkg. 95%-os megbízhatósági szinten vélelmezhetjük-e, hogy az alapsokaságban az átlagsúly 100 dkg? n = 50  = 3 = 98 1. lépés A nullhipotézis felállítása: μ = 100 (kétoldalú próba) 2. lépés A próbafüggvény értékének a kiszámítása a mintából: (191. képlet)

3. lépés az elfogadási tartomány megállapítása. Ez kétoldalú próba, a 95%-os valószínűséghez az I. táblázatban z=1,96 érték tartozik, tehát az elfogadási tartomány (-1,96; +1,96). A kapott érték ezen kívül esik: - 4,71 < - 1,96, így elvetjük a null-hipotézist. Nem tekinthetjük 100 dkg-osnak a sokaságban az átlagsúlyt.

a nullhipotézis: (baloldali próba) a próbafüggvény értéke: 95%-os megbízhatósági szinten vélelmezhetjük-e, hogy az alapsokaságban az átlagsúly legalább 100 dkg? a nullhipotézis: (baloldali próba) a próbafüggvény értéke: Egyoldalú próba a II. táblázatban a 95%-os valószínűséghez z =1,64 érték tartozik. Az elfogadási tartomány A kapott érték ezen kívül esik, nem fogadjuk el a nullhipotézist. 1. lépés 2. lépés 3. lépés

(Ismeretlen szórású normális eloszlás, kis minta.) Egymintás „t” próba. (Ismeretlen szórású normális eloszlás, kis minta.) A félliteres zacskós tej töltési mennyiségének ellenőrzésére 10 elemű FAE mintát veszünk. A sokaság szórását nem ismerjük. Az a hipotézisünk, hogy 95%-os valószínűséggel állítható, hogy az alapsokaságban az átlagos töltősúly 500 gramm. 1.) A null-hipotézis:  = 500 (kétoldalú próba)

Töltősúly 1 495 -2 4 2 501 16 3 503 6 36 480 -17 289 5 485 -12 144 499 7 510 13 169 8 502 25 9 492 -5 10 Σ 4970 748 2.) Az átlag a mintából: 3.) A szórás a mintából: 4.) A próbafüggvény „t” próba esetén: 5.) 95%-os valószínűség és v = n-1 = 9 szabadságfok mellett kikeressük „t” értékét a III. táblázatból t = 2,2622, az elfogadási tartomány (-2,2622; 2,2622). A próbafüggvény értéke (-1,038) az elfogadási tartományba esik, tehát elfogadjuk azt a null-hipotézisünket, hogy a félliteres zacskós tej átlagos töltősúlya 500 gramm.

Sokasági arányra irányuló próba. Egy biztosítótársaság feltevése szerint a vállalati igazgatók egynegyedének van életbiztosítása. A hipotézis ellenőrzésére kiválasztottak 1000 vállalatot. A mintában szereplő igazgatók közül 226-nak volt életbiztosítása. Állapítsuk meg 5%-os szignifikancia szinten a feltevés helyességét. lépés A null-hipotézis: P0 = 0,25 Az alternatív hipotézis: P0  0,25, tehát két oldalú próba.

n = 1000; k = 226; 2. lépés A próbafüggvény: 3. lépés A 95%-os megbízhatósági szinthez tartozó „z” érték 1,96. Az elfogadási tartomány: - 1,96, 1,96 között van. A próbafüggvény értéke az elfogadási tartományba esik, tehát elfogadjuk azt a hipotézist, hogy az igazgatók egynegyedének van életbiztosítása. 4. lépés

Kétmintás „Z” próba. Az a feltételezésünk, hogy a téli alma átlagára a szegedi és a miskolci piacon megegyezik. Ennek ellenőrzésére a szegedi piacokon 100 elemű, a miskolci piacokon 144 elemű mintát vettünk. A mintabeli átlagárak: Az árak szórása: Szegeden = 90 Ft Szegeden σ1=15 Ft Miskolcon = 85 Ft Miskolcon σ2=12 Ft Igaz-e a feltételezésünk 5%-os szignifikancia szint mellett?

1. lépés A nullhipotézis: 2. lépés A próbafüggvény: 3. lépés Az 5%-os szignifikancia szinthez a Z= 1,96 tartozik, az elfogadási tartomány +1,96 és –1,96 „z” értékek között van. 2,78 > 1,96 tehát elutasítjuk a null-hipotézist, azaz szignifikáns eltérés van az alma átlagárában a két városban.

Függetlenségvizsgálat: χ² próba. (Alkalmazási feltétele: a kombinációs tábla minden cellájában több, mint 10 elem.) A tanulók megoszlása lakóhely és tanintézet szerint. (fij) Szak-munkás Szak-iskolai Közép-iskolai Egyetemi Összesen Budapest 28 12 66 22 128 Vidéki város 85 20 42 275 Község 84 13 77 16 190 197 45 271 80 593 j=1 i=1 1. lépés Nullhipotézis: a tanulók lakóhely, és tanintézeti megoszlása független egymástól. Szignifikancia szint : 1%

Megoszlás függetlenség esetén. (fij*) például Szak- munkás iskolai Közép-iskolai Egyetemi Összesen Budapest 42,52 9,71 58,50 17,27 128,00 Vidéki város 91,36 20,87 125,67 37,10 275,00 Községek 63,12 14,42 86,83 25,63 190,00 197,00 45,00 271,00 80,00 593,00

fij fij* fij-fij* (fij-fij*)² Munkatábla a χ² kiszámításához: fij fij* fij-fij* (fij-fij*)² Budapest Szakmunkás Szakiskola Középiskola Egyetem 28 12 66 22 42,52 9,71 58,50 17,27 -14,52 2,29 7,50 4,73 210,83 5,24 56,25 22,37 4,96 0,54 0,96 1,30 Vidéki város 85 20 128 42 91,36 20,87 125,67 37,10 -6,36 -0,87 2,33 4,90 40,45 0,76 5,43 24,01 0,44 0,04 0,65 Község 84 13 77 16 63,12 14,42 86,83 25,63 20,88 -1,42 -9,83 -9,63 435,97 2,02 96,63 92,74 6,91 0,14 1,11 3,62 20,71

a szabadságfok: v = (r-1) (c-1) = (3-1) (4-1) = 6 2. lépés a próbafüggvény: 3. lépés a szabadságfok: v = (r-1) (c-1) = (3-1) (4-1) = 6 Jobboldali próba esetén az V. táblázatban az oszlopban, v = 6 sorban szereplő értéket keressük. Ez 16,812; 20,71 > 16,812, tehát elutasítjuk a null-hipotézist. (r = a sorok száma; c = az oszlopok száma) 4. lépés

F-próba (variancia analízis). Több mintás próbák. F-próba (variancia analízis). Több normális eloszlású és hasonló szórásnégyzetű részsokaság átlagának egyezőségét teszteljük. A null-hipotézis: a részsokaságok várható értéke (átlaga) azonos. μ1= μ2= μ3= ……….= μM ahol a részsokaságok száma j= 1, 2, ......M Minden részsokaságból mintát veszünk. Egy adott részminta elemszáma: nj A teljes minta elemszáma: Σnj = n

Példa. Tizenöt napon keresztül megfigyelték négy dolgozó átlagos teljesítményét. A teljesítményeket az alábbi táblázat mutatja. Ellenőrizzük 95%-os megbízhatósággal azt a hipotézist, hogy nincs szignifikáns eltérés a négy dolgozó átlagos teljesítménye között. A részsokaságok: a négy dolgozó napi teljesítményei (M=4) A részsokaságokból vett minták (nj): négy dolgozó napi teljesítményei 15 napon keresztül Az egyes minták elemszáma: j = 1,2,…..15 A teljes minta (n): Σ nj = n = 60

Mintaelemek száma (nj) Mintaátlag ( ) Eltérés négyzetösszeg mintánként Dolgozó neve Mintaelemek száma (nj) Mintaátlag ( ) Eltérés négyzetösszeg mintánként A 15 59,3 117,6 B 57,9 173,4 C 61,0 228,2 D 60,2 86,4 1.) 2.) Belső eltérés négyzetösszeg SSB = 3.) Külső eltérés négyzetösszeg SSK =

v1= M – 1 = 4 - 1 = 3 (a részsokaságok száma mínusz 1) 4.) A próbafüggvény: 5.) (202) képlet Szabadságfok: v1= M – 1 = 4 - 1 = 3 (a részsokaságok száma mínusz 1) v2= n – M = 60 - 4 = 56 (a teljes minta elemszáma mínusz a részsokaságok száma) 6.) Ilyen szabadságfok mellett az F függvény VI. táblabeli értéke 95%-os megbízhatósági szinten F=2,79. Miután jobboldali próba az elfogadási tartomány (0; 2,79). A próbafüggvény tapasztalati értéke az elfogadási tartományba esik. Tehát nincs szignifikáns eltérés a négy dolgozó átlagos teljesítménye között.