Mintavételi hiba, hibaszámítás

Slides:



Advertisements
Hasonló előadás
Események formális leírása, műveletek
Advertisements

I. előadás.
II. előadás.
BECSLÉS A sokasági átlag becslése
Kvantitatív módszerek
Anyagáramok meghatározásának hibája és a becslés pontosításának lehetőségei.
Anyagáramok meghatározásának hibája és a becslés pontosításának lehetőségei.
 A monitoring célja az, hogy megalapozza a vízstátus egységes és átfogó felülvizsgálatát minden egyes vízgyűjtőkerületben és elősegítse a felszíni víztestek.
Felszíni víz monitoring
Felszíni és felszín alatti víz monitoring
Műszeres analitika a 13. C,14. D, K és L osztály részére 2013/2014
1. A mérési adatok kezelése
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
A középérték mérőszámai
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Statisztika II. III. Dr. Szalka Éva, Ph.D..
Budapesti Műszaki és Gazdaságtudományi Egyetem
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
Véletlenszám generátorok
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
STATISZTIKA II. 2. Előadás
Kvantitatív Módszerek
Kvantitatív módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Mintavételi hiba, hibaszámítás
Környezeti monitoring Feladat: Vízminőségi adatsor elemzése, terhelés (anyagáram) számítása Beadás: szorgalmi időszak vége (dec. 11.), KD: dec. 21.
Valószínűségszámítás
Mintavételi hiba, hibaszámítás
FELSZÍNI VÍZ MONITORING.
Felszíni víz monitoring
Gazdaságstatisztika 14. előadás.
Gazdaságstatisztika 13. előadás.
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Alapsokaság (populáció)
Alapfogalmak.
Lineáris regresszió.
Folytonos eloszlások.
© Farkas György : Méréstechnika
© Farkas György : Méréstechnika
I. előadás.
Vízminősítés és terhelés számítás feladat
Dr. Takács Attila – BME Geotechnikai Tanszék
Valószínűségszámítás III.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Valószínűségszámítás II.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Mintavételi hiba, hibaszámítás
Mintavételi hiba, hibaszámítás
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Kvantitatív módszerek Becsléselmélet október 15.
Leíró statisztika, részekre bontott sokaság, becslés Árva Gábor PhD Hallgató.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
100-as szög méreteinek gyakorisága (n = 100) db mm Gyakoriság grafikon (adott méretű esetek db.)
Gazdaságstatisztika Becsléselmélet október 30. és november 5.
Kvantitatív módszerek
II. előadás.
Kvantitatív módszerek MBA és Számvitel mesterszak
I. Előadás bgk. uni-obuda
Kockázat és megbízhatóság
Gazdaságinformatikus MSc
Adatfeldolgozási ismeretek környezetvédelmi-mérés technikusok számára
Előadás másolata:

Mintavételi hiba, hibaszámítás

MONITORING - VKI A monitoring célja az, hogy megalapozza a vízstátus egységes és átfogó felülvizsgálatát minden egyes vízgyűjtőkerületben és elősegítse a felszíni víztestek besorolását a megfelelő osztályba. Mérlegelni kell a monitoring költségét és a státus hibás besorolásának következményéből származó költségeket (többlet intézkedések). A vízgyűjtő gazdálkodási tervekben a konfidencia szinteket közölni kell.

A víztest állapota hibás osztályozásának kockázata (osztályozás megbízhatósága)

Kockázat A kedvezőtlen esemény bekövetkezésének esélye, VKI értelmezésében a hibás osztály besorolás valószínűsége. Az elfogadható kockázati szint befolyásolja a víztest állapotának meghatározásához szükséges monitoring időbeli és térbeli sűrűségét. Megbízhatóság (konfidencia) Annak a valószínűsége ( %-ban kifejezve), hogy a statisztikai paraméter valós értéke a számított és a jegyzett értékek közé esik (statisztikai bizonytalanság). Precizitás (pontosság) A valós állapot és a monitoring által talált állapot közti eltérés, adott konfidencia-tartomány szélességének felével megegyező statisztikai bizonytalanság mértéke.

osztályba sorolás hibáját befolyásoló tényezők Mérési adatsor: osztályba sorolás hibáját befolyásoló tényezők Mérési gyakoriság Vizsgálandó jellemzők időbeli változékonysága Eltérés mértéke a küszöbértékhez (osztályhatárhoz) képest Besoroláshoz figyelembe veendő jellemző (évi vagy évszakos átlag, trendek, 90 %-os tartósságú érték, stb.) t C t C t C Ch Ch Ch

Hibatípusok Véletlen hiba: A mérési eredmények a valóságos értéktől mindkét irányban azonos valószínűséggel, véletlenszerűen térnek el. Nagy számú mérés átlagát véve a véletlen hiba tetszőlegesen csökkenthető. Rendszeres (szisztematikus) hiba: A mérési eredmények a valóságos értéktől eltérő érték körül ingadoznak. Sokféle oka lehet, pl: Nem megfelelő mintavétel, Hibás vagy rosszul beállított műszer, Analitikai (módszertani) probléma, Figyelmen kívül hagyott, a mérést befolyásoló külső tényező (pl. hőmérséklet hatása).

Hibaszámítás elmélete (valószínűségelmélet) Mintavétel, mérés valószínűségi változó valószínűségi sűrűségfüggvény Sokaság (véges, végtelen) Valószínűségi sűrűségfüggvény: f(x) Annak valószínűsége, hogy egy érték x1 és x2 közé essen: A valószínűségi sűrűségfüggvény integrálja a valószínűségi változó teljes értelmezési tartományára: Valószínűségi eloszlásfüggvény: a valószínűségi sűrűségfüggvény integrálfüggvénye: F(x) Annak a valószínűsége, hogy a valószínűségi változó értéke nem nagyobb, mint egy adott xi érték: P (x  xi ) = F(xi) Az eloszlásfüggvénnyel megadhatjuk annak a valószínűségét, hogy a valószínűségi változó értéke x1 és x2 közé esik:

Az eloszlás paraméterei, a minta jellemzői Az eloszlás várható értéke diszkrét és folytonos eloszlás esetén: A eloszlás mediánja a valószínűségi változónak az az értéke, melynél kisebb és nagyobb érték is ugyanolyan valószínűségű, azaz ahol az eloszlásfüggvény értéke F(xme) = 0,5. Az eloszlás módusza a sűrűségfüggvény maximum helye. Szimmetrikus eloszlás várható értéke, mediánja és módusza azonos. A variancia a sokaság elemeinek a várható értéktől való eltérését jellemzi: Var [x] = s2 (szórás) A valószínűségi változó konstansszorosának várható értéke a várható érték konstansszorosa: Változó konstansszorosának varianciája a variancia szorozva a konstans négyzetével: Var [cx] = E [cx-cmx]2 = c2 E [x-mx] = c2 Var [x] Var [cx] = E [cx-cmx]2 = c2 E [x-mx] = c2 Var [x]

Torzítatlan és torzított becslés A mintavétel és mérés célja, hogy információt kapjunk a sokaságon az adott tulajdonság eloszlásáról, azaz meg tudjuk becsülni az eloszlás paramétereket a sokaság elemszámánál sokkal kisebb minta alapján. Egy becslés torzítatlan, ha a becsült és valóságos várható értékek megegyeznek, azaz: A hiba várható értéke 0 (a becsült paramétereket hullámvonal jelöli). A várható érték becslése A várható értéket úgy vezettük be véges elemű, diszkrét sokaságra, mint a sokaságra vett átlagát az adott tulajdonságnak. Ha most nem az egész sokaságot vesszük, csak egy mintát belőle, becsülhetjük úgy az egész sokaságra vonatkozó átlagot, hogy csak a mintára átlagolunk, azaz a várható értéket a következőképp becsüljük: , a becslés torzítatlan

A középérték eloszlásának tulajdonságai Egy n mérésből álló minta (egyes mérések eredményei) x1,...,xn valószínűségi változók. Az x1,...,xn valószínűségi változó számtani közepe: szintén valószínűségi változó, tehát tartozik hozzá egy f(x1,...,xn) valószínűségi sűrűségfüggvény. Az egyes mérési eredmények függetlenek egymástól, f(x1,...,xn) = f(x1)...f(xn). Mivel ugyanazt a mérést ismételjük, az egyes mérési eredmények várható értéke E[xi] = m és varianciája Var[xi] = s2 azonos minden egyes mérésre. Az összeg és konstansszoros várható értékére és varianciájára vonatkozó formulákat alkalmazva kapjuk, hogy: Azaz a középérték várható értéke megegyezik az egyes mérések várható értékével, varianciája viszont n-ed része az egyes mérésének.

az átlag várható értéke az torzítatlan becslését adja. Ha a sokaság véges elemű, azaz N független elemet tartalmazó halmazból 1 ≤ n ≤ N független mintát emelünk ki visszahelyezés nélkül véletlenszerűen kiválasztva és az eljárást sokszor ismételve, az átlag várható értéke az torzítatlan becslését adja. A becslés varianciája: n] az ahol N → ∞ esetén Az átlag szórása végtelen és ismert elemszámú sokaság esetén: (Cochran, 1962)

Variancia és szórás meghatározása Torzítatlan becslés varianciáját becsülhetjük az egyes mérések hibanégyzetének átlagával : Torzított becslésnél a variancia n-szeresének becsült értéke a valóságos variancia (n-1)-szerese: Azaz a variancia becslése a mérési eredményekből: A mérési eredmények korrigált tapasztalati szórása és a középérték tapasztalati szórása („standard deviation”): Mivel a középérték varianciája az egyes mérések varianciájának n-ed része

A centrális határeloszlás tétele A centrális határeloszlás tétele szerint bármilyen eloszlású sokaság esetén az n elemű minta számtani középértékének eloszlása a minta elemszámának növekedésével egy olyan normális eloszláshoz tart, melynek várható értéke megegyezik az eredeti eloszlás várható értékével. Ez azt jelenti, hogy ha már egyetlen mérési eredmény is átlagnak, pl. időátlagnak tekinthető, akkor várható, hogy az Gauss-eloszlású lesz. A mérési eredmények viszont nagyon gyakran ilyen átlagértékek. A gyakorlatban legtöbbször normális eloszlású mérési eredményekkel találkozunk.

Normális eloszlás: azok a valószínűségi változók, melyek értékét sok kismértékű véletlenszerű hatás befolyásolja. „m” az eloszlás várható értéke, „s” a szórás Gauss-függvény: u = (x-m) / s normalizált Gauss-függvény: A normalizált Gauss-eloszláshoz tartozó valószínűségi eloszlásfüggvény: (hibaintegrál), F()=1. A normalizált Gauss-függvény (hibafüggvény):

Alkalmazás: Milyen valószínűséggel esik a valószínűségi változó értéke a várható érték körüli, adott sugarú intervallumba? x1 = m-Δx és x2 = m+ Δx Transzformálás után (normalizált Gauss eloszláshoz) az intervallum: u = (x-m) / s u1 = - Δx/s = -v és u2 = Δx/s = v P(u1  u  u2) = F(u2) - F(u1) = F (v) - F (-v) Szimmetria miatt: F (-v) = 1 - F(v) P(-vuv) = 2 F (v) - 1 Annak a valószínűsége, hogy a változó értéke kiessen az adott szimmetrikus intervallumból, tehát egy adott tűrésnél jobban eltérjen a várható értéktől: P(u  -v u  v) = 1- (2f(v)-1) = 2(1-f(v)).

Konfidencia intervallum, megbízhatósági szint megadása Gauss-eloszlás esetén: a mérési eredmények a várható érték körüli egyszeres szórás (s) sugarú intervallumba 68,3%, a 2 s sugarú intervallumba 95,4 % valószínűséggel esnek. Adott P valószínűség (P konfidencia szint) : [m - k s , m + k s ] Konfidencia intervallum, melybe a mérési eredmények az adott P valószínűséggel beleesnek. P = 68,3% k = 1 P = 95,4% k = 2 P = 90% k = 1.65 P = 95% k = 1.96 u = S = 1 F(u) = 0.84134 P (-1 ≤ x ≤ 1) = F (1) – (1 – F(1))= 2 F(1) -1 = 0.683

Konfidencia kis mintaszámnál: A t paraméter meghatározása (Student-féle t-eloszlás) Mérési eredményeknél: a szórást sem ismerjük, csak becsüljük a középérték korrigált tapasztalati szórásával. Szórás is pontatlan → ugyanahhoz a valószínűséghez nagyobb számmal kell megszorozni a becsült szórást a konfidencia intervallum meghatározásánál, mint ezt egy ismert szórású Gauss-eloszlásnál tennénk. A Student-féle t paraméter értékei P konfidenciaszintnél és N mérésszámnál 0,8 0,9 0,95 0,975 0,99 0,995 2 3,078 6,314 12,706 25,452 63,657 127,32 3 1,886 2,920 4,303 6,205 9,925 14,089 4 1,638 2,353 3,182 4,176 5,841 7,453 5 1,553 2,132 2,776 3,495 4,604 5,598 6 1,476 2,015 2,571 3,163 4,032 4,773 7 1,440 1,943 2,447 2,969 3,707 4,317 8 1,415 1,895 2,365 2,841 3,499 4,029 9 1,397 1,860 2,306 2,752 3,355 3,832 10 1,383 1,833 2,262 2,685 3,250 3,690 20 1,328 1,729 2,093 2,433 2,861 3,174  1,282 1,645 1,960 2,241 2,576 2,807 X (mért mennyiség) = =  t

A középérték várható értékének és hibájának számítása www.avf.hu/tanarok/lipecz/AVF-STATISZTIKA/STAT-kovetkezteto/Kepletgyujtemeny-Kovetkezteto

A mintanagyság meghatározása átlagbecsléshez egyszerű véletlen mintánál Ha tudjuk, hogy az átlag becslésében nem akarunk egy megengedhető hibánál nagyobbat adott valószínűséggel megengedni, a szükséges mintaszám meghatározható a középérték hibájából. A megengedhető hiba lényegében a P valószínűséghez tartozó konfidencia intervallum: A hiba %-ban kifejezve: ahol A mintaszám független mintavétel esetén, végtelen sokaságra: Nem független mintavétel, véges sokaságra:

MINTASZÁM CSÖKKENTÉSÉNEK HATÁSA minta / év Mintaszámtól (n) függő tényező: Heti / napi: 2.7 Kétheti / napi: 3.8 Havi / napi: 5.5 Szezonális / napi: 9.6 Havi / kétheti: 1.5 Szezonális / kétheti: 2.5

Vízminőség paraméterek változékonysága (szórás) Függ: vízhozam, szezonális hatások (biológia), szennyezések

Vízminőségi jellemzők relatív szórása Víztípusok

Mintavétel hibája a szórás függvényében Víztípusok

Kívánt pontosság eléréséhez szükséges éves mintaszám Heti Kétheti Szezonális Kívánt pontosság eléréséhez szükséges éves mintaszám

Kívánt pontosság eléréséhez szükséges éves mintaszám

Tesztelés: Monte Carlo szimulációval A vízhozamok általában erősen, a vízminőségi változók komponenstől függően különböző mértékben mutatnak pozitív ferdülést, leggyakrabban lognormál eloszlásúak. Tesztelés: Monte Carlo szimulációval Példa: adatsorok ritkítása → becslés hibájának eloszlása: A Zala és a Tetves-patak éves átlagos összes P terhelésének becslésében elkövetett relatív hiba Monte Carlo szimulációból nyert empirikus eloszlása (N=365, n=12)

Adott tartósságú érték meghatározásának hibája MINTAVÉTELI HIBA Adott tartósságú érték meghatározásának hibája Relatív hiba: 1-p 0.1 0.5 1 5 10 20 31.6 14.1 9.9 4.4 3.0 2.0 30 40 50 60 70 80 90 1.5 1.2 1.0 0.8 0.7 0.3 90%-os tartósságú koncentráció becslési hibája a középérték hibájának háromszorosa!

Forrásmunkák: METROLÓGIA ÉS HIBASZÁMíTÁS (www.fke.bme.hu) Homolya András: Óravázlat a Geodézia II. tantárgy gyakorlataihoz (www.agt.bme.hu) Cochran (1962): Sampling technics