Mintavételi hiba, hibaszámítás

Slides:



Advertisements
Hasonló előadás
Hipotézis-ellenőrzés (Statisztikai próbák)
Advertisements

I. előadás.
II. előadás.
BECSLÉS A sokasági átlag becslése
Kvantitatív módszerek
Anyagáramok meghatározásának hibája és a becslés pontosításának lehetőségei.
Mintavételi hiba, hibaszámítás
Anyagáramok meghatározásának hibája és a becslés pontosításának lehetőségei.
 A monitoring célja az, hogy megalapozza a vízstátus egységes és átfogó felülvizsgálatát minden egyes vízgyűjtőkerületben és elősegítse a felszíni víztestek.
Műszeres analitika a 13. C,14. D, K és L osztály részére 2013/2014
1. A mérési adatok kezelése
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
Nem-paraméteres eljárások, több csoport összehasonlítása
ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Statisztika II. III. Dr. Szalka Éva, Ph.D..
Budapesti Műszaki és Gazdaságtudományi Egyetem
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
A normális eloszlás mint modell
STATISZTIKA II. 2. Előadás
STATISZTIKA II. 3. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Környezeti monitoring Feladat: Vízminőségi adatsor elemzése, terhelés (anyagáram) számítása Beadás: szorgalmi időszak vége (dec. 11.), KD: dec. 21.
Valószínűségszámítás
Mintavételi hiba, hibaszámítás
FELSZÍNI VÍZ MONITORING.
Felszíni víz monitoring
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 14. előadás.
Gazdaságstatisztika 13. előadás.
Hipotézis vizsgálat (2)
Következtető statisztika 9.
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Alapfogalmak.
© Farkas György : Méréstechnika
I. előadás.
Dr. Takács Attila – BME Geotechnikai Tanszék
Bevezetés a méréskiértékelésbe (BMETE80ME19) Intervallumbecslések 2014/
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Valószínűségszámítás II.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Mintavételi hiba, hibaszámítás
Mintavételi hiba, hibaszámítás
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Kvantitatív módszerek Becsléselmélet október 15.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
100-as szög méreteinek gyakorisága (n = 100) db mm Gyakoriság grafikon (adott méretű esetek db.)
Gazdaságstatisztika Becsléselmélet október 30. és november 5.
Kvantitatív módszerek
II. előadás.
Kvantitatív módszerek MBA és Számvitel mesterszak
Becsléselmélet - Konzultáció
I. Előadás bgk. uni-obuda
Kockázat és megbízhatóság
Gazdaságinformatikus MSc
Adatfeldolgozási ismeretek környezetvédelmi-mérés technikusok számára
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Előadás másolata:

Mintavételi hiba, hibaszámítás

Hibatípusok Véletlen hiba: A mérési eredmények a valóságos értéktől mindkét irányban azonos valószínűséggel, véletlenszerűen térnek el. Nagy számú mérés átlagát véve a véletlen hiba tetszőlegesen csökkenthető. Rendszeres (szisztematikus) hiba: A mérési eredmények a valóságos értéktől eltérő érték körül ingadoznak. Sokféle oka lehet, pl: Nem megfelelő mintavétel, Hibás vagy rosszul beállított műszer, Analitikai (módszertani) probléma, Figyelmen kívül hagyott, a mérést befolyásoló külső tényező (pl. hőmérséklet hatása).

Hibaszámítás elmélete (valószínűségelmélet) Mintavétel, mérés valószínűségi változó valószínűségi sűrűségfüggvény Normális eloszlás: azok a valószínűségi változók, melyek értékét sok kismértékű véletlenszerű hatás befolyásolja. „m” az eloszlás várható értéke, „s” a szórás Gauss-függvény: normalizált Gauss-függvény: u = (x-m) / s A normalizált Gauss-eloszláshoz tartozó valószínűségi eloszlásfüggvény: (hibaintegrál), F()=1. A normalizált Gauss-függvény (hibafüggvény):

Alkalmazás: Milyen valószínűséggel esik a valószínűségi változó értéke a várható érték körüli, adott sugarú intervallumba? x1 = m-Δx és x2 = m+ Δx Transzformálás után: u1 = - Δ x/s és u2 = Δ x/s = v P(u1  u  u2) = F(u2) - F(u1) = f(v) - f(-v) f(-u) = 1 - f(u) P(-vuv) = 2 f(v) - 1 Szimmetria miatt: Annak a valószínűsége, hogy a változó értéke kiessen az adott szimmetrikus intervallumból, tehát egy adott tűrésnél jobban eltérjen a várható értéktől: P(u  -v u  v) = 1- (2f(v)-1) = 2(1-f(v)).

A középérték eloszlásának tulajdonságai

A hiba meghatározása a matematikai statisztika módszereivel A centrális határeloszlás tétele szerint bármilyen eloszlású sokaság esetén az n elemű minta számtani középértékének eloszlása a minta elemszámának növekedésével egy olyan normális eloszláshoz tart, melynek várható értéke megegyezik az eredeti eloszlás várható értékével. Ez azt jelenti, hogy ha már egyetlen mérési eredmény is átlagnak, pl. időátlagnak tekinthető, akkor várható, hogy az Gauss-eloszlású lesz. A mérési eredmények viszont nagyon gyakran ilyen átlagértékek. A gyakorlatban legtöbbször normális eloszlású mérési eredményekkel találkozunk.

Tesztelés: Monte Carlo szimulációval A vízhozamok általában erősen, a vízminőségi változók komponenstől függően különböző mértékben mutatnak pozitív ferdülést, leggyakrabban lognormál eloszlásúak. Tesztelés: Monte Carlo szimulációval Példa: adatsorok ritkítása → becslés hibájának eloszlása: A Zala és a Tetves-patak éves átlagos összes P terhelésének becslésében elkövetett relatív hiba Monte Carlo szimulációból nyert empirikus eloszlása (N=365, n=12)

Variancia és szórás meghatározása Torzítatlan becslés varianciáját becsülhetjük az egyes mérések hibanégyzetének átlagával : Torzított becslésnél a variancia n-szeresének becsült értéke a valóságos variancia (n-1)-szerese A mérési eredmények korrigált tapasztalati szórása és a középérték tapasztalati szórása („standard deviation”):

Konfidencia intervallum, megbízhatósági szint megadása Gauss-eloszlás → a mérési eredmények a várható érték körüli s sugarú intervallumba 68,3%, a 2 s sugarú intervallumba 95,4 % valószínűséggel esnek. Adott P valószínűség (P konfidencia szint) : [m - k s , m + k s ] Konfidencia intervallum, melybe a mérési eredmények az adott P valószínűséggel beleesnek. P = 68,3% k = 1 P = 95,4% k = 2 P = 95% k = 1.96 u = S = 1 f(u) = 0.84134 P (-1 ≤ x ≤ 1) = f (1) – (1 – f(1))= 2 f(1) -1 = 0.683

A t paraméter meghatározása (Student-féle t-eloszlás) Mérési eredményeknél: a szórást sem ismerjük, csak becsüljük a középérték korrigált tapasztalati szórásával. Szórás is pontatlan → ugyanahhoz a valószínűséghez nagyobb számmal kell megszorozni a becsült szórást a konfidencia intervallum meghatározásánál, mint ezt egy ismert szórású Gauss-eloszlásnál tennénk. A Student-féle t paraméter értékei P konfidenciaszintnél és N mérésszámnál 0,8 0,9 0,95 0,975 0,99 0,995 2 3,078 6,314 12,706 25,452 63,657 127,32 3 1,886 2,920 4,303 6,205 9,925 14,089 4 1,638 2,353 3,182 4,176 5,841 7,453 5 1,553 2,132 2,776 3,495 4,604 5,598 6 1,476 2,015 2,571 3,163 4,032 4,773 7 1,440 1,943 2,447 2,969 3,707 4,317 8 1,415 1,895 2,365 2,841 3,499 4,029 9 1,397 1,860 2,306 2,752 3,355 3,832 10 1,383 1,833 2,262 2,685 3,250 3,690 20 1,328 1,729 2,093 2,433 2,861 3,174  1,282 1,645 1,960 2,241 2,576 2,807 X (mért mennyiség) = =  t

∞ Nn n N X S t α - = n 1 X S t α = (Cochran, 1962) Összefoglalva: N - elemű adatsor n - statisztikai minta α- „N” elemű idősor középérték relatív hibája, ha azt „n” mérésből becsüljük (Normál eloszlást feltételezve): (Cochran, 1962) átlag tapasztalati szórás Nn n N X S t α - = n 1 X S t α N = ∞ N → 95 %-os konfidencia szinten t=1.96 Relatív hiba: α = f (mintaszám, relatív szórás)

MINTASZÁM CSÖKKENTÉSÉNEK HATÁSA minta / év Mintaszámtól (n) függő tényező: Heti / napi: 2.7 Kétheti / napi: 3.8 Havi / napi: 5.5 Szezonális / napi: 9.6 Havi / kétheti: 1.5 Szezonális / kétheti: 2.5

Adott tartósságú érték meghatározásának hibája MINTAVÉTELI HIBA Adott tartósságú érték meghatározásának hibája Relatív hiba: 1-p 0.1 0.5 1 5 10 20 31.6 14.1 9.9 4.4 3.0 2.0 30 40 50 60 70 80 90 1.5 1.2 1.0 0.8 0.7 0.3 90%-os tartósságú koncentráció becslési hibája a középérték hibájának háromszorosa!

Vízminőség paraméterek változékonysága Függ: vízhozam, szezonális hatások (biológia), szennyezések

Vízminőségi jellemzők relatív szórása Víztípusok

Mintavétel hibája a szórás függvényében Víztípusok

Kívánt pontosság eléréséhez szükséges éves mintaszám Heti Kétheti Szezonális Kívánt pontosság eléréséhez szükséges éves mintaszám

Kívánt pontosság eléréséhez szükséges éves mintaszám