Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaEdit Katona Megváltozta több, mint 6 éve
1
Adatfeldolgozási ismeretek környezetvédelmi-mérés technikusok számára
Középértékek, szórás, box plot
2
Középérték fogalmak Adathalmazok egyik fontos jellemzője valamilyen fajta középérték. A statisztikai középérték mutatók: medián módusz számtani közép harmonikus közép mértani közép négyzetes közép logaritmikus közép hatványközepek
3
Medián A medián egy nagyság szerint sorba rendezett n elemű adatsor esetében a középső elemet jelenti. Ha az n elemszám páratlan, akkor egyetlen középső elem van, míg ha az n páros, akkor a mediánt a két középső elem számtani átlagaként számítjuk. Ennek megfelelően egy sorba rendezett n elemű adatsor estében a medián definíciója a következőképpen adható meg. Mennyi a mediánja: 12,0; 12,3; 12,1; 122? Forrás:
4
Módusz A módusz egy sorozat (pl. párhuzamos leolvasások, fogyások) leggyakrabban előforduló eleme. Egy üzemben 24 órán keresztül feljegyezték az óránkénti gépleállások számát. A következő értékeket kapták: Óránkénti leállások száma 1 2 3 4 5 6 Előfordulás gyakorisága 5 4 3 2 1 Két módusz! (1 és 2) Forrás: Forrás:
5
Számtani közép A számtani közép (A) vagy aritmetikai középérték elemű adatsor esetében a középső elemet jelenti. n darab szám átlaga, azaz a számok összegének n-ed része: A hétköznapi életben ezt simán átlagnak nevezzük. Ezt használtuk pl. a fogyás átlagok számítására. Erősen hatnak rá a „kilógó” adatok (pl. véletlenül eggyel több nullát írunk, 120 helyett 1200-at). Ezért van, hogy a többitől erősen eltérő értéket az átlagolásból kihagyjuk. Számítsa ki a számtani közepet: 12,0; 12,3; 12,1; 122! Forrás:
6
Harmonikus közép A harmonikus közép (H) a számok reciprokaiból számított számtani közép reciproka. n darab szám harmonikus közepe: Több szám harmonikus közepe inkább a kisebb számok felé húz; ezzel a nagy számok hatása csökken, a kis számoké megnő. A harmonikus közepet a fizikában többek között átlag- sebesség kiszámítására használhatjuk, ha az adott sebes- ségekkel ugyanannyi utakat tettünk meg. Ell.: s = 20 km v1 = 5 km/h v1 = 2 km/h vátlag = ? Forrás:
7
Mértani közép Két nemnegatív szám mértani (geometriai) középarányosa (G vagy M) egyenlő a két szám szorzatának négyzet- gyökével: n darab nemnegatív szám mértani közepe a számok szorzatának n-edik gyöke: Exponenciális változások átlagának számítására használ-ható, pl. szaporodás, növekedés (ár, infláció, kamat). Tegyük fel, hogy egy almafa az első évben 100, az azt követő években rendre 180, 210 és 300 almát terem. Számítsuk ki az éves átlagos növekedést számtani és mértani átlaggal is! (Számtani átlaggal: 46,5 % mértanival 44,2 %. Ez a jó!) Forrás:
8
Négyzetes közép n darab szám négyzetes közepe a számok négyzeteiből számolt számtani közép négyzetgyöke: Elektromos mennyiségek, hullámok esetén sokoldalúan alkalmazható. A függvényillesztésnél (legkisebb négyzetek módszere) ehhez hasonló mennyiséget használtunk. Számítsa ki a négyzetes közepet: 12,0; 12,3; 12,1; 122! Forrás:
9
Logaritmikus közép Két pozitív szám (a≠b) logaritmikus közepe:
Értéke a számtani és mértani közép között található. A hőcserélő számításának alapját képező logaritmikus közepes hőmérséklet-különbséget a hőcserélő két végpontjára előzetesen megállapított nagyobb (ΔtN) és kisebb (ΔtK) hőmérséklet-különbségből számítják ki: Számítsa ki a logaritmikus közepet: 12; 70! Forrás:
10
A mérési hiba „Egy mérés nem mérés” – hallottuk már sokszor. Miért?
A valódi értéket abszolút pontosan nem tudjuk megmérni. A méréssel csak közelítjük azt. Több mérést végezve, az átlag – reményeink szerint – a valódi értéket egyre jobban közelíti. Egy mérés esetén, ha valami hibát követünk el, nem fogjuk észrevenni. A párhuzamos mérések átlaga, a várható érték, a valódi érték becslése. A várható értéket rendszeres és véletlen hibák terhelhetik. Rendszeres hiba lehet pl. hibás leolvasás (parallaxis). Kétféle létezik: fix és arányos. A véletlen hiba a párhuzamos mérések számának növelésével csökken.
11
Rendszeres és véletlen hiba
jel Rendszeres hiba Valódi érték Véletlen hiba Várható érték x1 xi xn Egymás utáni mintavételek
12
A várható érték változása a mérések számával
Mért érték Várható érték
13
A várható érték és a szórás
Egy mérési sorozat várható értékét ( ) a mérési sorozat elemeinek számtani közepeként számoljuk: A szórás (σ) a párhuzamos mérési eredmények közötti eltérés jellemzésére szolgál; a várható értékek körüli mérési eredmények szoros vagy laza „csoportosulását” jellemzi. Gyakorlatban a korrigált tapasztalati szórással (s, sd) becsüljük.
14
A korrigált tapasztalati szórás
A párhuzamos mérési adatok eloszlása igen sok adat esetén közelít a Gauss-eloszláshoz (normális eloszlás): Az „” valódi érték helyébe a várható értéket ( ), a „σ” szórás helyébe az „s” tapasztalati szórást írhatjuk. A korrigált tapasztalati szórás (s, más néven standard deviáció, sd) számítása:
15
Párhuzamos mérési adatok értékelése
Az előbbiek alapján belátható, hogy egy méréshez tartozó adatok közül azok, amelyek ±3·s tartományon kívül esnek, durva mérési hibákból erednek, valószínűleg jobb, ha elhagyjuk azokat. Egy mérésre a következő számértékek adódtak: 11,2; 11,3; 11,1; 10,4. Számítsa ki az átlagot, a szórást, ha kell, hagyjon el adatot! = 11,0 s = 0,41. Az utolsó adat gyanúsan messze van az átlagtól. Számítsuk ki az átlagot és a szórást annak elhagyásával! = 11,2 s = 0,10. Az utolsó adat a ±3·s tartományon kívül van, helyes volt az elhagyás.
16
A relatív hiba A relatív hiba az abszolút hiba eredményhez viszonyított értéke. Legtöbb esetben ez a fontosabb. A relatív hiba mértékeként a tapasztalati szórásnak (s, sd) az átlaghoz viszonyított %-os értékét használjuk: Az előbbi feladat esetében: = 11,2 s = 0,10 A relatív szórás: rsd = 0,9%
17
Box plot A terjedelem, az interkvartilis terjedelem, a medián, a legkisebb és a legnagyobb érték ábrázolása. Az interkvartilis terjedelmet egy doboz mutatja, ebben van behúzva a medián, a legnagyobb és legkisebb értékek pedig egy-egy talpként vannak ábrázolva. A doboz elhelyezkedése a teljes terjedelemhez képest, illetve a medián helyzete a dobozon belül szemléletes képet ad az eloszlásról. terjedelem legkisebb érték Forrás: legnagyobb érték első negyed harmadik negyed medián Kép:
18
Box plot feladat Készítsen box plot ábrát a következő adatokból! 63 57
69 53 79 68 51 61 72 71 65 67 64 58 52 66 70 86 84 59 adat 51 52 53 gyakoriság 51 86 67,5 64 58
19
Box plot Kép:
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.