Adatfeldolgozási ismeretek környezetvédelmi-mérés technikusok számára Középértékek, szórás, box plot http://tp1957.atw.hu/afi_koz.ppt
Középérték fogalmak Adathalmazok egyik fontos jellemzője valamilyen fajta középérték. A statisztikai középérték mutatók: medián módusz számtani közép harmonikus közép mértani közép négyzetes közép logaritmikus közép hatványközepek
Medián A medián egy nagyság szerint sorba rendezett n elemű adatsor esetében a középső elemet jelenti. Ha az n elemszám páratlan, akkor egyetlen középső elem van, míg ha az n páros, akkor a mediánt a két középső elem számtani átlagaként számítjuk. Ennek megfelelően egy sorba rendezett n elemű adatsor estében a medián definíciója a következőképpen adható meg. Mennyi a mediánja: 12,0; 12,3; 12,1; 122? Forrás: https://hu.wikipedia.org/wiki/Medi%C3%A1n
Módusz A módusz egy sorozat (pl. párhuzamos leolvasások, fogyások) leggyakrabban előforduló eleme. Egy üzemben 24 órán keresztül feljegyezték az óránkénti gépleállások számát. A következő értékeket kapták: Óránkénti leállások száma 1 2 3 4 5 6 Előfordulás gyakorisága 5 4 3 2 1 0 1 2 3 4 5 6 Két módusz! (1 és 2) Forrás: https://hu.wikipedia.org/wiki/M%C3%B3dusz Forrás: https://hu.wikipedia.org/wiki/M%C3%B3dusz
Számtani közép A számtani közép (A) vagy aritmetikai középérték elemű adatsor esetében a középső elemet jelenti. n darab szám átlaga, azaz a számok összegének n-ed része: A hétköznapi életben ezt simán átlagnak nevezzük. Ezt használtuk pl. a fogyás átlagok számítására. Erősen hatnak rá a „kilógó” adatok (pl. véletlenül eggyel több nullát írunk, 120 helyett 1200-at). Ezért van, hogy a többitől erősen eltérő értéket az átlagolásból kihagyjuk. Számítsa ki a számtani közepet: 12,0; 12,3; 12,1; 122! Forrás: https://hu.wikipedia.org/wiki/Sz%C3%A1mtani_k%C3%B6z%C3%A9p
Harmonikus közép A harmonikus közép (H) a számok reciprokaiból számított számtani közép reciproka. n darab szám harmonikus közepe: Több szám harmonikus közepe inkább a kisebb számok felé húz; ezzel a nagy számok hatása csökken, a kis számoké megnő. A harmonikus közepet a fizikában többek között átlag- sebesség kiszámítására használhatjuk, ha az adott sebes- ségekkel ugyanannyi utakat tettünk meg. Ell.: s = 20 km v1 = 5 km/h v1 = 2 km/h vátlag = ? Forrás: https://hu.wikipedia.org/wiki/Harmonikus_k%C3%B6z%C3%A9p
Mértani közép Két nemnegatív szám mértani (geometriai) középarányosa (G vagy M) egyenlő a két szám szorzatának négyzet- gyökével: n darab nemnegatív szám mértani közepe a számok szorzatának n-edik gyöke: Exponenciális változások átlagának számítására használ-ható, pl. szaporodás, növekedés (ár, infláció, kamat). Tegyük fel, hogy egy almafa az első évben 100, az azt követő években rendre 180, 210 és 300 almát terem. Számítsuk ki az éves átlagos növekedést számtani és mértani átlaggal is! (Számtani átlaggal: 46,5 % mértanival 44,2 %. Ez a jó!) Forrás: https://hu.wikipedia.org/wiki/M%C3%A9rtani_k%C3%B6z%C3%A9p
Négyzetes közép n darab szám négyzetes közepe a számok négyzeteiből számolt számtani közép négyzetgyöke: Elektromos mennyiségek, hullámok esetén sokoldalúan alkalmazható. A függvényillesztésnél (legkisebb négyzetek módszere) ehhez hasonló mennyiséget használtunk. Számítsa ki a négyzetes közepet: 12,0; 12,3; 12,1; 122! Forrás: https://hu.wikipedia.org/wiki/N%C3%A9gyzetes_k%C3%B6z%C3%A9p
Logaritmikus közép Két pozitív szám (a≠b) logaritmikus közepe: Értéke a számtani és mértani közép között található. A hőcserélő számításának alapját képező logaritmikus közepes hőmérséklet-különbséget a hőcserélő két végpontjára előzetesen megállapított nagyobb (ΔtN) és kisebb (ΔtK) hőmérséklet-különbségből számítják ki: Számítsa ki a logaritmikus közepet: 12; 70! Forrás: http://tudasbazis.sulinet.hu/hu/szakkepzes/vegyipar/muszaki-ismeretek/a-hocserelok-mertekado-homersekletkulonbsege/az-atlagos-homersekletkulonbseg
A mérési hiba „Egy mérés nem mérés” – hallottuk már sokszor. Miért? A valódi értéket abszolút pontosan nem tudjuk megmérni. A méréssel csak közelítjük azt. Több mérést végezve, az átlag – reményeink szerint – a valódi értéket egyre jobban közelíti. Egy mérés esetén, ha valami hibát követünk el, nem fogjuk észrevenni. A párhuzamos mérések átlaga, a várható érték, a valódi érték becslése. A várható értéket rendszeres és véletlen hibák terhelhetik. Rendszeres hiba lehet pl. hibás leolvasás (parallaxis). Kétféle létezik: fix és arányos. A véletlen hiba a párhuzamos mérések számának növelésével csökken.
Rendszeres és véletlen hiba jel Rendszeres hiba Valódi érték Véletlen hiba Várható érték x1 xi xn Egymás utáni mintavételek
A várható érték változása a mérések számával Mért érték Várható érték
A várható érték és a szórás Egy mérési sorozat várható értékét ( ) a mérési sorozat elemeinek számtani közepeként számoljuk: A szórás (σ) a párhuzamos mérési eredmények közötti eltérés jellemzésére szolgál; a várható értékek körüli mérési eredmények szoros vagy laza „csoportosulását” jellemzi. Gyakorlatban a korrigált tapasztalati szórással (s, sd) becsüljük.
A korrigált tapasztalati szórás A párhuzamos mérési adatok eloszlása igen sok adat esetén közelít a Gauss-eloszláshoz (normális eloszlás): Az „” valódi érték helyébe a várható értéket ( ), a „σ” szórás helyébe az „s” tapasztalati szórást írhatjuk. A korrigált tapasztalati szórás (s, más néven standard deviáció, sd) számítása:
Párhuzamos mérési adatok értékelése Az előbbiek alapján belátható, hogy egy méréshez tartozó adatok közül azok, amelyek ±3·s tartományon kívül esnek, durva mérési hibákból erednek, valószínűleg jobb, ha elhagyjuk azokat. Egy mérésre a következő számértékek adódtak: 11,2; 11,3; 11,1; 10,4. Számítsa ki az átlagot, a szórást, ha kell, hagyjon el adatot! = 11,0 s = 0,41. Az utolsó adat gyanúsan messze van az átlagtól. Számítsuk ki az átlagot és a szórást annak elhagyásával! = 11,2 s = 0,10. Az utolsó adat a ±3·s tartományon kívül van, helyes volt az elhagyás.
A relatív hiba A relatív hiba az abszolút hiba eredményhez viszonyított értéke. Legtöbb esetben ez a fontosabb. A relatív hiba mértékeként a tapasztalati szórásnak (s, sd) az átlaghoz viszonyított %-os értékét használjuk: Az előbbi feladat esetében: = 11,2 s = 0,10 A relatív szórás: rsd = 0,9%
Box plot A terjedelem, az interkvartilis terjedelem, a medián, a legkisebb és a legnagyobb érték ábrázolása. Az interkvartilis terjedelmet egy doboz mutatja, ebben van behúzva a medián, a legnagyobb és legkisebb értékek pedig egy-egy talpként vannak ábrázolva. A doboz elhelyezkedése a teljes terjedelemhez képest, illetve a medián helyzete a dobozon belül szemléletes képet ad az eloszlásról. terjedelem legkisebb érték Forrás: http://www.tankonyvtar.hu/hu/tartalom/tamop425/0010_2A_21_Nemeth_Renata-Simon_David_Tarsadalomstatisztika_magyar_es_angol_nyelven/ch06s03.html legnagyobb érték első negyed harmadik negyed medián Kép: https://dr282zn36sxxg.cloudfront.net/datastreams/f-d%3A0aa004fd8840e42e1f7b68e5688f867a2c8e00281be5fdd4986f3ead%2BIMAGE%2BIMAGE.1
Box plot feladat Készítsen box plot ábrát a következő adatokból! 63 57 69 53 79 68 51 61 72 71 65 67 64 58 52 66 70 86 84 59 adat 51 52 53 gyakoriság 51 86 67,5 64 58
Box plot Kép: http://embed.wistia.com/deliveries/bdc37abd6d6d46336f1bda2944222fc8a6999b87.jpg