Adatfeldolgozási ismeretek környezetvédelmi-mérés technikusok számára

Slides:



Advertisements
Hasonló előadás
A mérés eredménye és a mérési hibák
Advertisements

2. előadás.
I. előadás.
a terület meghatározása
Petrovics Petra Doktorandusz
Gazdaságelemzési és Statisztikai Tanszék
Műszeres analitika a 13. C,14. D, K és L osztály részére 2013/2014
1. A mérési adatok kezelése
Csoportosítás megadása: Δx – csoport szélesség
Mérési pontosság (hőmérő)
Közlekedésstatisztika
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Adatfeldolgozás.
Előadó: Prof. Dr. Besenyei Lajos
5. előadás.
3. előadás.
3. előadás.
A középérték mérőszámai
Microsoft Excel Függvények VI..
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
Matematikai alapok és valószínűségszámítás
Egytényezős variancia-analízis
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Statisztika.
Készítette: Horváth Zoltán (2012)
Kvantitatív módszerek
Leíró statisztika III..
Valószínűségszámítás
EREDMÉNYEK, ADATOK FELDOLGOZÁSA
Méréstechnika.
Hipotézis vizsgálat (2)
Alapsokaság (populáció)
Alapfogalmak.
Lineáris regresszió.
Adatleírás.
© Farkas György : Méréstechnika
© Farkas György : Méréstechnika
Dr Gunther Tibor PhD II/2.
I. előadás.
Statisztikai alapfogalmak
Viszonyszámok A viszonyszám két egymással logikai kapcsolatban álló statisztikai adat hányadosa V= A/B V: a viszonyszám A:a viszonyítás alapját képező.
Számtani és mértani közép
Középértékek – helyzeti középértékek
Valószínűségszámítás II.
Átlag, medián.
Közúti és Vasúti Járművek Tanszék. A ciklusidők meghatározása az elhasználódás folyamata alapján Az elhasználódás folyamata alapján kialakított ciklusrendhez.
A számítógépes elemzés alapjai
Konzultáció – Leíró statisztika október 22. Gazdaságstatisztika.
A számítógépes elemzés alapjai
Leíró statisztika gyakorló feladatok október 15.
Haladó Pénzügyek Vezetés szervezés MSC I. évfolyam I
Szóródási mérőszámok, alakmutatók, helyzetmutatók
II. előadás.
Kvantitatív módszerek MBA és Számvitel mesterszak
I. Előadás bgk. uni-obuda
Haladó Pénzügyek Vezetés szervezés MSC I. évfolyam I
Adatfeldolgozási ismeretek műszeres analitikus technikusok számára
Adatsorok típusai, jellegadó értékei
5. előadás.
A szórás típusú egyenlőtlenségi mutatók
A leíró statisztikák alapelemei
Mérések adatfeldolgozási gyakorlata vegyész technikusok számára
2. A Student-eloszlás Kemometria 2016/ A Student-eloszlás
Rangsoroláson és pontozáson alapuló komplex mutatók
Mérések adatfeldolgozási gyakorlata vegyész technikusok számára
Mérések adatfeldolgozási gyakorlata vegyész technikusok számára
Mérési skálák, adatsorok típusai
Előadás másolata:

Adatfeldolgozási ismeretek környezetvédelmi-mérés technikusok számára Középértékek, szórás, box plot http://tp1957.atw.hu/afi_koz.ppt

Középérték fogalmak Adathalmazok egyik fontos jellemzője valamilyen fajta középérték. A statisztikai középérték mutatók: medián módusz számtani közép harmonikus közép mértani közép négyzetes közép logaritmikus közép hatványközepek

Medián A medián egy nagyság szerint sorba rendezett n elemű adatsor esetében a középső elemet jelenti. Ha az n elemszám páratlan, akkor egyetlen középső elem van, míg ha az n páros, akkor a mediánt a két középső elem számtani átlagaként számítjuk. Ennek megfelelően egy sorba rendezett n elemű adatsor estében a medián definíciója a következőképpen adható meg. Mennyi a mediánja: 12,0; 12,3; 12,1; 122? Forrás: https://hu.wikipedia.org/wiki/Medi%C3%A1n

Módusz A módusz egy sorozat (pl. párhuzamos leolvasások, fogyások) leggyakrabban előforduló eleme. Egy üzemben 24 órán keresztül feljegyezték az óránkénti gépleállások számát. A következő értékeket kapták: Óránkénti leállások száma 1 2 3 4 5 6 Előfordulás gyakorisága 5 4 3 2 1 0 1 2 3 4 5 6 Két módusz! (1 és 2) Forrás: https://hu.wikipedia.org/wiki/M%C3%B3dusz Forrás: https://hu.wikipedia.org/wiki/M%C3%B3dusz

Számtani közép A számtani közép (A) vagy aritmetikai középérték elemű adatsor esetében a középső elemet jelenti. n darab szám átlaga, azaz a számok összegének n-ed része: A hétköznapi életben ezt simán átlagnak nevezzük. Ezt használtuk pl. a fogyás átlagok számítására. Erősen hatnak rá a „kilógó” adatok (pl. véletlenül eggyel több nullát írunk, 120 helyett 1200-at). Ezért van, hogy a többitől erősen eltérő értéket az átlagolásból kihagyjuk. Számítsa ki a számtani közepet: 12,0; 12,3; 12,1; 122! Forrás: https://hu.wikipedia.org/wiki/Sz%C3%A1mtani_k%C3%B6z%C3%A9p

Harmonikus közép A harmonikus közép (H) a számok reciprokaiból számított számtani közép reciproka. n darab szám harmonikus közepe: Több szám harmonikus közepe inkább a kisebb számok felé húz; ezzel a nagy számok hatása csökken, a kis számoké megnő. A harmonikus közepet a fizikában többek között átlag- sebesség kiszámítására használhatjuk, ha az adott sebes- ségekkel ugyanannyi utakat tettünk meg. Ell.: s = 20 km v1 = 5 km/h v1 = 2 km/h vátlag = ? Forrás: https://hu.wikipedia.org/wiki/Harmonikus_k%C3%B6z%C3%A9p

Mértani közép Két nemnegatív szám mértani (geometriai) középarányosa (G vagy M) egyenlő a két szám szorzatának négyzet- gyökével: n darab nemnegatív szám mértani közepe a számok szorzatának n-edik gyöke: Exponenciális változások átlagának számítására használ-ható, pl. szaporodás, növekedés (ár, infláció, kamat). Tegyük fel, hogy egy almafa az első évben 100, az azt követő években rendre 180, 210 és 300 almát terem. Számítsuk ki az éves átlagos növekedést számtani és mértani átlaggal is! (Számtani átlaggal: 46,5 % mértanival 44,2 %. Ez a jó!) Forrás: https://hu.wikipedia.org/wiki/M%C3%A9rtani_k%C3%B6z%C3%A9p

Négyzetes közép n darab szám négyzetes közepe a számok négyzeteiből számolt számtani közép négyzetgyöke: Elektromos mennyiségek, hullámok esetén sokoldalúan alkalmazható. A függvényillesztésnél (legkisebb négyzetek módszere) ehhez hasonló mennyiséget használtunk. Számítsa ki a négyzetes közepet: 12,0; 12,3; 12,1; 122! Forrás: https://hu.wikipedia.org/wiki/N%C3%A9gyzetes_k%C3%B6z%C3%A9p

Logaritmikus közép Két pozitív szám (a≠b) logaritmikus közepe: Értéke a számtani és mértani közép között található. A hőcserélő számításának alapját képező logaritmikus közepes hőmérséklet-különbséget a hőcserélő két végpontjára előzetesen megállapított nagyobb (ΔtN) és kisebb (ΔtK) hőmérséklet-különbségből számítják ki: Számítsa ki a logaritmikus közepet: 12; 70! Forrás: http://tudasbazis.sulinet.hu/hu/szakkepzes/vegyipar/muszaki-ismeretek/a-hocserelok-mertekado-homersekletkulonbsege/az-atlagos-homersekletkulonbseg

A mérési hiba „Egy mérés nem mérés” – hallottuk már sokszor. Miért? A valódi értéket abszolút pontosan nem tudjuk megmérni. A méréssel csak közelítjük azt. Több mérést végezve, az átlag – reményeink szerint – a valódi értéket egyre jobban közelíti. Egy mérés esetén, ha valami hibát követünk el, nem fogjuk észrevenni. A párhuzamos mérések átlaga, a várható érték, a valódi érték becslése. A várható értéket rendszeres és véletlen hibák terhelhetik. Rendszeres hiba lehet pl. hibás leolvasás (parallaxis). Kétféle létezik: fix és arányos. A véletlen hiba a párhuzamos mérések számának növelésével csökken.

Rendszeres és véletlen hiba jel Rendszeres hiba Valódi érték Véletlen hiba Várható érték x1 xi xn Egymás utáni mintavételek

A várható érték változása a mérések számával Mért érték Várható érték

A várható érték és a szórás Egy mérési sorozat várható értékét ( ) a mérési sorozat elemeinek számtani közepeként számoljuk: A szórás (σ) a párhuzamos mérési eredmények közötti eltérés jellemzésére szolgál; a várható értékek körüli mérési eredmények szoros vagy laza „csoportosulását” jellemzi. Gyakorlatban a korrigált tapasztalati szórással (s, sd) becsüljük.

A korrigált tapasztalati szórás A párhuzamos mérési adatok eloszlása igen sok adat esetén közelít a Gauss-eloszláshoz (normális eloszlás): Az „” valódi érték helyébe a várható értéket ( ), a „σ” szórás helyébe az „s” tapasztalati szórást írhatjuk. A korrigált tapasztalati szórás (s, más néven standard deviáció, sd) számítása:

Párhuzamos mérési adatok értékelése Az előbbiek alapján belátható, hogy egy méréshez tartozó adatok közül azok, amelyek ±3·s tartományon kívül esnek, durva mérési hibákból erednek, valószínűleg jobb, ha elhagyjuk azokat. Egy mérésre a következő számértékek adódtak: 11,2; 11,3; 11,1; 10,4. Számítsa ki az átlagot, a szórást, ha kell, hagyjon el adatot! = 11,0 s = 0,41. Az utolsó adat gyanúsan messze van az átlagtól. Számítsuk ki az átlagot és a szórást annak elhagyásával! = 11,2 s = 0,10. Az utolsó adat a ±3·s tartományon kívül van, helyes volt az elhagyás.

A relatív hiba A relatív hiba az abszolút hiba eredményhez viszonyított értéke. Legtöbb esetben ez a fontosabb. A relatív hiba mértékeként a tapasztalati szórásnak (s, sd) az átlaghoz viszonyított %-os értékét használjuk: Az előbbi feladat esetében: = 11,2 s = 0,10 A relatív szórás: rsd = 0,9%

Box plot A terjedelem, az interkvartilis terjedelem, a medián, a legkisebb és a legnagyobb érték ábrázolása. Az interkvartilis terjedelmet egy doboz mutatja, ebben van behúzva a medián, a legnagyobb és legkisebb értékek pedig egy-egy talpként vannak ábrázolva. A doboz elhelyezkedése a teljes terjedelemhez képest, illetve a medián helyzete a dobozon belül szemléletes képet ad az eloszlásról. terjedelem legkisebb érték Forrás: http://www.tankonyvtar.hu/hu/tartalom/tamop425/0010_2A_21_Nemeth_Renata-Simon_David_Tarsadalomstatisztika_magyar_es_angol_nyelven/ch06s03.html legnagyobb érték első negyed harmadik negyed medián Kép: https://dr282zn36sxxg.cloudfront.net/datastreams/f-d%3A0aa004fd8840e42e1f7b68e5688f867a2c8e00281be5fdd4986f3ead%2BIMAGE%2BIMAGE.1

Box plot feladat Készítsen box plot ábrát a következő adatokból! 63 57 69 53 79 68 51 61 72 71 65 67 64 58 52 66 70 86 84 59 adat 51 52 53 gyakoriság 51 86 67,5 64 58

Box plot Kép: http://embed.wistia.com/deliveries/bdc37abd6d6d46336f1bda2944222fc8a6999b87.jpg