4. Kiugró adatok kezelése

Slides:



Advertisements
Hasonló előadás
Koordináták, függvények
Advertisements

Hipotézis-ellenőrzés (Statisztikai próbák)
I. előadás.
Petrovics Petra Doktorandusz
II. előadás.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
3. Két független minta összehasonlítása
Rangszám statisztikák
Feladat Egy új kísérleti készítmény hatását szeretnék vizsgálni egereken. 5 féle dózist adnak be 5 vizsgált egérnek, de nem sikerült mindegyik egérnek.
1. A mérési adatok kezelése
Csoportosítás megadása: Δx – csoport szélesség
Tömegspektroszkópia (MS = mass spectrometry)
Becsléselméleti ismétlés
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Közlekedésstatisztika
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Statisztika II. II. Dr. Szalka Éva, Ph.D..
III. előadás.
Hipotézisvizsgálat (1. rész) Kontingencia táblák
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Kvantitatív módszerek 8. Hipotézisvizsgálatok I. Nemparaméteres próbák Dr. Kövesi János.
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Az F-próba szignifikáns
Statisztika.
Kvantitatív Módszerek
Kvantitatív módszerek
Valószínűségszámítás
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Hipotézis vizsgálat (2)
Többváltozós adatelemzés
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Lineáris regresszió.
Adatleírás.
t A kétoldalú statisztikai próba alapfogalmai
Diszkrét változók vizsgálata
I. előadás.
Statisztikai alapfogalmak
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Közúti és Vasúti Járművek Tanszék. A ciklusidők meghatározása az elhasználódás folyamata alapján Az elhasználódás folyamata alapján kialakított ciklusrendhez.
A számítógépes elemzés alapjai

Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
100-as szög méreteinek gyakorisága (n = 100) db mm Gyakoriság grafikon (adott méretű esetek db.)
1 Statisztikai folyamatszabályozás D R. TÓTH ZSUZSANNA ESZTER M ENEDZSMENT ÉS VÁLLALATGAZDASÁGTAN TANSZÉK ÜZLETI TUDOMÁNYOK INTÉZET GAZDASÁG - ÉS TÁRSADALOMTUDOMÁNYI.
A számítógépes elemzés alapjai
Paraméteres próbák- gyakorlat
Kiváltott agyi jelek informatikai feldolgozása 2016
Diplomás Pályakövetési Kérdőív 2016
II. előadás.
Becsléselmélet - Konzultáció
Gazdaságstatisztika konzultáció
Nemparaméteres próbák
I. Előadás bgk. uni-obuda
Hipotézisvizsgálatok Paraméteres próbák
Sztochasztikus kapcsolatok I. Asszociáció
Kockázat és megbízhatóság
5. Kalibráció, függvényillesztés
A leíró statisztikák alapelemei
Mérések adatfeldolgozási gyakorlata vegyész technikusok számára
Adatfeldolgozási ismeretek környezetvédelmi-mérés technikusok számára
2. A Student-eloszlás Kemometria 2016/ A Student-eloszlás
Mérések adatfeldolgozási gyakorlata vegyész technikusok számára
Mérések adatfeldolgozási gyakorlata vegyész technikusok számára
1.3. Hipotézisvizsgálat, statisztikai próbák
Előadás másolata:

4. Kiugró adatok kezelése http://tp1957.atw.hu/km_4.ppt Kemometria 4. Kiugró adatok kezelése http://tp1957.atw.hu/km_4.ppt

Kiugró értékek kezelése (Dixon-teszt) A Dixon-féle Q-teszt során a Q=köz/terjedelem mennyiséget számoljuk ki és egy táblázatból vett Qkrit értékkel hasonlítjuk össze. Ha Q>Q krit, akkor a gyanús, kiugró adat elhagyható. Terjedelem: a legnagyobb és legkisebb elem közötti különbség. Köz: a gyanús és a legközelebbi szomszédja közötti különbség.

Dixon próba kritikus értékei (Qkrit) 90 % 95 % 99 % 3 0,941 0,970 0,994 4 0,765 0,829 0,926 5 0,642 0,710 0,821 6 0,560 0,625 0,740 7 0,507 0,568 0,680 8 0,468 0,526 0,634 9 0,437 0,493 0,598 10 0,412 0,466

Kiugró értékek kezelése – Dixon-teszt példák Egy mészkő minta CaO tartalmát vizsgálva a következő eredményeket kaptuk: 55,95 56,00 56,04 56,08 56,23 %. Az utolsó adat kiugró adatnak számít-e, vagyis el-hagyhatjuk vagy nem (90%-os megbízhatósági szinten)? Egy urán izotóp tömegspektroszkópiás meghatározása során a következő nyolc intenzitás adat született: 199,31 199,53 200,82 201,92 201,18 245,57. Az utolsó adat gyanúsnak tűnik. Elhagyható-e, azaz kiugró értéknek számít-e 95%-os megbízhatósági szinten? Fenol meghatározás HPLC-vel a következő adatokat szolgáltatta: 0,167 0,177 0,181 0,182 0,183 0,181 0,186 0,187 0,189. Az első adat gyanúsnak tűnhet. 90%-os megbízhatósági szinten elhagyhatjuk-e?

Kiugró értékek kezelése (Grubb-teszt) A Grubb-féle teszt során feltesszük, hogy normális elosz-lásúak az adataink, és azt vizsgáljuk, hogy a „gyanús” adat előfordulásának valószínűsége kisebb-e, mint a megbíz-hatósági szint. A következő képlet értékét számoljuk ki a gyanús adatra: Z = abs(átlag – x)/s Az átlagot az összes adatból számoljuk, s a tapasztalati szórás, x a „gyanús” adat értéke. A Z értéket egy táblázatból vett Zkrit értékkel hasonlítjuk össze: ha Z > Zkrit, akkor a gyanús érték elhagyható.

Grubb-teszt kritikus értékei (Zkrit) n 90 % 95 % 99% 3 1,15 4 1,42 1,46 1,49 5 1,60 1,67 1,75 6 1,73 1,82 1,94 7 1,83 2,10 8 1,91 2,03 2,22 9 1,98 2,11 2,32 10 2,18 2,41 11 2,09 2,23 2,48 12 2,13 2,29 2,55 n 90 % 95 % 99% 13 2,17 2,33 2,61 14 2,21 2,37 2,66 15 2,25 2.41 2,71 16 2,28 2,44 2,75 17 2,31 2,47 2,79 18 2,34 2,50 2,82 19 2,36 2,53 2,85 20 2,38 2,56 2,88 25 3,01 30 3,10 Forrás: https://cdn.slidesharecdn.com/ss_thumbnails/statisticstablesgrubbstest-150209143458-conversion-gate02-thumbnail-4.jpg?cb=1423492541, http://www.cmbi.ru.nl/redock/images/GrubbsTable.png

Kiugró értékek kezelése – Grubb-teszt példák Egy ötvözet minta réz tartalmát vizsgálva a következő eredményeket kaptuk: 85,95; 86,00; 86,04; 86,08; 86,23 %. Az utolsó adat kiugró adatnak számít-e, vagyis elhagyhatjuk vagy nem (90%-os megbízhatósági szinten)? Egy tömeg-spektroszkópiás mérés során a következő 6 intenzitás adat született: 99,31 99,53 100,82 101,92 101,18 145,57. Az utolsó adat gyanúsnak tűnik. Elhagyható-e, azaz kiugró értéknek számít-e 95%-os megbízhatósági szinten? Etanol meghatározás GC-vel a következő adatokat eredményezte: 36,7 37,7 38,1 38,2 38,3 38,1 38,6 38,7 38,9. Az első adat gyanúsnak tűnhet. 90%-os megbízhatósági szinten elhagyhatjuk-e?

Kiugró értékek kezelése – Grubb-teszt p2 Egy ércminta vastartalmát mérve a következő eredmé-nyeket kaptuk: 66,23 66,00 65,95 66,04 66,08 66,07 %. Az első adat kiugró adatnak számít-e, azaz elhagyhatjuk vagy nem (95%-os megbízhatósági szinten)? Mindkét teszttel vizsgálja meg!