Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

bináris (előnyei-hátrányai) - borításbecslés

Hasonló előadás


Az előadások a következő témára: "bináris (előnyei-hátrányai) - borításbecslés"— Előadás másolata:

1 bináris (előnyei-hátrányai) - borításbecslés
Változótípusok Skála Definíció Példák Nominális kvalitatív, nevekből áll nincs rangsor ivar, betegség, fajnév, cselekvési típus, prezencia-abszencia adatok Ordinális kvalitatív, rangsor lehetséges értékek közti távolság tetszőleges agresszivitás: erős, közepes, gyenge, borítás skálák, W-értékek, rangok Intervallum kvantitatív, rangsor, értékek közti különbség mutatja a távolságot önkényes nulla pont arányok nem értelmezhetők C hőmérséklet, IQ Arány/ hányados kvantitatív, rangsor, értékek közti intervallum mutatja a távolságot valódi nullapont arányok értelmezhetőek testsúly, magasság, életkor, mért értékek A megkülönböztetés fontos: kváziátlagok a statisztikában általában mérhető és megállapítható változókat különböztetnek meg. Közöttük egyirányú konverzió lehetséges folytonos vagy diszkrét közöttük átmenet: Simon Levin statisztikus véleménye (termésszám-terméssúly) bináris (előnyei-hátrányai) - borításbecslés

2 Fajszámok alapján borítások alapján

3 Hipotézisvizsgálatok
Populáció, minta. Elméleti és tapasztalati középértékek és szóródási mutatók. Szabadsági fok. Konfidenciaintervallumok Azt az intervallumot, amelyik egy ismeretlen értéket (középérték, medián, szórás, variációs együttható, relatív gyakoriság, stb.) egy meghatározott valószínűséggel tartalmaz, megbízhatósági tartománynak vagy konfidenciaintervallumnak nevezzük. Szignifikanciaszint, első- és másodfajú hiba. Egyoldalú és kétoldalú próbák. A próbák ereje. Egymintás t-próba Kétmintás t-próba F-próba Maximális F, vagy Bartlett-próba Egyszempontos varianaciaanalízis elve Statisztikai próba-határozó Szignifikáns különbségek?

4 STATISZTIKAI ALAPFOGALMAK:
Átlag, szórás Legyenek valamely n elemű populáció egy x változójának mért vagy számított értékei: Számtani átlag szórás

5 Középérték további mutatói:
Módusz A leggyakrabban előforduló érték. Medián A sorba rendezett adatok középső értéke. Ha n páratlan, akkor az értékek közül a nagyság szerint rendezett sorban a középső, ha n páros, akkor a két középső érték számtani közepe. Mértani átlag Az alapadatok szorzatának annyiadik gyöke, ahány adat van. Harmonikus átlag A reciprok adatok átlagának reciproka. Kváziátlag: ordinális változókból számolt átlag

6 Szóródási tendencia további mutatói:
Terjedelem A legnagyobb és a legkisebb érték közötti különbség. Szórás A várható értéktől való eltérés várható értéke – dimenziója az eredeti Variancia A szórás négyzete. - számításokhoz Variációs együttható – dimenzió nélküli Megadás: az alapadatoknál eggyel több értékes jegyre

7 Valószínűségek megadása Egyszerű esetek: Pénz, kocka
Bonyolult esetek: más A priori a posteriori A nagy számok törvénye A nagy számok törvénye a valószínűségszámítás egyik alapvető tétele. A törvény azt mondja ki, hogy egy kísérletet sokszor elvégezve az eredmények átlaga egyre közelebb lesz a várható értékhez. Nem jelenti ugyanakkor azt, hogy az esélyek kiegyenlítődnek Kapcsolata a mintavételi elemszámmal

8 Valószínűségek megadása számításokkal
Binomiális eloszlás 2 lehetséges kimenetel, egyik bekövetkezési valószínűsége p, a másiké q, p+q=1. Annak valószínűsége, hogy n db kiválasztáskor éppen k esetben következik be a p valószínűségű esemény: pk*(1-p)n-k a lehetséges sorozatok száma (ismétléses permutáció) n!/((k!*(n-k)!) Az eloszlásnak két paramétere van, n és p. Ez végtelen mintákra vonatkozik, egy egyszerűbb véges urnamodell analóg kérdése 

9 Egy urnában levő M darab golyó közül s piros, és visszatevés nélkül kiválasztunk n darabot, mi a valószínűsége annak, hogy a mintában éppen k darab piros golyó lesz (M≥n, k≤n)? Az eloszlás hipergeometrikus, ha n és s elég nagy, az eloszlás jól közelíthető a binomiálissal.

10 Tételezzük fel, hogy p nagyon kicsi, de n tart a végtelenhez úgy, hogy szorzatuk konstans:
n*p= Poisson eloszlás: annak a valószínűsége, hogy éppen k-szor következik be az esemény: P(k)=(k)/k!*e- Az eloszlásnak egy paramétere van, , ami egyben az eloszlás várható értékét és varianciáját is adja. Annak a valószínűsége, hogy egy t-vel jellemezhető intervallumra (pl. szakasz, terület, térfogat, idő) éppen k darab eset jut: P(kt)=(kt)/k!*e-t A mintavételezés egyik referencia-eloszlása, ezzel lehet leírni a térbeli és az időbeli véletlen folyamatokat.

11 Gyakorlati vonatkozások - helyi feladat
Síkbeli pontmintázat elemzése: 1. legyenek A faj egyedei pontszerűek, random diszperziójúak, sűrűségük 10 db/m2. Mi az esélye annak, hogy egy negyed négyzetméteres kvadrátban: a.) ne legyen egy se? b.) 2 legyen? c.) 10-nél több legyen? (skálázási vonatkozások) 2. Legyenek A és B faj egyedei pontszerűek, random diszperziójúak, függetlenek, sűrűségük 10 db/m2 és 20 db/m2. B van B nincs A van P(a) P(b) A nincs P(c) P(d) a.) mik az egyes P(i) valószínűségek negyed négyzetméteres kvadrát esetében? b.) ha a mintavételi egység területe 0-tól 4 négyzetméterig növekszik, hogyan változnak ez egyes valószínűség értékek? c.) előző térfolyamat során hogyan változnak az alábbi hasonlósági indexek értékei: c/1.) a/(a+b+c) ? c/2.) (a+d)/(a+b+c+d)?

12 kísérleti elrendezések
Randomizáció Véletlen számok és mintázatok problematikája - cél: a statisztikai populáció tagjai egyenlő eséllyel kerülhessenek a mintába - használható zavaró tényezők, tendenciák hatásának kiszűrésére - a reprezentativitás legfőbb biztosítéka - torz minta: - bizonyos egyedek nagyobb valószínűséggel kerülnek a mintába - bizonyos egyedek bekerülése befolyásolja más egyedek bekerülését A véletlenszerűség igen gyakran statisztikai követelmény Haphazard (találomra, vaktában) mintavétel Problémái, szisztematikus és szemiszisztematikus mintavétel Helyi feladat: véletlen pontmintázat előállítása

13

14 Kísérleti elrendezések a véletlenszerűség biztosítására
véletlen blokkelrendezés: az ismétlések blokkokba vannak osztva úgy, hogy a blokkok minél homogénebbek legyenek előny: egyszerű hátrány: tízféle vagy több kezelésnél nehezen biztosítható a blokkon belüli homogenitás ekkor jobb a tökéletlen, azaz a blokkon belüli homogenitás érdekében lemondanak arról, hogy minden blokkban minden kezelés benne legyen példa 1. parcellakísérlet gradiens mentén példa 2. laborkísérlet időben: pl. vérszérum elemzés box: Ali fotoszintézis vizsgálatai: napi és évi ciklus

15 Helyi feladat: 4x4-es négyzet készítése
Latin-négyzet ha a kezelések száma egyenlő az ismétlésszámmal, soronként és oszloponként 1-1 lehet. mágikus és szupermágikus latin négyzet Helyi feladat: 4x4-es négyzet készítése latin tégla a kezelésszám az ismétlésszám többszöröse kell legyen 5 8 6 3 4 7 1 2 6 7 8 2 5 1 3 4 2 4 1 7 3 8 5 6 1 3 5 4 2 6 7 8

16 A várható érték (m) és a szórás (σ)
Normális eloszlás 2 paraméter: A várható érték (m) és a szórás (σ) A görbék magasságai azért különbözőek, hogy a görbe alatti terület 1 legyen (teljes valószínűség). Centrális határeloszlás tétel: Független valószínűségi változók összege aszimptotikusan normális eloszlású, ha az összeghez képest kicsik. Galton deszka

17 A t-eloszlás táblázata
és az egymintás t-próba próbastatisztikája

18 Kétmintás t-próba Ha a minták függetlenek, normális eloszlásúak és szórásaik nem különböznek szignifikánsan, tekinthetjük egyetlen minta két részének. A kapott próbastatisztika n1+n2-2 szabadsági fokú t-eloszlású

19 A t-próba feltételei: Egymintás esetben:
a valószínűségi változók normális eloszlásúak a mintaelemek függetlenek Kétmintás esetben ezeken felül: a két valószínűségi változó szórása azonos

20 Nem paraméteres: Mann-Whitney próba
Welsch-próba Ha a két minta varianciája nem azonos, a próbastatisztika: d= Ha a null-hipotézis igaz a próbastatisztika közelítőleg t-eloszlású a szabadsági fok függ a varianciák közötti különbségtől is Nem paraméteres: Mann-Whitney próba

21 F-próba Két variancia összehasonlítása a mintából kapott becslések alapján Követelmény: normális eloszlás. F= Mindig a nagyobbat kell a kisebbel osztani. Maximális F, Bartlett

22 Egyszempontos varianciaanalízis
Alapja egyetlen F-próba, ami az átlagok eltérésére karakterisztikus ”csoportok közötti” varianciát veti össze a random ingadozást leíró ”csoportokon belüli” varianciával. Kezeléstípusok Alapadatok varianciák a b c d e f g Nem paraméteres: Kruskal-Wallis próba

23 Khi-négyzet próbával végezhető szignifikanciavizsgálatok:
Homogenitásvizsgálat Összefüggésvizsgálat Illeszkedésvizsgálat

24 A Khi2 eloszlás táblázata
Egyoldalú és kétoldalú próba Aggregációs index a helyi feladathoz.

25 Lineáris korreláció és regresszió Korreláltság, korrelálatlanság
Legkisebb négyzetek módszere r = Cov(xy)/SQRT(var(x)*var(y))

26 A becslésre fordított idő érdemben nem befolyásolta az elért pontosságot (r~0.2)

27 Interpoláció és extrapoláció
Konfidenciaintervallumok

28 Oksági összefüggést takar-e?
függő és független változó: MINDIG!!! utánagondolni A vagyonosabb embereknek drágább autója van. példa 1. sajtó: a sokat TV-ző gyerekek nehezebben olvasnak példa 2. talajnedvesség: a nedvesebb talajban több a gyökér, és a több gyökér jobban kiszárítja a talajt Pszeudokorreláció - látszatösszefüggés búza-rozs termésmennyiség gólyafészek - születésszám kökény – megcsípte a dér Helyi feladat: lehetséges szakmai pszeudokorrelációt írni vagy elmondani, lehetőleg saját munkából.

29 Megadandó az alkalmazandó statisztikai próba neve, elvégzésének feltétele vagy feltételei, továbbá, ha a kérdés eldöntésére többféle eljárás is alkalmas, akkor ezeknek mi a rangsora. Utóbbi alatt azt értem, hogy melyik lenne a legjobb, de ha az nem végezhető valami miatt, akkor mi lenne a következő, stb. 1. A Szerencsejáték Rt. Honlapjáról letölthetők az eddigi lottóhúzások néhány statisztikája, pl. az, hogy melyik számot hányszor húzták ki eddig összesen. Hogyan lehetne megvizsgálni, nem volt-e esetleg csalás, azaz nem szerepeltek-e egyes számok az elvárhatónál szignifikánsan többször vagy kevesebbszer? 2. Egy cég új reagenst kínál, amelyről azt állítja, hogy az eddig forgalmazottnál hatékonyabban növeli egy oldat vezetőképességét (teljesen mindegy, hogy miért és hogyan, ). Milyen módszerrel (vagy módszerekkel!!!) lehet eldönteni, hogy igaz-e az állítás? 3. Egy vállalkozó olyan segédanyagot forgalmaz, mely (állítása szerint) növeli a búza terméseredményét. Milyen módszerrel (vagy módszerekkel!!!) lehet eldönteni, hogy igaz-e az állítás? 4. Kutyafajták termetét akarjuk összehasonlítani. Tételezzük fel, hogy létezik egy szempontrendszer, melynek segítségével 0-től 4-ig osztályozni lehet a megvizsgált állatokat: 0 - mini, 1 - kicsi, 2 - közepes - 3 nagy, 4 - hatalmas. Nyolc kiválasztott fajta 366 példányának eredményéből milyen statisztikai próbával lehet a fajták között meglevő méretkülönbség meglétét kimutatni avagy elvetni?


Letölteni ppt "bináris (előnyei-hátrányai) - borításbecslés"

Hasonló előadás


Google Hirdetések