Statisztika feladatok Informatikai Tudományok Doktori Iskola.

Slides:



Advertisements
Hasonló előadás
Nevezetes eloszlások, normál eloszlás
Advertisements

Összetett kísérleti tervek és kiértékelésük:
I. előadás.
II. előadás.
BECSLÉS A sokasági átlag becslése
Kvantitatív módszerek
3. Két független minta összehasonlítása
Általános statisztika II.
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. II. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Lineáris korreláció és lineáris regresszió. A probléma felvetése y = 1,138x + 80,778r = 0,8962.
Regresszióanalízis 10. gyakorlat.
SPSS többváltozós regresszió
Kvantitatív módszerek 7. Becslés Dr. Kövesi János.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Kvantitatív módszerek
Nemparaméteres próbák Statisztika II., 5. alkalom.
Regresszióanalízis Lineáris regresszió REGRESSZIÓ.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
STATISZTIKA II. 2. Előadás
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 14. előadás.
Gazdaságstatisztika 13. előadás.
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Többváltozós adatelemzés
Következtető statisztika 9.
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Lineáris regresszió.
Folytonos eloszlások.
t A kétoldalú statisztikai próba alapfogalmai
Két kvantitatív változó kapcsolatának vizsgálata
I. előadás.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Bevezetés a méréskiértékelésbe (BMETE80ME19) Intervallumbecslések 2014/
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Többdimenziós valószínűségi eloszlások
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
Kvantitatív módszerek
Lineáris regressziós modellek
Kiváltott agyi jelek informatikai feldolgozása 2016
II. előadás.
Becsléselmélet - Konzultáció
I. Előadás bgk. uni-obuda
III. zárthelyi dolgozat konzultáció
III. előadás.
Sztochasztikus kapcsolatok I. Asszociáció
Nemparaméteres próbák
Valószínűségi változók együttes eloszlása
Gazdaságinformatikus MSc
Gazdaságinformatika MSc labor
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
3. Varianciaanalízis (ANOVA)
Előadás másolata:

Statisztika feladatok Informatikai Tudományok Doktori Iskola

feladat Bizonyítandó, hogy:

Megoldás azaz

Tekintsük az alábbi statisztikákat: Igazoljuk, hogy torzítatlan statisztikák! Melyik a leghatásosabb közöttük? feladat

Megoldás

(Ez az együttes eloszlásfüggvényük.)

Megoldás

feladat Igazoljuk az alábbi állítást!

Megoldás =0 0< =

feladat

Megoldás

feladat Mutassuk meg, hogy az átlagstatisztika normális esetben nem csak torzítatlan, erősen konzisztens becslés, hanem hatásos is! Feltételek: Bizonyítandó, hogy a várható értékre nincs kisebb szórású torzítatlan becslés a mintaátlagnál!

Megoldás Ha akkor t biztosan hatásos statisztika! a Fisher-féle információ mennyiség Ez teljesül, ha A minta együttes sűrűségfüggvénye, a likelihood függvény most:

Megoldás Mivel teljesült a feltétel, az átlagstatisztika tényleg hatásos!

feladat Mutassuk meg, hogy az átlagstatisztika exponenciális esetben is nem csak torzítatlan, erősen konzisztens becslés, hanem hatásos is! Feltételek: Bizonyítandó, hogy a várható értékre nincs kisebb szórású torzítatlan becslés a mintaátlagnál! A bizonyítást az előző példánál megmutatott módon végezzük.

Megoldás

feladat Mutassuk meg, hogy az átlagstatisztika Poisson esetben is nem csak torzítatlan, erősen konzisztens becslés, hanem hatásos is! Ebben a példában az alapsokaság eloszlása diszkrét! Feltételek:

Megoldás A log-likelihood függvény most:

feladat Mi lehet ennek az oka???

Megoldás Tehát a Cramer-Rao-egyenlőtlenséggel nem igazolható most, hogy T 1 hatásos lenne! (Nem biztos, hogy hatásos!)

feladat Mutassuk meg, hogy az átlagstatisztika elégséges normális esetben!

Megoldás

feladat Mutassuk meg, hogy az átlagstatisztika elégséges exponenciális esetben!

Megoldás

feladat Mutassuk meg, hogy az átlagstatisztika elégséges Poisson esetben!

Megoldás

feladat Mutassuk meg, hogy az első mintaelem önmagában nem elégséges!

Megoldás

feladat Konfidencia intervallum szerkesztése az ismeretlen szórásra normális eloszlás esetében.

Megoldás

feladat Szerkesszünk 1-  megbízhatósági szintű konfidencia-intervallumot az exponenciális eloszlás paraméterére! Használjuk fel az alábbi segédtételt: Az eloszlás neve: n, 1 paraméterű Gamma-eloszlás (Jelölés:  (n,1))

Megoldás

Ezek alapján a konfidencia-intervallum szerkesztése:

feladat

Megoldás

feladat

Megoldás

feladat

Megoldás

feladat

Megoldás

feladat

Megoldás

feladat

Megoldás

feladat

Megoldás

feladat

Megoldás

feladat

Megoldás

feladat

Megoldás

feladat

Megoldás…

Megoldás

feladat

Megoldás…

Megoldás

feladat

Megoldás

feladat

Megoldás

feladat

Megoldás

feladat

Megoldás

feladat Banki alkalmazottak személyi adatait tartalmazó állomány 474 esetből álló eployee data adatmátrixa. Ellenőrizzük azt a feltevést, hogy az átlagfizetés $ id ida dolgozó kódja gender gendera dolgozó neme (m-férfi, f-nő) bdate bdateszületési dátum educ educképzési szint (években) jobcat jobcatbeosztás (1-tisztviselő, 2-biztonsági, 3-menedzser) salary salaryjelenlegi fizetés salbegin salbeginkezdőfizetés jobtime jobtimehány hónapja alkalmazták prevexp prevexpbetanítási idő (hónapokban) minority minorityhátrányos helyzet (0-nincs, 1-van) A változók jelentése

Megoldás SPSS-sel

Ellenőrizzük párositott kétmintás t-próbával, hogy a kezdőfizetés egyenlő-e a jelenlegivel! feladat Dobozábrák a fizetésekkel

Megoldás SPSS-sel

feladat Ellenőrizzük független kétmintás t-próbával, hogy a nők és férfiak fizetése egyenlő-e! Dobozábrák a fizetésekkel

Megoldás SPSS-sel

Ellenőrizzük egyszerű csoportositással, hogy a munkakörökben azonos-e a fizetés! feladat

Megoldás SPSS-sel

Ellenőrizzük a fizetés illeszkedését a normálishoz! Grafikusan, majd egymintás Kolmogorov-Szmirnov próbával! feladat Grafikus vizsgálat alapján nem tűnik jónak az illeszkedés!

Regressziós feladat Vizsgáljuk meg az x független változó és az y függő változó közötti összefüggést! Az x független változó értéke pontosan beállítható, az y függő változó értéke azonban a Y valódi érték körül ingadozik. A mérési adatok az alábbi táblázatban láthatók, az y értéke szerint növekvő sorrendbe rendezve. A tényleges mérési sorrendet a táblázat második oszlopa tartalmazza. Feltételezve, hogy y normális eloszlású, valamint azt hogy az y és x közötti függvénykapcsolat lineáris, adjunk becslést az egyenes paramétereire!

Scatter ábra az adatokkal a 95%-os konfidencia intervallummal és a 95%-os jóslási határral

SPSS táblázatok R 2 adj srsr R2R2

Egyváltozós lineáris regresszió ismétlés nélküli mérések esetén,   konstans A becslési kritérium: A normálegyenletek: Átrendezve: Ha a b 0 és b becslések egymástól nem függetlenek

A normálegyenletek azmodell illesztésekor Átrendezve: Az a és b becslések egymástól függetlenek, mert

tehát az a és b becsült paraméterek egymástól függetlenül kaphatók meg a két normálegyenletből: ; és

A becslések tulajdonságai

A konfidenciatartományok a t-eloszlás alapján számíthatók. Konfidencia határok

Az átlag konfidencia-intervalluma a mintapontok kb. 1-  %-át tartalmazza. A sáv az x átlagának a közelében a legvékonyabb. Konfidencia intervallum az átlaghoz

Jóslási intervallum (1-  a valószínűsége annak, hogy x adott értékénél egy későbbi mérés eredménye a számított intervallumba esik. intervallum:

Jóslási intervallum Az adott x i -hez tartozó Y i egyedi értéket tartalmazza az alábbi 1-  szintű konfidencia intervallum:

Determinációs együttható “Residual” “Total” “Regression”

     yyyYYy i i iii ii   222  SST =SSE+SSR d.f.: n-1= n-2+ 1 s r reziduális szórás A képletek magyarázata Az együtthatók szórásai

A konfidenciatartományok a t-eloszlás alapján számíthatók

ANOVA-táblázat SSR SSE SST A nullhipotézis az, hogy a regressziós együtthatók egyszerre zérusok

..Yx  A tapasztalati regressziós egyenes képlete: Regressziós együtthatók