Adatmodellek A modellezés statisztikai alapjai. Statisztikai modell??? cél: feltárni, hogy bizonyos jelenségek között létezik-e az általunk feltételezett.

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Hipotézisvizsgálat az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi az adatok ismeretében megfogalmazódnak bizonyos hipotézisek erre.
4. Két összetartozó minta összehasonlítása
I. előadás.
BECSLÉS A sokasági átlag becslése
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Kvantitatív módszerek
3. Két független minta összehasonlítása
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Csoportosítás megadása: Δx – csoport szélesség
Lineáris és nemlineáris regressziók, logisztikus regresszió
Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék STATISZTIKA I. 11. Előadás.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
A középérték mérőszámai
Regresszióanalízis 10. gyakorlat.
Varianciaanalízis 12. gyakorlat.
SPSS többváltozós (lineáris) regresszió (4. fejezet)
SPSS többváltozós regresszió
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Statisztika II. III. Dr. Szalka Éva, Ph.D..
Kvantitatív módszerek
Egytényezős variancia-analízis
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Az F-próba szignifikáns
STATISZTIKA II. 3. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika a szociológiában
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Statisztikai módszerek áttekintése módszerválasztási tanácsok Makara Gábor.
Többváltozós adatelemzés
Következtető statisztika 9.
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Lineáris regresszió.
Adatleírás.
t A kétoldalú statisztikai próba alapfogalmai
Két kvantitatív változó kapcsolatának vizsgálata
© Farkas György : Méréstechnika
Kemény Sándor Doktoráns Konferencia 2007.
Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek.
Paleobiológiai módszerek és modellek 4. hét
I. előadás.
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
Vargha András KRE és ELTE, Pszichológiai Intézet
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
 A matematikai statisztika a természet és társadalom tömeges jelenségeit tanulmányozza.  Azokat a jelenségeket, amelyek egyszerre nagyszámú azonos tipusú.
Bevezetés a méréskiértékelésbe (BMETE80ME19)
A számítógépes elemzés alapjai
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
A számítógépes elemzés alapjai
Lineáris regressziós modellek
Becsléselmélet - Konzultáció
Többváltozós lineáris regresszió
I. Előadás bgk. uni-obuda
A évi kompetenciamérés FIT-jelentéseinek új elemei
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Előadás másolata:

Adatmodellek A modellezés statisztikai alapjai

Statisztikai modell??? cél: feltárni, hogy bizonyos jelenségek között létezik-e az általunk feltételezett valóban létezik-e ehhez adatok kellenek, melyek elemzésével az összefüggések feltárhatók itt mindegy, hogy statisztikáról beszélünk, vagy geoinformatikáról – a lényeg ugyanaz

Az adatgyűjtés problémája Valós világ Elméleti modell Logikai modell Fizikai modell entitások leegyszerűsítése azon jellemzőkre, amik a későbbiekben szerepet játszanak a modellben az entitások megfelelői, az objektumok tényleges adatgyűjtés

Az adatgyűjtés problémája

Populáció és minta alapsokaság v. populáció minta mintavétel megszámlálható megszámlálhatatlan minden egyed választott egyedek mintavételi hiba mintavételi egység mérési hiba

A minta mennyire jó reprezentációja a populációnak? - mérőszámok átlag: hipotetikus érték minél nagyobb a minta, annál jobb a közelítés DE rendszerint a minta nem nagy – sőt! igen kicsi, kisebb mint kellene

A minta mennyire jó reprezentációja a populációnak? - mérőszámok total error, négyzetes összeg, variancia, szórás

TE=0 SS=5.2 S2=1.3 SD=1.14

A minta mennyire jó reprezentációja a populációnak? - mérőszámok Standard error – az átlag hibája (a mintaátlagok szórása): megmutatja, hogy a minta mennyire reprezentálja a populációt -ha nagy a szám, akkor a hiba is nagy -ha kicsi, akkor a mintaátlag hasonló a populációátlagéhoz, vagyis a gyűjtött adatok jól tükrözik a valós világot (populáció)

A minta mennyire jó reprezentációja a populációnak? - mérőszámok konfidencia intervallum: egy tartomány, amibe a populáció átlaga esik a mintaátlagok 95%-ában (esetenként 99%- ában)

 M: átlag  adatpontok SD: szórás SE: átlag hibája CI: konfidencia tartomány

Student félet-paraméter értékei t(2)=12,706 t(3)=4,303 t(4)=3,182 t(10)=2,262 t(20)=2,093 t(∞)=1.96

Regresszió – mint modell mi az amit látunk? mennyire megbízható az eredmény? mekkora a hibája? minden körülményt figyelembe vettünk?

Előfeltételek normalitás outlier, influent data homoszkedaszticitás autokorreláció

Az R 2 bűvöletében a modell annál jobb, minél jobban illeszkedik a trendvonal DE nem minden áron

Többváltozós lineáris regresszió 1 függő és több független változó modellek –enter (mindent megtart) –forward (változók egyesével lépnek be, az lesz a második, amelyik a megmagyarázott hányadot legjobban növeli) –backward (minden független változó benn van, az kerül ki amelyik elhagyása érdemben nem csökkenti a megmagyarázott hányadot) –stepwise (minden modellbe került változó helye bizonytalan, ha egy új belépésével egy már benn lévő magyarázóereje lecsökken, akkor kikerül)

Többváltozós lineáris regresszió multikollinearitás a független változók nem korrelálhatnak egymással – ilyen esetben az R 2 a közös hányad miatt torzít VIF, tolerance

Ra standard hiba növekedése a multikollinearitás miatt (hánysorosra nő) 0,01,0000 0,21,0206 0,41,0911 0,61,2500 0,81,6667 0,851,8983 0,902,2942 0,953,2026 0,963,5714 0,974,1135 0,985,0252 0,997,0888 0,99510,0125 0,99922,3663