Szekunder adatok & Alkalmazott statisztikai alapok

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

4. Két összetartozó minta összehasonlítása
Az onkológiai betegek pszicho-szociális szükségleteinek felmérése
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
3. Két független minta összehasonlítása
Rangszám statisztikák
Földrajzi összefüggések elemzése
Összefüggés vizsgálatok
Mérési pontosság (hőmérő)
Összefüggés vizsgálatok x átlag y átlag Y’ = a + bx.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Az élővilág kutatásának matematikai, statisztikai eszköztára
Varianciaanalízis 12. gyakorlat.
Dr. Gombos Tímea SE, III.sz. Belgyógyászati Klinika
Miért kell többváltozós modellekhez folyamodnunk (a túlélési analízis során)?
SPSS bevezetés.
SPSS leíró statisztika és kereszttábla elemzés (1-2. fejezet)
SPSS többváltozós (lineáris) regresszió (4. fejezet)
Diszkriminancia analízis
SPSS többváltozós regresszió
Diszkriminancia analízis
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Nem-paraméteres eljárások, több csoport összehasonlítása
Kovarianciaanalízis Tételezzük fel, hogy a kvalitatív tényező(k) hatásának azonosítása után megmaradó szóródás egy részének eredete ismert, és nem lehet,
ÖSSZEFOGLALÓ ELŐADÁS Dr Füst György.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Kvantitatív módszerek
Nemparaméteres próbák Statisztika II., 5. alkalom.
Nemparaméteres próbák
Térkép. Mi az adat? Minden információ, amit tárolni kell. Minden információ, amit tárolni kell.  szám  szöveg  dátum  hang  kép, stb.
A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.
Egytényezős variancia-analízis
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Az F-próba szignifikáns
Statisztika.
7. Csoportok és változók sztochasztikus összehasonlítása (összehasonlítások ordinális függő változók esetén)
Statisztikai módszerek áttekintése módszerválasztási tanácsok Makara Gábor.
Többváltozós adatelemzés
Többváltozós adatelemzés
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Adatleírás.
Paleobiológiai módszerek és modellek 4. hét
Többszempontos ANOVA (I
A kombinációs táblák (sztochasztikus kapcsolatok) elemzése
Vargha András KRE és ELTE, Pszichológiai Intézet
HIPOTÉZIS MEGFOGALMAZÁSA
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Megerősítő elemzés „Big Data” elemzési módszerek Salánki.
Kutatásmódszertani dilemmák
A számítógépes elemzés alapjai
A számítógépes elemzés alapjai
SZÖM II. Fejlesztési szint folyamata 5.1. előadás
Adatelemzési gyakorlatok
Sztochasztikus kapcsolatok I. Asszociáció
Dr. Varga Beatrix egyetemi docens
Bevezetés a kvantitatív kutatásba
Paraméteres és nem paraméteres próbák alkalmazása több csoport összehasonlítására folytonos változók esetén Dr. Gombos Tímea.
Kitöltetés Kérdezőbiztos által felvett kérdőív Önkitöltő kérdőív
Kitöltetés Kérdezőbiztos által felvett kérdőív Önkitöltő kérdőív
Kitöltetés Kérdezőbiztos által felvett kérdőív Önkitöltő kérdőív
Nemparaméteres próbák
Alkalmazott statisztikai alapok
A leíró statisztikák alapelemei
Statisztika segédlet a Statistica programhoz Új verzióknál érdemes a View menüsor alatt a Classic menu-s verziót választani – ehhez készült a segédlet.
Rangsoroláson és pontozáson alapuló komplex mutatók
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Mérési skálák, adatsorok típusai
A normális eloszlásból származó eloszlások
Előadás másolata:

Szekunder adatok & Alkalmazott statisztikai alapok

A szekunder adatok típusai Nyers adatok (raw data) Összegyűjtött adatok (compiled data): válogatás vagy összegzés eredményei. Gyakran több adatbázis egyesítéséből. Big data: óriási, komplex adatmennyiség, hagyományos módszerekkel nem/nehezen elemezhető

A szekunder adatok típusai Dokumentum: Szöveg Nem szöveg (hang,kép, video stb.) Felmérés (survey): Népszámlálás (cenzus) Folyamatos vagy rendszeres felmérések Ad hoc felmérések Több forrásból származó: Pillanatfelvétel (snap shot) Idősoros (longitudinal)

Szekunder források előnyei Erőforrás-kímélő: idő, pénz, munkaerő Nem sért érdekeket (mert már eleve létezik, valamennyire publikus) Lehetővé teszi az idősoros elemzést (visszafelé) A primer adatok összehasonlítási, kontextusba helyezési alapot adhat Nem vár eredményeket rejthetnek Elérhető, ellenőrizhető mások által (megbízható)

Hátrányai Más célra optimalizálták a gyűjtését Elérési nehézségek, ár Az aggregáció szintje, a definíciók sokszor nem megfelelőek Nincs kontroll a minősége felett

Értékelésük Mérési validitás (measurement validity): A kívánt információt (változó) mérték-e meg? Lefedettség (coverage): a kívánt populációra vonatkozik-e? Nem kívánt adatok kiszűrhetőek-e… …miközben a kívánatosak megtarthatóak Precizitás (reliabilitás, validitás) Mérési torzítás. Okai lehetnek: Szándékos Megváltozott az adatgyűjtési mód Nem a kívánt témára vonatkozik a mérés

Statisztikai módszerek és adatelemzés Skálák Elfogadott módszerek: szekunder elemzésből A minta használhatósága: A nem használható elemszámú csoportokat kihagyni, amikor a csoportok vannak terítéken, de visszatenni, ha az egyes csoportfüggetlen esetek, vagy más szempontú csoportok A legegyszerűbb: Gyakoriságok: célszerű ábrázolni (sorrend, ábratípus) Relatív gyakoriság: százalék, ha „illik” Primitív kereszttáblák: mutatók nélkül

Statisztikai módszerek és adatelemzés Két csoport összehasonlítása: Nominális vagy ordinális függő változó: kereszttábla Intervallum vagy arányskála: t-próba Regresszió-analízis (lineáris vagy binomiális) Több csoport összehasonlítása: Intervallum vagy arányskála: ANOVA (post-hoc tesztekkel) vagy páronként elvégzett t-próba, de leginkább mindkettő Dummyzás után regresszió-analízis (lineáris vagy binomiális)

Statisztikai módszerek és adatelemzés Változók közti együttjárás: Lineáris (Pearson) vagy nem-parametrikus (pl. Spearman) korreláció Lineáris regresszió (vagy más típusú regresszió) Ha a magyarázó változó intervallum vagy arányskálás és a függő alacsonyabb: Megfordítjuk a kérdést Diszkriminancia-analízis Binomiális vagy multinomiális regresszió Ha sok a változónk: előkészítés után valamilyen regresszió Interpretálás: Helyes kódolás és jelölés (pl. 0-1) Label-ök használata

folyamatos változók (pl. életkor, se Na)   folyamatos változók (pl. életkor, se Na) normál eloszlású nem normál eloszlású 2 független csoport összehasonlítása két mintás t-próba Mann-Whitney teszt Szignifikánsan különbözik-e a súlyos és nem súlyos betegek vércukor értéke? 2 kapcsolt csoport összehasonlítása (pl. érték kezelés előtt és kezelés után) páros t próba Wilcoxon teszt Megváltozik-e a betegek fehérvérsejt száma a kezelés hatására? Változik-e a betegek koleszterinszintje 10 év követés alatt? 3 vagy több független csoport összehasonlítása egy szempontos ANOVA Kruskal-Wallis teszt Van-e különbség a különböző Dukes stadiumú betegek hemoglobin szintjében? 3 vagy több kapcsolt csoport összehasonlítása ismételt méréses ANOVA Friedman próba Az ismételt mérések során változik-e a betegek BMI-je? Forrás: Gombos Tímea előadása: Paraméteres és nem paraméteres próbák alkalmazása több csoport összehasonlítására folytonos változók esetén.

Adatközlés statisztikai elemzés után Elfogadhatóság: Praktikus szempontok Szignifikancia-szintek Jóságmutatók (pl. R-négyzet) Egymást kiegészítő információk: pl. átlag és szórás Az elégséges és szokásos minimum Melléklet: nagy adattáblák Outputokat, grafikonokat mindig átszerkeszteni, fordítani Értelmezést segítő ábrák, szöveges magyarázatok Néha az adatbázist is elérhetővé kell tenni Bizonyíthatóság, feltevések explicitté tétele!

A szoftverek Számolni mind tud, de kérdés közöl-e mindent! Excel – a minimumot tudja, de sokszor nem közöl szignifikanciát SPSS – kényelmes, közismert de fizetős Gretl, R-nyelv, PSPP és célprogramok Amit nem közölnek, „gyalog” sokszor kiszámolható