A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0.

Slides:



Advertisements
Hasonló előadás
Gyakorlati probléma 20 különböző gyógyszert próbálunk ki, t-próbával összehasonlítva a kezelt és a kontrol csoportot A nullhipotézis elfogadásáról vagy.
Advertisements

Hipotézis-ellenőrzés (Statisztikai próbák)
4. Két összetartozó minta összehasonlítása
II. előadás.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Egy faktor szerinti ANOVA
Kvantitatív módszerek
3. Két független minta összehasonlítása
Rangszám statisztikák
A többszörös összehasonlítás gondolatmenete. Több mint két statisztikai döntés egy vizsgálatban? Mi történik az elsõ fajú hibával, ha két teljesen független.
Feladat Egy új kísérleti készítmény hatását szeretnék vizsgálni egereken. 5 féle dózist adnak be 5 vizsgált egérnek, de nem sikerült mindegyik egérnek.
Matematikai Statisztika VIK Doktori Iskola
Általános lineáris modellek
Mérési pontosság (hőmérő)
Becsléselméleti ismétlés
Kísérlettervezés DR. HUZSVAI LÁSZLÓ SELYE
Környezeti statisztika Dr. Huzsvai László egyetemi docens Debrecen2008.
STATISZTIKA II. 5. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék.
Statisztika II. IX. Dr. Szalka Éva, Ph.D..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
E L E M Z É S. 1., adatgyűjtés 2., mintavétel (a teljes sokaságot ritkán tudjuk vizsgálni) 3., mintavételi információk alapján megállapítások, következtetések.
Statisztika II. IV. Dr. Szalka Éva, Ph.D..
Statisztika II. II. Dr. Szalka Éva, Ph.D..
III. előadás.
Varianciaanalízis 12. gyakorlat.
Gazdasági informatika
Hipotézisvizsgálat (1. rész) Kontingencia táblák
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Nem-paraméteres eljárások, több csoport összehasonlítása
Statisztika II. VIII. Dr. Szalka Éva, Ph.D..
Kvantitatív módszerek
Matematikai alapok és valószínűségszámítás
Nemparaméteres próbák Statisztika II., 5. alkalom.
Egytényezős variancia-analízis
Az F-próba szignifikáns
Kvantitatív Módszerek
Statisztikai döntésfüggvények elméletének elemei
7. Csoportok és változók sztochasztikus összehasonlítása (összehasonlítások ordinális függő változók esetén)
Gazdaságstatisztika 19. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 18. előadás Hipotézisvizsgálatok
Gazdaságstatisztika 16. előadás Hipotézisvizsgálatok Alapfogalamak
Hipotézis vizsgálat (2)
Hipotézis-ellenőrzés (Folytatás)
Alapsokaság (populáció)
Várhatóértékre vonatkozó próbák
Hipotézis vizsgálat.
Többtényezős ANOVA.
t A kétoldalú statisztikai próba alapfogalmai
Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek.
Paleobiológiai módszerek és modellek 4. hét
Valószínűségszámítás - Statisztika. P Két kockával dobunk, összeadjuk az értékeket Mindegyik.
A szóráselemzés gondolatmenete

Konzultáció november 19. Nemparaméteres próbák, egymintás próbák
Paraméteres próbák- gyakorlat
Hipotézisvizsgálatok Paraméteres próbák
Hipotézisvizsgálatok
Nemparaméteres próbák
Statisztikai áttekintés (I.)
Kiváltott agyi jelek informatikai feldolgozása 2016
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
II. előadás.
Gazdaságstatisztika konzultáció
Kvantitatív módszerek
III. zárthelyi dolgozat konzultáció
Hipotézisvizsgálatok Paraméteres próbák
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
1.3. Hipotézisvizsgálat, statisztikai próbák
3. Varianciaanalízis (ANOVA)
Előadás másolata:

A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0 A munka-hipotézist indirekt módon bizonyítjuk A minta a nullhipotézist alátámasztja-e? Az olyan eljárást, amelyik a minták alapján dönt, statisztikai próbának nevezik Próbafüggvény előállítása

A statisztikai próba 2. A próbafüggvény kiszámított értékéhez megadható egy P, valószínűségi érték. Ez megadja, hogy milyen valószínűséggel várható a próbafüggvénynek a kiszámítottal azonos vagy annál nagyobb értéke, ha a nullhipotézis igaz, azaz μ1= μ2

Elsőfajú hiba (H0): μ1= μ2, vagy μ1- μ2=0 igaz A minta alapján elvetjük a nullhipotézist, tévesen valódi különbséget állapítunk meg Mi ennek a valószínűsége? α (alfa), melyet a statisztikai próba elvégzése előtt kell megválasztani Szokásos értékei: 10; 5; 1; ritkán 0,1%

Másodfajú hiba (Ha): μ1 nem egyenlő μ2, vagy μ1- μ2nem egyenlő 0 igaz A minta alapján megtartjuk a nullhipotézist, tévesen egyformaságot állapítunk meg Mi ennek a valószínűsége? β (béta), melynek értékét csak a statisztikai próba elvégzése után lehet meghatározni

A döntés és az elkövethető hibák

A statisztikai próba ereje A valódi különbség kimutatásának valószínűsége P=1- β Gyakorlatilag egy igaz munkahipotézis vagy alternatív hipotézis elfogadásának valószínűsége Minél kisebb az α, annál ritkább, hogy H0 -t tévesen elutasítjuk, de annál gyakoribb, hogy H0-t tévesen elfogadjuk (másodfajú hiba)

Az első- és másodfajú hiba csökkentése Minta elemszámának növelése Pontosabb mintavételezés (szórás csökken) Lehet-e az első- és másodfajú hibát nullára csökkenteni? NEM A véletlen hatásokat nem tudjuk kiiktatni

Két középérték különbségének tesztelése Feltételek: Független minták Normális eloszlásúak Azonos szórás

Két normál eloszlású, független minta különbségének szórása

Alfa és béta hiba 29,5% 6,2% 1,96 -4 -2 2 4 6 8 10 95%

Nincs különbség Pl. n = 4; X1 várható értéke = 6 000kg/ha; X2 várható értéke = 7 500kg/ha; a szórás mindkét esetben 780 kg/ha; a különbség szórása 552kg/ha

Meglévő  különbség Ábrázoljuk a második esetet, amikor 1 500kg/ha valódi különbség van! A várható érték 1 500kg/ha, a szórás 552kg/ha. Mi a valószínűsége, hogy 1 081kg/ha-nál kisebb értéket kapunk? Ki kell számolni a normalizált értékét, hogy a standard normál eloszlás táblázatból ki tudjuk keresni. Z = (1081-1500)/552 = -0,76 Annak a valószínűsége, hogy –0,76-nál kisebb értéket kapunk 22,4%. Ez azt jelenti, hogy az 1 500kg/ha-os valódi különbséget egy 5%-os próbával 77,6%-os valószínűséggel tudunk kimutatni. Mit tehetünk, ha ennél nagyobb biztonsággal szeretnénk kimutatni a különbséget? Vagy kisebb -szintet választunk, vagy a megfigyelések számát (ismétlések számát) növeljük.

A várható érték 1 500kg/ha, a szórás 552kg/ha

Egymintás t-teszt Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum nagyságát is. H0: 1 = 0 Feltétel: Normális eloszlású populáció, szigma ismeretlen és n>30. Próbastatisztika: (DF = n-1 )

Kétmintás t-teszt (szórás azonos) Származhat-e a két független megfigyelés, minta azonos középértékű populációból? H0: 1 = 2 Próbastatisztika: (DF = n1 + n2 – 2)

Kétmintás t-teszt (nem azonos szórás) Ha a két csoport szórása szignifikánsan különbözik, ilyenkor a két összehasonlítandó csoport varianciáját súlyozni kell a variancia becsléséhez (separate variancia). A módosított variancia becslés az alábbi: A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított szignifikancia értékeket kell használni a középértékek különbözőségének elbírálásakor

Párosított t-próba Két összefüggő minta középértékének összehasonlítására szolgál H0: dátlag = 0 Próbastatisztika: (DF = n1 – 1) sd a párosított minták különbségének szórása, becslése a minta alapján Feltétel: a d különbségek eloszlása normális, és d ismeretlen (a mintából számított), és n<30.

Párosított t-próba eredmény táblázatai

Megfigyelések száma középérték különbségek becslésére ahol n1 = n2 = n z = az elsőfajú hiba kritikus értéke az adott  szignifikancia-szinten (kétoldali szimmetrikus) z = a másodfajú hiba kritikus értéke az adott  szignifikancia-szinten (egyoldali) s2 = a minták varianciája h2 = a tényleges különbség négyzete LOTHAR SACHS, 1985

Megfigyelések száma középérték különbségek becslésére Excelben