A statisztikai próba 1. A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H0): μ1= μ2, vagy μ1- μ2=0 A munka-hipotézist indirekt módon bizonyítjuk A minta a nullhipotézist alátámasztja-e? Az olyan eljárást, amelyik a minták alapján dönt, statisztikai próbának nevezik Próbafüggvény előállítása
A statisztikai próba 2. A próbafüggvény kiszámított értékéhez megadható egy P, valószínűségi érték. Ez megadja, hogy milyen valószínűséggel várható a próbafüggvénynek a kiszámítottal azonos vagy annál nagyobb értéke, ha a nullhipotézis igaz, azaz μ1= μ2
Elsőfajú hiba (H0): μ1= μ2, vagy μ1- μ2=0 igaz A minta alapján elvetjük a nullhipotézist, tévesen valódi különbséget állapítunk meg Mi ennek a valószínűsége? α (alfa), melyet a statisztikai próba elvégzése előtt kell megválasztani Szokásos értékei: 10; 5; 1; ritkán 0,1%
Másodfajú hiba (Ha): μ1 nem egyenlő μ2, vagy μ1- μ2nem egyenlő 0 igaz A minta alapján megtartjuk a nullhipotézist, tévesen egyformaságot állapítunk meg Mi ennek a valószínűsége? β (béta), melynek értékét csak a statisztikai próba elvégzése után lehet meghatározni
A döntés és az elkövethető hibák
A statisztikai próba ereje A valódi különbség kimutatásának valószínűsége P=1- β Gyakorlatilag egy igaz munkahipotézis vagy alternatív hipotézis elfogadásának valószínűsége Minél kisebb az α, annál ritkább, hogy H0 -t tévesen elutasítjuk, de annál gyakoribb, hogy H0-t tévesen elfogadjuk (másodfajú hiba)
Az első- és másodfajú hiba csökkentése Minta elemszámának növelése Pontosabb mintavételezés (szórás csökken) Lehet-e az első- és másodfajú hibát nullára csökkenteni? NEM A véletlen hatásokat nem tudjuk kiiktatni
Két középérték különbségének tesztelése Feltételek: Független minták Normális eloszlásúak Azonos szórás
Két normál eloszlású, független minta különbségének szórása
Alfa és béta hiba 29,5% 6,2% 1,96 -4 -2 2 4 6 8 10 95%
Nincs különbség Pl. n = 4; X1 várható értéke = 6 000kg/ha; X2 várható értéke = 7 500kg/ha; a szórás mindkét esetben 780 kg/ha; a különbség szórása 552kg/ha
Meglévő különbség Ábrázoljuk a második esetet, amikor 1 500kg/ha valódi különbség van! A várható érték 1 500kg/ha, a szórás 552kg/ha. Mi a valószínűsége, hogy 1 081kg/ha-nál kisebb értéket kapunk? Ki kell számolni a normalizált értékét, hogy a standard normál eloszlás táblázatból ki tudjuk keresni. Z = (1081-1500)/552 = -0,76 Annak a valószínűsége, hogy –0,76-nál kisebb értéket kapunk 22,4%. Ez azt jelenti, hogy az 1 500kg/ha-os valódi különbséget egy 5%-os próbával 77,6%-os valószínűséggel tudunk kimutatni. Mit tehetünk, ha ennél nagyobb biztonsággal szeretnénk kimutatni a különbséget? Vagy kisebb -szintet választunk, vagy a megfigyelések számát (ismétlések számát) növeljük.
A várható érték 1 500kg/ha, a szórás 552kg/ha
Egymintás t-teszt Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum nagyságát is. H0: 1 = 0 Feltétel: Normális eloszlású populáció, szigma ismeretlen és n>30. Próbastatisztika: (DF = n-1 )
Kétmintás t-teszt (szórás azonos) Származhat-e a két független megfigyelés, minta azonos középértékű populációból? H0: 1 = 2 Próbastatisztika: (DF = n1 + n2 – 2)
Kétmintás t-teszt (nem azonos szórás) Ha a két csoport szórása szignifikánsan különbözik, ilyenkor a két összehasonlítandó csoport varianciáját súlyozni kell a variancia becsléséhez (separate variancia). A módosított variancia becslés az alábbi: A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított szignifikancia értékeket kell használni a középértékek különbözőségének elbírálásakor
Párosított t-próba Két összefüggő minta középértékének összehasonlítására szolgál H0: dátlag = 0 Próbastatisztika: (DF = n1 – 1) sd a párosított minták különbségének szórása, becslése a minta alapján Feltétel: a d különbségek eloszlása normális, és d ismeretlen (a mintából számított), és n<30.
Párosított t-próba eredmény táblázatai
Megfigyelések száma középérték különbségek becslésére ahol n1 = n2 = n z = az elsőfajú hiba kritikus értéke az adott szignifikancia-szinten (kétoldali szimmetrikus) z = a másodfajú hiba kritikus értéke az adott szignifikancia-szinten (egyoldali) s2 = a minták varianciája h2 = a tényleges különbség négyzete LOTHAR SACHS, 1985
Megfigyelések száma középérték különbségek becslésére Excelben