Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Általános lineáris modellek GLM az SPSS programban 2011.

Hasonló előadás


Az előadások a következő témára: "Általános lineáris modellek GLM az SPSS programban 2011."— Előadás másolata:

1 Általános lineáris modellek GLM az SPSS programban 2011.

2 Elmélet A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek „okai” a független változók, A teljes heterogenitás egyik része az, amelynek „okai” a független változók, a másik heterogenitás-rész pedig az, amelynek „okait” az egyéb, általunk nem vizsgált tényezők tartalmazzák. Ez utóbbit sokszor a véletlen hatásaként, hibaként is emlegetik. a másik heterogenitás-rész pedig az, amelynek „okait” az egyéb, általunk nem vizsgált tényezők tartalmazzák. Ez utóbbit sokszor a véletlen hatásaként, hibaként is emlegetik.

3 Lineáris modell y ij =  +  i + e ij ahol: y ij a függő változó értéke  a kísérlet főátlaga, fix hatás  i fix hatás, oka a független változó, faktor e ij hiba, vagy eltérés

4 A variancia-analízis alkalmazásának feltételei a maradék független a kezelés és blokk hatástól valamint a függő változótól (véletlen mintavételezés, kísérleti elrendezés) a maradék független a kezelés és blokk hatástól valamint a függő változótól (véletlen mintavételezés, kísérleti elrendezés) a maradékok (hibák) normális eloszlású, nulla várható értékű sokaság a maradékok (hibák) normális eloszlású, nulla várható értékű sokaság a maradékok szórásai a kezeléskombinációk celláin belül egyformák a maradékok szórásai a kezeléskombinációk celláin belül egyformák

5 Alapfogalmak 1. Faktor: a vizsgálatba bevont független változókat, pl. különböző kezeléseket, tényezőket. Faktor: a vizsgálatba bevont független változókat, pl. különböző kezeléseket, tényezőket. Faktor szint: A kezelések szintjei, pl. műtrágyaadagok. Faktor szint: A kezelések szintjei, pl. műtrágyaadagok. Kvalitatív és kvantitatív faktorok: Ha a faktorszintek nem numerikusak vagy intervallum skálájúak, akkor kvalitatív, ellenkező esetben kvantitatív faktorokról beszélünk. Kvalitatív és kvantitatív faktorok: Ha a faktorszintek nem numerikusak vagy intervallum skálájúak, akkor kvalitatív, ellenkező esetben kvantitatív faktorokról beszélünk. Kezelések (cellák): Egyfaktoros esetekben a kezelések megfelelnek a faktorok szintjeinek, többfaktoros esetben a figyelembe vett faktorok szintjeiből előálló kombinációk a kezelések. Pl. amikor a 2 faktor műtrágyaadagok és öntözési módok, akkor a kezelések a (műtrágyaadagok, öntözési módok) összes lehetséges kombinációjából áll. Kezelések (cellák): Egyfaktoros esetekben a kezelések megfelelnek a faktorok szintjeinek, többfaktoros esetben a figyelembe vett faktorok szintjeiből előálló kombinációk a kezelések. Pl. amikor a 2 faktor műtrágyaadagok és öntözési módok, akkor a kezelések a (műtrágyaadagok, öntözési módok) összes lehetséges kombinációjából áll.

6 Alapfogalmak 2. Interakció: Két változó kapcsolatában akkor áll fenn interakció (kölcsönhatás), ha változó hatása függ az változó szintjétől és fordítva. Interakció: Két változó kapcsolatában akkor áll fenn interakció (kölcsönhatás), ha változó hatása függ az változó szintjétől és fordítva. Egy szempontos variancia-analízis: Variancia- analízis, ahol csak egy faktor van. Egy szempontos variancia-analízis: Variancia- analízis, ahol csak egy faktor van. Több szempontos variancia-analízis: Variancia- analízis, ahol kettő vagy több faktor van. Több szempontos variancia-analízis: Variancia- analízis, ahol kettő vagy több faktor van. Egyváltozós variancia-analízis: ANOVA technika, amely egy függő változót használ. Egyváltozós variancia-analízis: ANOVA technika, amely egy függő változót használ. Többváltozós variancia-analízis: ANOVA technika, amely kettő vagy több függő változót használ. Többváltozós variancia-analízis: ANOVA technika, amely kettő vagy több függő változót használ.

7 Jelölések n: az adatok száma n: az adatok száma k: csoportok száma k: csoportok száma r: ismétlések száma r: ismétlések száma Csoport átlag: Csoport átlag:

8 Egytényezős variancia- analízis Segítségével egy tényező hatását lehet vizsgálni a függő változó mennyiségi alakulására. A tényező, faktor valamilyen csoportképző ismérvvel rendelkezik, a függő változó pedig legtöbbször skála típusú adat. Segítségével egy tényező hatását lehet vizsgálni a függő változó mennyiségi alakulására. A tényező, faktor valamilyen csoportképző ismérvvel rendelkezik, a függő változó pedig legtöbbször skála típusú adat.

9 H0H0H0H0 A nullhipotézis, hogy az átlagok egyenlők, nincs közöttük különbség. Ez a technika a kétmintás t-teszt általánosítása, kiterjesztése több mintára. A nullhipotézis, hogy az átlagok egyenlők, nincs közöttük különbség. Ez a technika a kétmintás t-teszt általánosítása, kiterjesztése több mintára.

10 Variancia-analízis lépései 1. A variancia-analízis modell felállítása. 2. Szignifikancia-szint megválasztása 3. A variancia-analízis kiszámítása, az F- próba. 4. A modell érvényességének ellenőrzése. 5. Amennyiben az F-próba szignifikáns, középértékek többszörös összehasonlítása.

11 A modell felállítása A modellben a mérési, megfigyelési értékeket összegként képzeljük el. A modellben a mérési, megfigyelési értékeket összegként képzeljük el. Kísérleti elrendezésnek megfelelő modellalkotás Kísérleti elrendezésnek megfelelő modellalkotás

12 Lineáris modell y ij =  +  i + e ij ahol: y ij a függő változó értéke  a kísérlet főátlaga, fix hatás  i fix hatás, oka a független változó, faktor e ij hiba, vagy eltérés

13 Példa Egy termesztő k kukoricafajta termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a 4 fajta termesztése esetén azonos terméseredményre számíthatunk-e. Egy termesztő k kukoricafajta termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a 4 fajta termesztése esetén azonos terméseredményre számíthatunk-e.

14 A variancia-analízis kiszámítása

15 Eredménytáblázat (Excel)

16 Eredménytáblázat (SPSS)

17 Eltérés négyzetösszegek (SS) Összes: alapadatok eltérés négyzetösszege Összes: alapadatok eltérés négyzetösszege Csoportok között: csoportátlagok eltérés négyzetösszege * r Csoportok között: csoportátlagok eltérés négyzetösszege * r Csoporton belül: csoportok eltérés négyzetösszegeinek összege Csoporton belül: csoportok eltérés négyzetösszegeinek összege

18 Szabadságfokok (df) Csoportok között: k-1 Csoportok között: k-1 Csoporton belül: n-k Csoporton belül: n-k Összes: n-1 Összes: n-1

19 Varianciák Az eltérés négyzetösszegek osztva a szabadságfokokkal. Az eltérés négyzetösszegek osztva a szabadságfokokkal. SS csk /3 SS csk /3 SS csb /8 SS csb /8 SS össz /11 SS össz /11

20 F-próba

21

22

23

24

25 Mi annak a valószínűsége? Véletlenül 16,38 F-értéknél nagyobbat kapunk egy 3, 8 szabadságfokú F- eloszlás esetén. Véletlenül 16,38 F-értéknél nagyobbat kapunk egy 3, 8 szabadságfokú F- eloszlás esetén. P=0,00089 P=0,00089

26 Mikor szignifikáns az F- próba? Ha létezik legalább egy szignifikáns kontraszt a csoportok között. Ha létezik legalább egy szignifikáns kontraszt a csoportok között.

27 A modell érvényességének ellenőrzése Függetlenség Függetlenség Normális eloszlás Normális eloszlás Azonos varianciák Azonos varianciák

28 A maradék független a kezelés és blokk hatástól valamint a függő változótól (véletlen mintavételezés, kísérleti elrendezés) valamint a függő változótól (véletlen mintavételezés, kísérleti elrendezés) Vizsgálat: Vizsgálat: –Maradékok leíró statisztikája kezelések szerint –a maradékok ábrázolása a megfigyelt és becsült értékek függvényében

29 Maradékok leíró statisztikája

30 Maradékok és a megfigyelt értékek közötti függetlenség

31 Maradékok és a becsült értéket közötti függetlenség

32 Maradék normális eloszlású, nulla várható értékű Grafikus normalitás vizsgálat Grafikus normalitás vizsgálat –Hisztogram –Q-Q plot Numerikus normalitás vizsgálat Numerikus normalitás vizsgálat –Kolmogorov-Smirnov –Shapiro-Wilk

33 Hisztogram

34 Q-Q ábra

35 Kolmogorov-Smirnov teszt

36 Mintán belüli szórás azonosság tesztelése Levene-teszt Levene-teszt H 0 a szórások megegyeznek H 0 a szórások megegyeznek

37 Amennyiben a Levene- teszt szignifikáns Robusztus tesztek alkalmazása Robusztus tesztek alkalmazása –Welch-tesz –Brown-Forsythe

38 Robusztus tesztek

39 Post hoc analízisek Középérték összehasonlító tesztek

40 Az F-próba szignifikáns Amennyiben az analízis az átlagok közötti egyenlőséget nem igazolja, szükséges az átlagok közötti különbségek kimutatása. Amennyiben az analízis az átlagok közötti egyenlőséget nem igazolja, szükséges az átlagok közötti különbségek kimutatása. A variancia-analízist kiegészítő középérték összehasonlító teszteknek kétféle típusa létezik: A variancia-analízist kiegészítő középérték összehasonlító teszteknek kétféle típusa létezik: –előzetes, un. a priori kontrasztok és –az analízis után elvégezhető, un. post hoc analízisek

41 Post hoc analízisek 1. A csoportok szórása megegyezik –LSD –Tukey –Bonferroni –Scheffe –Dunett –Student-Newman-Keuls –Duncan 2. A csoportok szórása különbözik –Tamhane

42 LSD-teszt (legkisebb szignifikáns differencia) Alkalmazhatóság feltételei: Alkalmazhatóság feltételei: 1.A csoportok szórása egyenlő 2.Véletlenszerűen kiválasztott két csoport összehasonlítására jó

43 Tukey-teszt Studentizált terjedelmen alapuló teszt, a p-elemű részcsoportokat ugyanazzal a kritikus értékkel hasonlítja össze. Itt a teljes vizsgálat elsőfajú hibája rögzített, és az egyes összehasonlítások elsőfajú hibája n növekedésével csökken, s így a másodfajú hiba nő. Studentizált terjedelmen alapuló teszt, a p-elemű részcsoportokat ugyanazzal a kritikus értékkel hasonlítja össze. Itt a teljes vizsgálat elsőfajú hibája rögzített, és az egyes összehasonlítások elsőfajú hibája n növekedésével csökken, s így a másodfajú hiba nő.

44 Az LSD és Tukey-teszt eredménye

45 Homogén csoportok képzése Tukey módszerrel

46 Bonferroni-teszt Páronkénti átlagok különbségének vizsgálatára használható, a két csoport elemszáma lehet különböző is. Lényege, hogy az  -hibához tartozó t-értéket korrigálja a független összehasonlítások számának megfelelően. Páronkénti átlagok különbségének vizsgálatára használható, a két csoport elemszáma lehet különböző is. Lényege, hogy az  -hibához tartozó t-értéket korrigálja a független összehasonlítások számának megfelelően.

47 Scheffe-teszt A hagyományos tesztek közé tartozik. Ez már valóban a H g hipotéziseket vizsgálja. Az egyszerű F- próba akkor utasítja el a H 0 -hipotézist, ha létezik egy a<>0 vektor, amelynél a konfidencia- intervallum nem tartalmazza a 0-t. Ha k darab összehasonlítandó csoport van, akkor k(k-1)/2 összehasonlítást kell végezni. A statisztikája: A hagyományos tesztek közé tartozik. Ez már valóban a H g hipotéziseket vizsgálja. Az egyszerű F- próba akkor utasítja el a H 0 -hipotézist, ha létezik egy a<>0 vektor, amelynél a konfidencia- intervallum nem tartalmazza a 0-t. Ha k darab összehasonlítandó csoport van, akkor k(k-1)/2 összehasonlítást kell végezni. A statisztikája:

48 Dunnett-teszt A Dunnett-teszt (1955) egy kijelölt csoportot (kontroll) hasonlít össze a többivel. Eredetileg egyenlő elemszámokra volt érvényes, de később elkészült az általánosítása egyenlőtlen elemszámokra is. Lényegét tekintve páronkénti összehasonlítást végez szimultán, de meg kell adni egy kezdő, kontroll csoportot, és ehhez hasonlítja a többi csoport átlagát. Statisztikája: A Dunnett-teszt (1955) egy kijelölt csoportot (kontroll) hasonlít össze a többivel. Eredetileg egyenlő elemszámokra volt érvényes, de később elkészült az általánosítása egyenlőtlen elemszámokra is. Lényegét tekintve páronkénti összehasonlítást végez szimultán, de meg kell adni egy kezdő, kontroll csoportot, és ehhez hasonlítja a többi csoport átlagát. Statisztikája: =kontroll csoport

49 Dunnett-teszt az SPSS- ben

50 A Dunnett-teszt eredménye

51 Student-Newman-Keuls próba Az elsőfajú hiba összehasonlításonként rögzített, ezért a teljes vizsgálat elsőfajú hibája n-nel együtt nő. Az elsőfajú hiba összehasonlításonként rögzített, ezért a teljes vizsgálat elsőfajú hibája n-nel együtt nő. A próba teszteli, hogy mely kezelés kombinációk tartoznak egy homogén csoportba. A próba teszteli, hogy mely kezelés kombinációk tartoznak egy homogén csoportba. Homogén csoport, ahol nincs szignifikáns különbség a kezelés kombinációk között. Homogén csoport, ahol nincs szignifikáns különbség a kezelés kombinációk között.

52 Duncan többszörös rang teszt Itt is homogén csoportok képzése a cél. Napjainkban az egyik legjobbnak tartott többszörös összehasonlító teszt. Itt is a grafikus megjelenítés nagyban segíti a kapott eredmények interpretációját. A mezőgazdasági kutatásban is potenciálisan nagy jelentőséggel bíró teszt. Itt is homogén csoportok képzése a cél. Napjainkban az egyik legjobbnak tartott többszörös összehasonlító teszt. Itt is a grafikus megjelenítés nagyban segíti a kapott eredmények interpretációját. A mezőgazdasági kutatásban is potenciálisan nagy jelentőséggel bíró teszt.

53 Tamhane-teszt Alkalmazhatóság feltételei: Alkalmazhatóság feltételei: 1.A csoportok szórása különbözhet 2.Véletlenszerűen kiválasztott két csoport összehasonlítására jó

54 Post Hoc tesztek az SPSS- ben

55 Szimultán döntés Ha kettőnél több összehasonlítandó minta van. Olyan állításokat fogalmaznak meg, amelyek egyidejűleg érvényesek. Ezek lehetnek: Ha kettőnél több összehasonlítandó minta van. Olyan állításokat fogalmaznak meg, amelyek egyidejűleg érvényesek. Ezek lehetnek: –Egyidejűleg érvényes konfidencia intervallumok vagy –Szimultán végzett statisztikai próbák.

56 Általános lineáris modell (General Linear Model) Az általános lineáris modell a hagyományos variancia-analízis és a lineáris regresszió- analízis ötvözete. Egyetlen táblázatban jelenik meg a szórás elemzés és a lineáris regresszió-analízis eredménye: Az általános lineáris modell a hagyományos variancia-analízis és a lineáris regresszió- analízis ötvözete. Egyetlen táblázatban jelenik meg a szórás elemzés és a lineáris regresszió-analízis eredménye:

57 Lineáris regresszió- analízis

58 A GLM táblázat értelmezése Corrected Model: a lineáris modellel becsült és a megfigyelt értékekre illesztett lineáris függvény jóságát mutatja. Eldönthető, hogy az alkalmazott modell megfelelő-e. Corrected Model: a lineáris modellel becsült és a megfigyelt értékekre illesztett lineáris függvény jóságát mutatja. Eldönthető, hogy az alkalmazott modell megfelelő-e. Intercept: az alapadatok összegének négyzete osztva az adatok számával Intercept: az alapadatok összegének négyzete osztva az adatok számával FAJTA: a kezelés okozta hatás, a négy fajta átlagának eltérése a főátlagtól FAJTA: a kezelés okozta hatás, a négy fajta átlagának eltérése a főátlagtól Error: a hiba, a véletlen hatása, a meg nem magyarázott hatások. Error: a hiba, a véletlen hatása, a meg nem magyarázott hatások. Total: az alapadatok négyzetösszege Total: az alapadatok négyzetösszege Corrected Total: a lineáris regresszió-analízis összesen sora, a megfigyelt értékek eltérés négyzetösszege (total-intercept). Corrected Total: a lineáris regresszió-analízis összesen sora, a megfigyelt értékek eltérés négyzetösszege (total-intercept).

59 Kontrasztok A kontrasztok az egyes csoportok várható értékeinek lineáris kombinációi A kontrasztok az egyes csoportok várható értékeinek lineáris kombinációi g = c g1 x 1. + c g2 x c gp x p. g = c g1 x 1. + c g2 x c gp x p. és ha teljesül a c g1 + c g c gp = 0

60 A pontosság fokozása a kísérlet pontosabb kivitelezésével a kísérlet pontosabb kivitelezésével az ismétlésszám növelésével az ismétlésszám növelésével a parcellák csoportosításával, blokk- képzéssel a parcellák csoportosításával, blokk- képzéssel

61 Torzítás randomizáció randomizáció az adott kísérleti elrendezésnek és elméleti modellnek megfelelő statisztikai értékelés (Sváb, 1981) az adott kísérleti elrendezésnek és elméleti modellnek megfelelő statisztikai értékelés (Sváb, 1981)

62

63


Letölteni ppt "Általános lineáris modellek GLM az SPSS programban 2011."

Hasonló előadás


Google Hirdetések