Paleobiológiai módszerek és modellek 7. Hét TÖBBVÁLTOZÓS ADATELEMZÉS Statisztikai módszerek csoportosítása a változók száma szerint: -egyváltozós, kétváltozós, többváltozós Többváltozóst tekinthetjük az egy- és kétváltozós kiterjesztésének Más osztályozás: feltáró (exploratory) módszerek – mintázatok keresése igazoló (confirmatory) módszerek – statisztikai jelentés vizsgálata Többváltozós módszerek egyik területe: morfometria iskolák: klasszikus ~, geometriai ~ Célok: - dimenziók számának csökkentése (feltáró) - statisztikai jellemzés (igazoló) - klaszter analízis, kladisztika (csoportszerkezet feltárása) - változók közötti kapcsolat megértése Irodalom: Hammer & Harper, Paleo Data Analysis, 3., 4., 6. fejezet részei PAST leíró kézikönyv Podani János: Bevezetés a többváltozós biológiai adatfeltárás rejtelmeibe (Scientia Kiadó)
Módszerek változatossága Podani ábrája, p. 9
Feltáró jellegű többváltozós módszerek Általában: Sok változó A változók között valamilyen mértékű korreláció áll fenn Észlelések száma > változók száma Normális eloszlás feltételezése gyakori elvárás Ordináció: cél a dimenzionalitás csökkentése
Többváltozós módszerek a paleontológiában Vizsgálati egységeink: Példányok változók: morfometriai mérési adatok, karakter állapotok, tafonómiai bélyegek Minták taxonok, ökológiai típusok, tafonómiai változók, geokémiai jellegek Minták csoportjai (pl. rétegtani helyzet alapján) egyes mintákból származtatott, számított változók Változók jellegei: Folytonos, diszkrét, igen-nem, származtatott
Hol használhatunk többváltozós módszereket? „ahol kellően sok adatunk van” Morfometria: méretadatokkal morfológiai csoportok felismerése, fajok elkülönítése Paleoökológia: fajok eloszlása társulásokban minták csoportosítása fajösszetétel alapján, biofácies és őskörnyezet elemzés Tafonómia: fajok eloszlása a „sírközösségekben” tafonómiai hűség és torzítás (bias) vizsgálata Paleobiogeográfia: fajok térbeli elterjedése bioprovinciák elkülönítése, provincialitás és endemizmus felismerése Biosztratigráfia: fajok időbeli elterjedése zonáció (de vannak sikeresebb módszerek is) Makroevolúció diverzitási trendek vizsgálata Filogenetika kladisztika – önálló módszertannal
A PAST legterjedelmesebb menücsaládja a Multivar svédasztal
Feltáró ordinációs módszerek rövid áttekintése Főkomponens analízis (PCA) parametrikus ordináció, folytonos adatokra Főkoordináta analízis (PCO) parametrikus ordináció, diszkrét adatokra, hasonlóságon és távolságon alapulva Korreszpondecia elemzés nem-parametrikus, észlelések és változók együttes ábrázolása Kanonikus korreláció elemzés (CCA) egy kiemelt, pl. környezeti változó menti változékonyságot feltáró parametrikus módszer Többdimenziós skálázás (MDS) nem-parametrikus, hasonlóság és távolság alapú „térképezési” módszer
Főkomponens analízis PCA Főkoordináta analízis PCO Korreszpondancia elemzés CA Kanonikus korreláció elemzés CCA
Főkomponens analízis (PCA) Főkomponens: az eredeti változók mátrixának forgatásával származtatott ortogonális dimenziójú változó. Az egymás utáni főkomponensek maximálisan jellemzik a maradék adatok változékonyságát. Sajátérték (eigenvalue): a főkomponens súlyának mértéke, mennyit magyaráz meg az összes varianciából Sajátvektor (eigenvector): a főkomponens vektora Súlyérték (loading): az eredeti változók milyen mértékben járulnak hozzá az egyes főkomponensekhez
Esettanulmány trilobitákra