Evolúciós Genom Biológia Gabor T. Marth, D.Sc. Department of Biology, Boston College Orvosi Genomika kurzus – Debrecen, Hungary, May 2006
Az előadás áttekintése 1. Fajok közötti evolúció és komparatív/összehasonlító genomika 2. Fajokon belüli evolúció, populáció genomika és az ember eredete
1. Fajok közötti evolúció és komparatív/összehasonlító genomika Initial sequencing and comparative analysis of the mouse genome Mouse Genome Sequencing Consortium Nature 420,
Evolúciós biológia kérdései M i lye n taxológiai/rendszertani összefüggések vannak a különböző organizmusok között (mely organizmusok vannak közelebbi rokonságban)? Mit tudunk a gének evolúciójáról? Hogyan alakulnak ki a gének? Mit tudunk a genomok evolúciójáról? Hogyan alakul ki a genom? Hogyan segít a humán genom megértésében az, ha más organizmusokkal hasonlítjuk össze?
Molekuláris evolúció mechanizmusa
DNS szekvencia evolúció: mutációk
Filogenetikai kapcsolatok (1) Higgs and Attwood, Bioinformatics and Molecular Evolution, Blackwell Publishing Emlős mitokondriális rRNS kis alegység szekvenciák többszörös alignment-je
Filogenetikai kapcsolatok (2) Higgs and Attwood, Bioinformatics and Molecular Evolution, Blackwell Publishing Emlős mitokondriális rRNS kis alegység szekvenciák Jukes- Cantor távolság mátrixa
Filogenetikai kapcsolatok (3) Higgs and Attwood, Bioinformatics and Molecular Evolution, Blackwell Publishing Emlős mitokondriális rRNS kis alegység szekvenciák alapján felállított filogenetikai fa
Gén struktúrájának evolúciója: duplikációk
Gén duplikáció – paralógok Lander et al. Initial sequencing and analysis of the human genome, Nature, 2001
Kromoszóma szerveződés evolúciója
„Synteny” Initial sequencing and comparative analysis of the mouse genome Mouse Genome Sequencing Consortium Nature 420,
Génosztályok organizmusok között Lander et al. Initial sequencing and analysis of the human genome, Nature, 2001
Gén konzerváció organizmusok között Lander et al. Initial sequencing and analysis of the human genome, Nature, 2001
A komparatív genomika segíti a gén annotációkat
2. Fajokon belüli evolúció, populáció genomika és az ember eredete
Kérdések az emberi evolúcióról Hogyan mutathatjuk ki a genetikai variációkat? Mi a szintje az emberek közötti diverzitásnak? Hogyan modellezhetjük az ősi és a mutációs folyamatokat? Mit mond a mitokondriális DNS szekvencia filogenetikai analízise az ember eredetéről és elterjedéséről? Teljes képet mutat-e nekünk a mitokondriális DNS? Mit tanulhatunk a megfelelő modell analízissel a nukleáris DNS-ről? Vajon egy hullámban történt-e az Afrikából való migráció/kivándorlás, vagy esetleg több hullámban?
Hogyan fedezhetünk fel SNP-ket? vegyünk több szekvenciát ugyanazon genom régióból „base quality values” segítségével eldönthető, hogy a mismatch-ok igazi polimorfizmusok-e vagy szekvencia hibák
SNP felfedezés folyamata Referencia genomszekvencia 1. Fragmentum felépítés (adatbázis keresés) 2. Anchored alignment 3. Paralog azonosítás 4. SNP detektálás
SNP felfedezés genom szinten Sachidanandam et al. Nature 2001 ~ 8 millió EST WGS BAC Referencia genom
Humán genetikai diverzitás A polimorfizmusok denzitása nagyon különböző kromoszómák között Az átlagos polimorfizmus aránya kromoszóma páronként: 1 SNP/1,300 bp méretű szekvencia
Mit magyaráz meg a heterogenitás? G+C nukleotid tartalom CpG di- nukleotid tartalom Rekombinációs gyakoriság Funkcionális korlátok 3’ UTR5.00 x ’ UTR4.95 x Exon, overall4.20 x Exon, coding3.77 x synonymous 366 / 653 non-synonymous287 / 653 A variancia igen magas, így ezek a jellegek nem alkalmasak a nukleotid diverzitás meghatározására egy adott régióban, ezért a random folyamatok inkább vezetnek a genom variáció alapvető formájához (random) genetikai drift
A genetikai variációk eredete a szekvencia variációk mutációs események eredményei TAAAAAT TAACAAT TAAAAAT TAACAAT TAAAAATTAACAAT TAAAAAT MRCA mutációk generációkon keresztül tovább öröklődnek és meghatározzák napjaink variációs mintázatát
A rekombináció megzavarja a filogenezist acggttatgtaga accgttatgtaga acggttatgtaga accgttatgtaga A rekombináció miatt, a DNS szekvenciáknak valószínűleg nincsen egy közös őse, ennélfogva filogenetikai analízis nem alkalmazható
Mit mutat a mtDNS az ember eredetéről? a mitokondrium csupán egyetlen egy lókusz (~16kb méretű a 3Gb méretű humán genomban) Campbell and Heyer. Genomics, Proteomics, Bioinformatics. Cummings.
Mit mutat a nukleáris DNS? a rekombináció miatt, filogenetikai analízisre nem alkalmas (nincsen olyan egységes filogenetikai fa, mely magyarázná a DNS szekvenciák ősét) Ehelyett, általában statisztikai “genetikai analízis”-t alkalmaznak pl. megvizsgálják a statisztikai tulajdonságait a lehetséges ősöknek, melyek az egyedek nukleotid szekvenciájának vizsgálatából származnak
Polimorfizmus adatok 1. marker denzitás (MD): a SNP-ek számának megoszlása szekvenciapáronként “ritka” “gyakori” 2. Allél frekvencia spektrum (AFS): a SNP-ek megoszlása az allélgyakoriságok függvényében egy adott mintában Clone 1 Clone 2# SNPs AL00675AL AS81034AK CB00341AL SNPMinor alleleAllele count A/GA1 C/TT9 A/GG3
Populációgenetikai modellek múlt Jelen állandóterjeszkedésösszeomlás MD (szimuláció) AFS (direkt forma) történelem palacknyak „bottleneck”
Adat illesztés : polimorfizmus denzitása a legjobb modell a „bottleneck” eloszlású populáció jelenleg N 1 =6,000 T 1 =1,200 gen. N 2 =5,000 T 2 =400 gen. N 3 =11,000 Marth et al. PNAS 2003 a konkluzió az, hogy a nyilvános genom szekvenciák ismeretlen etnikum összetétele megzavarja a marker denzitási adatokat, mi etnikailag különböző mintákból határoztuk meg az allélgyakoriságot
Adat illesztés: allél gyakoriság jelenleg N1=20,000 T1=3,000 gen. N2=2,000 T2=400 gen. N3=10,000 konszenzusos modell: bottleneck bottleneck ~ 3,000 generációval (vagy 100,000 évvel) korábban
Más humán populációkból származó adatok Európai adatok Afrikai adatok bottleneck mérsékelt de folyamatos növekedés Marth et al. Genetics 2004
Mit árul el nekünk a nukleáris DNS? Legújabb afrikai eredetMultirégiós eredményeink