Humán Genom szekvencia és variabilitás Lecture outline: 1. Human genome sequence - the importance of the genome sequence - completed genomes - sequencing strategies: hierarchical and whole-genome shotgun - Biology and informatics of hierarchical genome sequencing 2. Human genome annotations - ab initio annotations - homology based annotations - structural annotations - the main features of the human genome sequence 3. Human genome variability - DNA sequence variations (SNPs, INDELs) - structural variations (e.g. chromosome rearrangements, copy number changes) - epigenetic variations (e.g. changes in histone structure, DNA methylaton) Gabor T. Marth, D.Sc. Department of Biology, Boston College marth@bc.edu Orvosi genomika kurzus – Debrecen, Hungary, May 2006
Az előadás átteknitése 1. Genom szekvenáló stratégiák, szekvenáló informatika 2. Genom érdekességek, funkcionális és struktúrális jellegzetességek a humán genomban 3. Genom variabilitás, DNS nukleotid, struktúra és epigenetikus variációk
1. A humán genom szekvencia
A nukleáris genom (kromoszóma)
A genom szekvencia az eredeti templát, melyen körvonalazódtak genetikai kódunk funkcionális jellegzetességei (gének, regulátor elemek, másodlagos szerkezet, harmadlagos szerkezet, stb.)
Teljes genomok ~3,000 Mb >100 Mb ~100 Mb ~1 Mb
Főbb genom szekvenáló stratégiák Teljes-genom shotgun szekvenálás Klón-alapú shotgun szekvenálás Human Genome Project Celera Genomics, Inc.
Hierarchikus genom szekvenálás BAC könyvtár készítése klón térképezés shotgun alklón könyvtár készítése szekvenálás szekvencia rekonstrukció (szekvencia összeállítása) Lander et al. Nature 2001
Klón térképezés – “sequence ready” térkép
Hierarchikus genom szekvenálás BAC könyvtár készítése klón térképezés shotgun alklón könyvtár készítése szekvenálás szekvencia rekonstrukció (szekvencia összeállítása) Lander et al. Nature 2001
Shotgun alklón könyvtár készítése Klónozó vektor BAC primer klón Alklón inzert Szekvenáló vektor
Hierarchikus genom szekvenálás BAC könyvtár készítése klón térképezés shotgun alklón könyvtár készítése szekvenálás/read processing szekvencia rekonstrukció (szekvencia összeállítása) Lander et al. Nature 2001
Szekvenálás
Robotizált automatizálás Lander et al. Nature 2001
Bázis „calling” PHRED bázis = A Q = 40
Vektor „clipping”
Hierarchikus genom szekvenálás BAC könyvtár készítése klón térképezés shotgun alklón könyvtár készítése szekvenálás/read processing szekvencia rekonstrukció (szekvencia összeállítása) Lander et al. Nature 2001
Szekvencia összeállítása PHRAP
Az ismétlődő DNS szekvenciák nehezítik az összeállítást
Szekvenálás befejezése (finishing) kis szekvencia lefedettségű és/vagy rossz minőségű régiók hézag CONSED, AUTOFINISH
2. Humán genom annotáció
Genom annotáció – Célok Fehérje kódoló gének ismétlődő elemek RNS gének GC tartalom
A kiindulási anyag AGCGTGGTAGCGCGAGTTTGCGAGCTAGCTAGGCTCCGGATGCGA CCAGCTTTGATAGATGAATATAGTGTGCGCGACTAGCTGTGTGTT GAATATATAGTGTGTCTCTCGATATGTAGTCTGGATCTAGTGTTG GTGTAGATGGAGATCGCGTAGCGTGGTAGCGCGAGTTTGCGAGCT AGCTAGGCTCCGGATGCGACCAGCTTTGATAGATGAATATAGTGT GCGCGACTAGCTGTGTGTTGAATATATAGTGTGTCTCTCGATATGT AGTCTGGATCTAGTGTTGGTGTAGATGGAGATCGCGTGCTTGAG TCGTTCGTTTTTTTATGCTGATGATATAAATATATAGTGTTGGTG GGGGGTACTCTACTCTCTCTAGAGAGAGCCTCTCAAAAAAAAAGCT CGGGGATCGGGTTCGAAGAAGTGAGATGTACGCGCTAGXTAGTAT ATCTCTTTCTCTGTCGTGCTGCTTGAGATCGTTCGTTTTTTTATGCT GATGATATAAATATATAGTGTTGGTGGGGGGTACTCTACTCTCTCT AGAGAGAGCCTCTCAAAAAAAAAGCTCGGGGATCGGGTTCGAAGA AGTGAGATGTACGCGCTAGXTAGTATATCTCTTTCTCTGTCGTGCT
Kódoló gének – ab initio predikciók Start kodon Stop kodon ATGGCACCACCGATGTCTACGTGGTAGGGGACTATAAAAAAAAAAA PolyA szignál Open Reading Frame = ORF
Ab initio predikciók Gén struktúra
Ab initio predikciók …AGAATAGGGCGCGTACCTTCCAACGAAGACTGGG… splice donor hely splice acceptor hely
Ab initio predikciók Genscan Grail Genie GeneFinder Glimmer etc… EST_genome Sim4 Spidey EXALIN
Homológián alapulú predikciók más szervezetből származó ismert kódoló szekvencia expresszált szekvencia ACGGAAGTCT GGACTATAAA ATGGCACCACCGATGTCTACGTGGTAGGGGACTATAAAAAAAAAAA homológia által megjósolt gének Genomescan Twinscan etc…
Összesítés – gén predikciós rendszer Sim4 dbEst Genewise Grail Genscan FgenesH Ensembl Otto
ncRNS gének Szerkezet alapján történő predikció (pl. tRNS-ek) újabb ncRNS-ek esetén csak a homológián alapuló megközelítések voltak sikeresek
Ismétlődő annotáció „Repeat annotation”: szekvencia hasonlóságokon alapszik, hogy felismerjük az ismétlődő elemeket az ismétlődő szekvenciák könyvtárában
A humán genom térképe
Gén annotációk – kódoló gének száma Lander et al. Initial sequencing and analysis of the human genome, Nature, 2001
Gén annotációk – gének mérete Lander et al. Initial sequencing and analysis of the human genome, Nature, 2001
Gén annotációk – gének funkció Lander et al. Initial sequencing and analysis of the human genome, Nature, 2001
GC tartalom és kódoló potenciál Lander et al. Initial sequencing and analysis of the human genome, Nature, 2001
ncRNS-ek Lander et al. Initial sequencing and analysis of the human genome, Nature, 2001
Szegmentális duplikációk Lander et al. Initial sequencing and analysis of the human genome, Nature, 2001
Ismétlődő elemek Lander et al. Initial sequencing and analysis of the human genome, Nature, 2001
Gének és ismétlődések
Fizikai vs. genetikai térkép (Mb/cM)
3. Humán genom variabilitás
DNS szekvencia variációk a referencia humán genom szekvenciája 99.9%-ban azonos más ember szekvenciájával a szekvencia-variációk teszik egyedivé genetikai mintázatunkat a leggyakoribb variációs forma a „single-nucleotide polymorphisms” (SNP) – 10 millió SNP-et ismerünk ma SNP
DNS szekvencia variációk inzerció-deléció (INDEL) polimorfizmusok
Szerkezeti variációk Speicher & Carter, NRG 2005
Szerkezeti variációk Feuk et al. Nature Reviews Genetics 7, 85–97 (February 2006) | doi:10.1038/nrg1767
Szerkezeti variánsok azonosítása Feuk et al. Nature Reviews Genetics 7, 85–97 (February 2006) | doi:10.1038/nrg1767
Epigenetikus változások: kromatin struktúra Sproul, NRG 2005
Epigenetikus változások : DNS metiláció Laird, NRC 2003