Mol. biol. módszerek 1. Dr. Sasvári Mária A humán genom projekt
A HGP “munkapéldánya”
CeleraGenomics (privát szektor) Craig Venter HGP (Human Genome Project) Francis Collins 20 központ, állami támogatás NCBI:National Center of Biotechnology Information
A humán genom első nyers szekvenciája 2001 febr 16 Nature: HGP National Human Genome Research Institute NIH, USA) US Department of Energy Wellcome Trust (Anglia) Japán, Franciaország, Németország, Kina kb. 300 millió dollár (fele US támogatásból) 2001 febr 16 Science: Celera
A HGP hierarchikus rendszere Alacsony felbontás Citogenetikai (kromoszómasáv) térképek Átfedő fragmentumok klónozása Restrikciós térképezés Szekvenálás Nagy felbontás
(‘unique’) szekvencia Minden kezdet nehéz J. Watson, a HGP első elnöke Első cél: minél több marker kifejlesztése (átlagos távolság: 150000 bp legyen) Marker: Egyszer előfordul ó (‘unique’) szekvencia (100-200 bp) Eredmény: 30000 db marker
A hierarchikus rendszer felépítése Izolált kromoszómák feldarabolása ritkán vágó restrikciós endonukleázokkal 150000 bp darabok A keletkezett darabok klónozása BAC (Bacterial Arteficial Chromosome) könyvtár létrehozása
A hierarchikus rendszer felépítése BAC könyvtár: átfedő darabok Következő lépések: 1. restrikciós térképezés 2. Sorba-rendezés 3. A minimális számú BAC klón kiszelektálása
BAC könyvtárból fág könyvtár kb. 150 000 bp (BAC) kb. 1500 bp darabok (átfednek) A végek szekvenálása GCCGAATCCAATTAGAAAAT TAGAAAATCACATTTACCAGTCTGA CCAGTCTGACCCCGCAAACGGGTTT A szekvenciák sorba rakása GCCGAATCCAATTAGAAAAT TAGAAAATCACATTTACCAGTCTGA CCAGTCTGACCCCGCAAACGGGTTT
Összerakás http://www.dnaftb.org/dnaftb/39/concept/index.html
Celera: A “géppisztoly” módszer Craig Venter 2000 bp és 10000 bp darabok A végek szekvenálása, összerakás: AAGGACTTATG____________________GGACACAGGTTATGG GACTTA_____CGTTGGA GAGAGGACACA________________CGTTATATTG
Módszertani áttörések 1992-es adatok a DNS szekvenálásról: 1$/bp, 100,000 bp/év Humán genom 3x109bp: 30,000 év, 3 miliárd dollár ? Módszertani áttörések Automata DNS szekvenálás kifejlesztése Polimeráz láncreakció (PCR) Adatfeldolgozás fejlődése (Bioinformatika)
Automata DNS szekvenálás Nyers szekvencia
Az automata DNS szekvenálás elve ‘Színes szekvenálás` A dideoxi lánc termináláson alapul Termináló helyek ... 3’ C A G T A ddA Szekvenáló reakcióelegy: Mind a négy dNTP Mind a négy ddNTP különböző színű fluorogén festékkel DNA polimeráz, primer
Egy szekvenálási eredmény: + index
PCR: Egy kiválasztott DNS szakasz sokszorosítása A teljes genom 102-103 bp PCR termék (2 x ) 2 x 3x109 bp dsDNS fragmentum
A Humán Genom reprezentációs formái: 1. : ‘in silico’ HGP (Human Genome Program) http://www.ncbi.nlm.nih.gov/ NCBI:National Center of Biotechnology Information
http://www.ncbi.nih.gov/
International Nucleotide Sequence Database Collaboration : 3 fő tagja van: GenBank (NIH, Bethesda, Maryland USA) Európai: EMBL-Bank (European Molecular Biology Laboratory) (EMBL's European Bioinformatics Institute, ma Angliában, régebben Heidelbergben) 3. DNA Data Bank of Japan Az adatbázis meghaladta a -t 100 x 109 bp 165.000 faj teljes vagy részleges genomját tartalmazza
http://www.ncbi.nih.gov/Genbank/ 2000 2005
A 21-es kromoszómán található gének listája (Entrez/Nucleotides (GenBank)
Keresés: DRD4 gén (Entrez/Nucleotides (GenBank)
A DRD4 gén (dopamin D4-es receptor) helyzete a 11-es kromoszómán (Entrez/Nucleotides (GenBank)
NCBI / Entrez Gene
NCBI / Entrez Gene keresés: DRD4 (humán)
NCBI / Entrez Gene keresés: DRD4 (humán) Exon/intron szerkezet Környező gének publikációk
Keresés betegségre: „Hypercholesterolemia” (Entrez/Nucleotides (GenBank)
Keresés betegségre: OMIM Online Mendelian Inheritance in Man
OMIM keresés: hypercholesterolemia
A Humán Genom reprezentációs formái: 2. : Bakteriális kolóniákban BAC klónok Minden klónozott darab helye ismert FISH (fluorescent in situ hybridization) Markerek STS (short tagged sequence) Egyedi szekvenciák, klón azonosítók (genom) EST (expressed sequence tag) Egyedi szekvenciák a cDNS könyvtárakból
Mit lehet kiolvasni a DNS szekvenciákból?
A “hasznos információ” - hány génünk van? Kb. 20,000 - 30,000 fehérje kódoló gén (sokkal kevesebb, mint amennyit vártunk) vagyis a gének a genom kevesebb mint 5%-át foglalják el…..
??? ISMÉTLŐDŐ SZEKVENCIÁK Mi van a maradék 95% „extra (felesleg? szemét?) DNS-ben? ISMÉTLŐDŐ SZEKVENCIÁK ??? A humán genom 45% -át “ugráló gének” (transzpozonok) alkotják LINE (long interspread elements) 6 kb, 8500 kópia, a genom 25%-a reverz transzkripcióval szaporodik nagyon sok sérült (rövidebb, inaktív) példány SINE (short interspred elements) 100-300 bp, 1,5 millió kópia, a genom 13%-a, a LINE felhasználásával szaporodik Egyebek Humán génduplikációk (pszeudogének) Egyszerű ismétlések (pl. AAAAAAAAAAAAAA….)
A humán gének statisztikai adatai Exonok átlagos hossza humán Intronok átlagos hossza humán Hozzávetőleges adatok: A legtöbb exon 100-200 bp hosszú 7-9 exon/gén intron: 1000-4000 bp Domain-ek száma a fehérjékben A humán fehérjék domain szerkezetében igen nagy a variabilitás Humán
‘Periódusos rendszer’ A humán fehérjék listája Gén és fehérje indexek ‘Orvos-biológiai ‘Periódusos rendszer’ A humán gének listája A humán fehérjék listája
Fehérje adatbázisok: HPRF
Orvosi alkalmazások 1. Öröklődő betegségekért felelős gének azonosítása Monogénes rendszerek: Legalább 30 betegséget azonosítottak 2000-ben: pl. Teljes színvakság (CNGA3 gén) (cGMP függő csatorna) Poligénes rendszerek: “association studies”
http://www.genome.gov/Pages/News/PaceofDiseaseGeneDiscovery.pdf Cumulative Pace of Disease Gene Discovery (1981-2002). The number of disease genes identified so far is 1,485. Data provided by Online Mendelian Inheritance in Man.
Gyógyszeripar Új gyógyszer-támadáspontok felfedezése ‘in silicio’ Pl.: Szerotonin receptor ismert gén: 5-HT3A új gén (homológ szekvencia): 5-HT3B A kettő együtt alkot egy hatékony szerotonin receptort Pl.: Szekvenciaelemek, melyekre ismert gyógyszerek hatnak Van-e hasonló szekvencia a névtelen gének között ??? Új fehérjék, melyekre hatnak az ismert gyógyszerek
Hogyan tovább?
Hogyan tovább?
Hogyan tovább?
1999: Mouse Genome Sequencing Network, NIH (2003) Nature, 2001 oct. (413)