Genomika I. gén x transzkripciós fúzió (operon) transzlációs ATG gén x transzkripciós fúzió (operon) transzlációs fúzió (fehérje) ATG ATG ATG gfp gfp transzkripció ATG ATG ATG 5’ 5’ gfp gfp transzláció külön fehérje termékek kiméra (fúziós) fehérje
Mi határoz meg egy gént? 1. Az öröklődés egysége, a fenotípusban jeleníti meg magát 2. Egy gén – egy enzim (Beadle és Tatum 1943) 3. Egy gén – egy polipeptid, vagy egy gén – egy expressziós termék (egy RNS vagy egy fehérje) 4. Biokémiai funkció önálló egysége (Jacob és Monod) 5. Egy genetikailag térképezhető lokusz 6. Az expresszió egysége - A gén egy DNS szekvencia, ami átíródik - és tartalmazza az átírást szabályozó szekvenciákat is 7. Egy kódoló szekvencia - a génnek az a része, ami fehérjévé transzlálódik -- egy rRNS, vagy tRNS lokusz egy gén -- az intronok részei a génnek?
A prokarióta gén egyszerű szerkezete s70-típusú promóter Transzkripciós terminátor TTGACA ---17bp---TATAAT---A UUUUUUU Shine-Delgarno GGAGGA ATG Stop Szabályozó szekvenciák kódoló szekvencia 1-500 nts 2-8 nts (~ 5 nts) változó Riboszóma kötő hely (RBS)
A start kodonok flexibilisek Shine-Delgarno GGAGGA ATG A start kodonok >90%-a ATG Más kodonokkal is kezdődhet a kódoló szekvencia. Nem túl gyakran GTG (Valin) és TTG (Leucin) Egy metionin ekkor is beépül, az első aminosav.
A korrekt startkodon kijelölése (transzláció) 30S alegység 3’ 16S rRNS UCCUCCA 5’ - NNNNNAGGAGGU-N5-10-AUG kódoló szekvencia Shine-Delgarno szekvencia (RBS) start kodon
Operon szerkezet prokariótákban
Szimultán transzkripció és transzláció Nincs sejtmag, ez teszi lehetővé mRNS transzkriptum Start 5’ ’ N fehérje riboszóma RNAP Promóter
A gének operononokba szerveződnek Nem átfedő intergénes spacer A gén vége B gén kezdete TTGTGA - 30 nts - AAGAGGGCACCGATGGCG A B C B gén vége CTCTTGGAGGACGCATGACG átfedő transzlációs csatolás (coupling) (riboszóma nem disszociál) GGAGGACGCATGACG C gén kezdete
A génszerveződés hierarchiája Gén – a genetikai funkió egysége Operon – egy transzkriptumba átíródó gének Regulon – gének (operonok) azonos szabályozással Modulon – gének modulációja azonos stimulánsra Elemek – plazmid, kromoszóma, fág ** növekvő komplexitás Genom
Az első baktérium genom szekvencia (1995) The Institute for Genomic Research (TIGR) A Haemophilus influenzae Rd genomja Egy, gyűrűs kromoszóma 1,860,137 bp Külső kör – az adatbázisokban homológ kódoló szekvenciák A gének 40%-ának akkor még nem volt homológja
E. coli K12 Narancs téglalap forward gének Sárga téglalap gének a komplementer szálon Piros nyilak -rRNS Zöld nyilak -tRNA Fehér kör -REP szekvenciák Kék kör -hasonlóság bakteriofág fehérjékhez Napkorong -CAI (codon adaptation index)
Komparatív genomika Összetett genomok Gyűrűs és lineáris DNS elemek Nagymértékű változatosság
Mikrobiális genom szekvenciák http://www.tigr.org/tdb/mdb/mdbcomplete.html http://www.ncbi.nlm.nih.gov/PMGifs/Genomes/micr.html
Mihez kezdhetünk ezzel? Hogyan találhatjuk meg a géneket? CGGTTGAAAGCGGTAGCGTCCATGCGTATTACTCTTGAGCGGTCGAACCTTCTGAAATCGCTGAACCACGTCCACCGGGT CGTCGAGCGTCGCAACACGATCCCGATCCTGTCCAACGTTCTGCTGCGCGCCTCCGGCGCCAATCTGGACATGAAGGCGA CCGACCTCGATCTGGAAATCACCGAAGCGACCCCGGCCATGGTGGAGCAGGCTGGCGCCACCACCGTACCGGCACACCTG CTTTACGAAATCGTGCGCAAGCTGCCGGATGGTTCCGAAGTGCTTCTGGCGACCAACCCGGACGGCTCCTCCATGACCGT TGCGTCCGGCCGCTCGAAATTCTCGCTGCAATGCCTGCCGGAAGCGGATTTCCCTGACCTCACCGCCGGCACCTTCAGCC ACACCTTCAAACTGAAGGCGGCCGATCTGAAGATGCTGATCGACCGGACGCAGTTTGCGATTTCGACCGAAGAGACGCGT TATTACCTGAACGGCATTTTCTTCCACACCATCGAAAGCAATGGCGAGCTGAAACTGCGCGCCGTCGCCACCGACGGTCA CCGCCTTGCGCGTGCTGACGTCGATGCGCCCTCCGGCTCCGAAGGCATGCCGGGCATCATCATTCCGCGCAAGACCGTCG GTGAACTGCAGAAGCTGATGGACAATCCGGAACTGGAAGTCACAGTCGAAGTCTCGGATGCGAAGATCCGCCTGGCCATC GGTTCCGTCGTTCTGACCTCGAAGCTGATCGACGGCACCTTTCCCGATTATCAGCGCGTCATCCCAACCGGCAACGACAA GGAAATGCGCGTCGATTGCCAGACCTTCGCCCGGGCAGTGGACCGTGTTTCGACGATTTCTTCCGAGCGCGGCCGCGCCG TGAAGCTGGCGCTAACTGACGGCCAGTTGACGCTGACCGTCAACAATCCCGACTCGGGAAGTGCTACCGAAGAAGTGGCC GTTGGCTACGACAATGATTCGATGGAAATCGGCTTCAATGCCAAATATCTCCTCGACATCACGTCGCAGCTCTCCGGCGA AGATGCGATTTTTCTGCTGGCGGATGCGGGTTCGCCAACACTGGTTCGCGATACCGCCGGCGACGACGCACTCTATGTTC TGATGCCGATGCGCGTTTAAAACCGACCGTTTTCTTCAATTTTTCCAGAAACGCCGGTGGATCGCTTCATCGGCGTTTTT TGATTCGGCGAACAGGTGGCTCTACCCGTAACTGAATTTTCTCAGTTACGACATTTTGCCTTGTTTTTGCGCCAAATGGG ATCAACAGTACGTAACAATTTTTTGACAATGACCAATACATCCGAGGGGAATCATGGCACTCAACCTGAAGCAACGGCTT GAACAAAAATTTGAGGAAGAAATCCGCTTTTTCAAAGGTATGGTCAGCCAGCCGAAAAAAGTCGGCGCCATTGTCCCGAC ATCGTCGATCACGGCGAAAAAGATGGCAAGCGTCATCAATCCCCATTCCGGCCTGCCGGTTCTGGAACTCGGTCCCGGCA CCGGCGTCATCACCAAGGCCATTCTGGCGCGCGGCATCAAGCCGGAGAGCCTGACGGCCATCGAATATTCGACTGATTTC TACAATCAGCTGCTCCGGAGCTATCCAGGCGTCAATTTCGTCAATGGTGACGCCTTCGATCTCGATGCGACGCTTGGCGA GCACAAGGGTCAGATGTTCGACAGCGTTATCTCCGCCGTGCCGATGCTGAATTTTCCGATGGCTGCCCGCATCAAGCTTC TCGATGAATTGCTGAAGCGCGTGCCGCACGGCCGACCCGTAGTACAGATATCCTACGGTCCGATTTCCCCGATCGTCGCG CAGCCGCATCTCTACCATATCCGCCATTTCGATTTCATCGTGCGCAATATTCCGCCGGCGCAATTGTGGACCTATACGCG GGCCTGATCGTCCCGCCAGAACAGACGAGGCCGTCATTTCCCAGTCGTGACGAATGGTTAGGGTGTTGATTACCCTCTCC ATTGCCTTTGAGGACCGATTGCCATGCATGCGCTCTACATCACCCACCCCCAGGTCAAGATCGACCCGGCTGTTCCCGTT CCCGAATGGGGGCTTTCGGAAAGGGGTGCTGAACGGGCGCGTGAGGCGAGCCGCCTTCCCTGGGCGAAAGCATTGCGGCG CATCGTTTCCAGCGCCGAAACCAAGGCAATCGAAACCGCCCATATGCTCGCGGAAACCTCCGGTGCAGCAATAGAGATCA TCGAAGCGATGCATGAAAACGACCGGTCCGCCACCGGTTTCCTGCCGCCGCCGGAATTCGAGAAGGCGGCGGACTGGTTC TTCGCCCATCCTGAGGAGAGTTTTCAAGGCTGGGAGCGGGCAATCGACGCGCAGGCGCGGATCGTCGAGGCCGTCAAAGC CGTTCTCGACCGACACGACGCACGGCAGCCGATCGCCTTTGTCGGCCATGGCGGCGTGGGCACACTGTTGAAATGCCATA TTGAAGGCCGCGGCATCAGCCGCAGCAAGGACCAGCCTGCTGGCGGTGGCAATCTTTTCCGCTTTTCCATCGCCGAATTT TCACTTGCAGCGGCCTCCCCCACATGCGACTGGACGGCAATGGAAACATGGCAGGGATAAGACAATGACCGCGCGCGAAA AACTCATCGTCGGGCTGGATGTTCCGACTGTGCAGCAGGCAGAAGACATCGTGTCGAAAATCGGCGACGAGGTCCTGTTC TACAAGATCGGTTATCAGCTGGTATTCGCCGGGGGTCTTGAATTCGCGCGTGACCTCGTCCAGAGCGGCAAGAAGGTCTT TCTCGACATGAAGCTGCTCGATATCGACAACACCGTCGCCTCGGGCGTCGAAAACATCGCCCGCATGGGCATGTCGATGC TGACGCTGCATGCCTATCCCAAAGCCATGCGTGCTGCCGTCAAGGCGGCGGAAGGCTCCGGCCTCTGCCTGCTGGGCGTC
Keresd a nyitott leolvasási kereteket (Open Reading Frame=ORF) A triplett, a genetikai kód nem-megszakított természete segít 64 lehetséges kodon 61 igazi kodon 3 stop kodon (TGA, TAA, TAG) Véletlen eloszlás kb. a kodonok 1/21 része stop kodon Minden szekvenciának 3 lehetséges leolvasási kerete van (+1, +2, +3) A komplementerének is 3 lehetséges leolvasási kerete van (-1, -2, -3) 6 lehetséges leolvasási keret GAAAAAGCTCCTGCCCAATCTGAAATGGTTAGCCTATCTTTCCACCGT E K A P A Q S E M V S L S F H R K K L L P N L K W L A Y L S T K S S C P I * N G * P I F P P
Minden szekvenciának meghatározzuk az összes lehetséges leolvasási keretét EMBOSS programok: GETORF, PLOTORF CACAGGAAACAGCTATGACCATGATTACGGATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTT ACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTC CCAACAGTTGCGCAGCCTGAATGGCGAATGGCGCTTTGCCTGGTTTCCGGCACCAGAAGCGGTGCCGGAAAGCTGGCTGG AGTGCGATCTTCCTGAGGCCGATACTGTCGTCGTCCCCTCAAACTGGCAGATGCACGGTTACGATGCGCCCATCTACACC AACGTAACCTATCCCATTACGGTCAATCCGCCGTTTGTTCCCACGGAGAATCCGACGGGTTGTTACTCGCTCACATTTAA TGTTGATGAAAGCTGGCTACAGGAAGGCCAGACGCGAATTATTTTTGATGGCGTTAACTCGGCGTTTCATCTGTGGTGCA ACGGGCGCTGGGTCGGTTACGGCCAGGACAGTCGTTTGCCGTCTGAATTTGACCTGAGCGCATTTTTACGCGCCGGAGAA AACCGCCTCGCGGTGATGGTGCTGCGTTGGAGTGACGGCAGTTATCTGGAAGATCAGGATATGTGGCGGATGAGCGGCAT TTTCCGTGACGTCTCGTTGCTGCATAAACCGACTACACAAATCAGCGATTTCCATGTTGCCACTCGCTTTAATGATGATT TCAGCCGCGCTGTACTGGAGGCTGAAGTTCAGATGTGCGGCGAGTTGCGTGACTACCTACGGGTAACAGTTTCTTTATGG CAGGGTGAAACGCAGGTCGCCAGCGGCACCGCGCCTTTCGGCGGTGAAATTATCGATGAGCGTGGTGGTTATGCCGATCG CGTCACACTACGTCTGAACGTCGAAAACCCGAAACTGTGGAGCGCCGAAATCCCGAATCTCTATCGTGCGGTGGTTGAAC TGCACACCGCCGACGGCACGCTGATTGAAGCAGAAGCCTGCGATGTCGGTTTCCGCGAGGTGCGGATTGAAAATGGTCTG CTGCTGCTGAACGGCAAGCCGTTGCTGATTCGAGGCGTTAACCGTCACGAGCATCATCCTCTGCATGGTCAGGTCATGGA TGAGCAGACGATGGTGCAGGATATCCTGCTGATGAAGCAGAACAACTTTAACGCCGTGCGCTGTTCGCATTATCCGAACC ATCCGCTGTGGTACACGCTGTGCGACCGCTACGGCCTGTATGTGGTGGATGAAGCCAATATTGAAACCCACGGCATGGTG CCAATGAATCGTCTGACCGATGATCCGCGCTGGCTACCGGCGATGAGCGAACGCGTAACGCGAATGGTGCAGCGCGATCG TAATCACCCGAGTGTGATCATCTGGTCGCTGGGGAATGAATCAGGCCACGGCGCTAATCACGACGCGCTGTATCGCTGGA TCAAATCTGTCGATCCTTCCCGCCCGGTGCAGTATGAAGGCGGCGGAGCCGACACCACGGCCACCGATATTATTTGCCCG ATGTACGCGCGCGTGGATGAAGACCAGCCCTTCCCGGCTGTGCCGAAATGGTCCATCAAAAAATGGCTTTCGCTACCTGG AGAGACGCGCCCGCTGATCCTTTGCGAATACGCCCACGCGATGGGTAACAGTCTTGGCGGTTTCGCTAAATACTGGCAGG CGTTTCGTCAGTATCCCCGTTTACAGGGCGGCTTCGTCTGGGACTGGGTGGATCAGTCGCTGATTAAATATGATGAAAAC GGCAACCCGTGGTCGGCTTACGGCGGTGATTTTGGCGATACGCCGAACGATCGCCAGTTCTGTATGAACGGTCTGGTCTT TGCCGACCGCACGCCGCATCCAGCGCTGACGGAAGCAAAACACCAGCAGCAGTTTTTCCAGTTCCGTTTATCCGGGCAAA CCATCGAAGTGACCAGCGAATACCTGTTCCGTCATAGCGATAACGAGCTCCTGCACTGGATGGTGGCGCTGGATGGTAAG CCGCTGGCAAGCGGTGAAGTGCCTCTGGATGTCGCTCCACAAGGTAAACAGTTGATTGAACTGCCTGAACTACCGCAGCC GGAGAGCGCCGGGCAACTCTGGCTCACAGTACGCGTAGTGCAACCGAACGCGACCGCATGGTCAGAAGCCGGGCACATCA GCGCCTGGCAGCAGTGGCGTCTGGCGGAAAACCTCAGTGTGACGCTCCCCGCCGCGTCCCACGCCATCCCGCATCTGACC ACCAGCGAAATGGATTTTTGCATCGAGCTGGGTAATAAGCGTTGGCAATTTAACCGCCAGTCAGGCTTTCTTTCACAGAT GTGGATTGGCGATAAAAAACAACTGCTGACGCCGCTGCGCGATCAGTTCACCCGTGCACCGCTGGATAACGACATTGGCG TAAGTGAAGCGACCCGCATTGACCCTAACGCCTGGGTCGAACGCTGGAAGGCGGCGGGCCATTACCAGGCCGAAGCAGCG TTGTTGCAGTGCACGGCAGATACACTTGCTGATGCGGTGCTGATTACGACCGCTCACGCGTGGCAGCATCAGGGGAAAAC CTTATTTATCAGCCGGAAAACCTACCGGATTGATGGTAGTGGTCAAATGGCGATTACCGTTGATGTTGAAGTGGCGAGCG ATACACCGCATCCGGCGCGGATTGGCCTGAACTGCCAGCTGGCGCAGGTAGCAGAGCGGGTAAACTGGCTCGGATTAGGG
Grafikus megjelenítés lacZ lacY
Open Reading Frame (ORF) – átlagos méret A B. subtilis genomban, 98% a valószínűsége annak, hogy egy 500 nt hosszú ORF-en gén van
Az adatbázisok segíthetnek a gének azonosításában A szekvencia illesztő algoritmusok átvizsgálják az egész adatbázist, hogy van-e a mi génünkkel homológ. A leggyakrabban használt program a BLAST Basic Local Alignment Search Tool http://www.ncbi.nlm.nih.gov/BLAST/ blastn – nucleotid nucleotidhoz BLAST blastp – fehérje fehérjéhez BLAST blastx – nukleotid szekvencia (6 frame-ben lefordítva) a fehérje adatbázishoz tblastn – fehérje szekvencia a nukleotid (6 frame-ben) adatbázishoz tblastx – nukleotid szekvencia (6 frame-ben) a nukleotid (6 frame-ben) adatbázishoz
A nyers DNS szekvencia analízisére a blastx nagyon hasznos A DNS szekvenciánkat a fehérje adatbázishoz hasonlítja (6 frame-ben) Az illeszkedés (homológia) némi támpontot ad a funkcióra Egy a gond – illeszkedés homológia alapján, ezért kísérletes bizonyíték kell!! Kijelölheti a kísérletes munka irányát!
A nukleotid megoszlás periodicitása a kódoló szekvenciákban Purinban gazdag SD 4076 szekvencia Bacillus subtilis-ból
Eltérések a kodon használatban Organizmusonként változó kedvenc kodon használat Organizmusonként és organizmuson belül is változó. Lehetséges válasz az aminoacil-tRNS ellátottságra A gének transzlációs gyakoriságára is hatással lehet DNAStar program
Az új generációs programok a nem-véletlen ismétlődő motívumok alapján jósolják meg a kódoló szekvenciákat (pl. Glimmer, GeneMark) – egész jók már
Áfedés a gének között gondot jelent Mekkora gondot? Átfedés a gének között ugyanazon a szálon. Gének közötti átfedés az ellentétes szálakon.
COGs – clusters of orthologous sequences, ortológok Metabolizmus Információval kapcsolatos Sejt folyamatok Ismeretlen funkció Nincs COG
Metabolizmus összehasonlítása Pirimidin bioszintézis Minden egyes betű egy-egy mikroorganizmust jelent Nagybetű jelzi az ortológot Kis betű azt, hogy nincs ortológ gp – a Mycoplasma-ból a teljes út hiányzik h – az útvonal eleje hiányzik – prekurzort a gazdától kapja?