Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Tévedések vígjátéka.  Genomi DNS részleges emésztése MboI (Sau3AI)-gyel (kompatibilis véget ad a BamHI-véggel)  A 30 – 45 kb régió méret szerinti elválasztása.

Hasonló előadás


Az előadások a következő témára: "Tévedések vígjátéka.  Genomi DNS részleges emésztése MboI (Sau3AI)-gyel (kompatibilis véget ad a BamHI-véggel)  A 30 – 45 kb régió méret szerinti elválasztása."— Előadás másolata:

1 Tévedések vígjátéka

2  Genomi DNS részleges emésztése MboI (Sau3AI)-gyel (kompatibilis véget ad a BamHI-véggel)  A 30 – 45 kb régió méret szerinti elválasztása BamHI- XbaI emésztés Amp r ori cos ligálás 30 – 45 kb-os fragmentek cos in vitro pakolás GigaPack fehérje extraktummal szelekció ampicillin rezisztens klónokra kozmid könyvtár KOZMID KÖNYVTÁR

3 Mesterséges kromoszómák: BAC (bacterial artificial chromosome) vektorok

4 Mesterséges kromoszómák: YAC (yeast artificial chromosome) vektorok

5 összekapcsolás: kozmidkönyvtár (BAC, YAC) klónok végeinek szekvenciái két küldönböző kontigra esnek Szekvenálási lyukak Nincs kapcsolat Scaffold 2 Scaffold 1 Kontig 4Kontig 5Kontig 1Kontig 2 Kontig 3 Scaffold: láncszerűen lineáris sorrendbe elhelyezett nem összeérő kontigok sora. A scaffold fogalma

6 Kontigok összerakása

7 KOMBINATORIKUS PCR

8 PRIMER SÉTA TEMPLÁT GENERÁLÓ RENDSZER Kozmid,BAC,YAC könyvtárakban Az integrációhelyét ellenőrizni kell Nagy kapacitású automata Southern hibiridizáció

9 RestrikciósfingerprintRepetívDNSfingerprint KlónozottDNS fragmentumok STS: sequence tagged site egyedi bp fragment EST: expressed sequence tag

10 De ha sikerül, és van szekvenciánk Mi van rajta,van-e gén? Honnan tudjuk, hogy Valamit találtunk, találtunk-e gént? CTCGAGACGCTGTTTCTGGGGTCATTCATTCTTGGCGGGCTGCAACTGCTGGTGTGACCGACGCGACCTGGCAGGCCGCGGTGCGCAACTGGCCGGGCGGACTAATGGTGGAGCAAAAGA TCGGCATGTCCAGCGCACCTGAAGCTTGGGTGGTTGCTGCAATAGCAGCCTTCCTTATTGGCATGGCGAAGGGCGGTTTGGCCAATGTGGGGGTTATCGCCGTTCCCTTGATGTCCCTGG TCAAGCCGCCGCTTACCGCTGCCGGATTGCTGCTCCCGATCTATGTCGTTTCTGATGCATTCGGCGTCTGGCTTTATCGGCACCGGTATTCTGCCTCCAATCTGCGCATCCTGATTCCTT CGGGATTTTTTGGGGTCCTGATTGGCTGGTTATTGGCCGGGCAGATCTCCGACGCGATTGCCAGTGTCATTGTTGGTTTCACCGGCTGCGGCTTCGTGGCTGTGCTGCTGGCACGACGAG GGGTGCCATCGGTGCCGCGTCAAGCCAACGTGCCCAAAGGATGGTTTCTGGGGGTGGCCACCGGCTTTACCAGCTTTTTGACTCATTCCGGTGCGGCGACCTTCCAGATGTTCGTGCTGC CGCAACGGCTGGACAAGACCATGTTCGCGGGCACATCAACGCTTACCTTTGCTGCCATAAACCTATTCAAGATTCCGTCCTACTGGGCATTGGGACAGCTTTCGACTTCCTCGGTCATGT CCGCGCTAGTGTTGATTCCGGTGGCCGTGGCCGGGACGTTCGCAGGTGTTTTTGCGACGCGCAGGCTATCGACATCCTGGTTCTTCATTCTGGTCCAGGCGATGTTGCTGGTGGTCTCCA TTCAGCTTCTGTGGAGGGGAATGTCGGATATCCTGAACTAGCTGGAGATCGCAATGTCAGAACGCTCAATCAATCAGAATGTAATCTTGACATAGAATACCGTTCCGATTTATTGCTTCG AGTGAAGCTGCCCGTCCGCTGAGATGTCATGACATTTTCCCCGCTTGATTCCGCCCTGCTTGGACCGTTGTTCGCGACCGATGAAATGCGCACGGTCTTCTCCGAACGGCGTTTTTTGGC GGGAATGCTTCGTGTTGAAGTGGCCCTGGCGCGCGCGCAGGCGGCAGAGGGCCTTGTCAGTTCGGAATTGGCCGACGCGATCGAGGTTGTTGGTACTGCCGGGTTGGACCCCGAGGCGAT GGCGGCGACTACTCGCATGACAGGAGTGCCCGCAATATCGTTCGTCCGTGCGGTGCAATCGGCCCTGCCGCCCTCACTGGCGGGTGGATTTCATTTCGGCGCCACCAGTCAAGACATCGT GGATACGGCCCACGCGCTCCAGCTGGCCGAGGCACTCGATATTATAGAAGTCGATTTACACGCCACTGTCAGCGCAATGATGAATCTGGCCGCTGCTCACTGCAATACACCCTGTATCGG GCGCACGGCCTTGCAGCACGCAGCGCCAGTTACGTTCGGCTACAAGGCGTCCGGCTGGTGCGTTGCCCTGGCGGAGCATCTGGTGCAGCTTCCCGCGCTGCGAAAGCGGGTTCTGGTGGC GTCGCTAGGGGGGCCGGTTGGTACCCTTGCCGCGATGGAGGAGCGGGCCGACGCTGTACTGGAGGGTTTCGCTGCGGACCTGGGGTTGGCCATTCCCGCCCTGGCCTGGCACACGCAGCG GGCCCGGATCGTCGAGGTGGCCAGTTGGCTGGCCATATTGCTGGGAATTCTGGCAAAAATGGCCACCGATGTCGTTCACTTGTCCTCCACGGAAGTGCGCGAGCTTTCCGAACCTGTAGC GCCGGGCAGGGGGGGCTCCTCGGCGATGCCTCACAAGCGGAACCCGATTTCCTCGATTACCATCCTGTCCCAGCATGCTGCGGCAGGGGCCCAGCTCTCCATTCTCGTGAACGGCATGGC CAGTCTGCACGAACGTCCGGTGGGGGCGTGGCATTCGGAATGGTTGGCTCTGCCGACGCTGTTCGGCCTTGCCGGCGGTGCCGTGCGCGAGGGCAGGTTTCTGGCCGAGGGGCTGCTGGT CGATGCCGACCAGATGGGTCGCAATCTACAATTGACCAATGGCCTGATTTTCAGCGACGCGGTAGCCGGCCAGTTGGCAAAGCACTTGGGTCGGGCCGAGGCTTATGCCGCTGTCGAGGA TGCCGCCGCCGAGGTGTTGCGTTCAGGCGGCAGCTTTCAGGGTCAGCTGAACCAGCGCCTGCCCGATCACCGCGACGCTATCGCTATTGCTTTTGATACGACGCCGGCGATCCAGGCCGG GGCCGCCCGCTGCCGTAGTGCGCTGGATCATGTGGCTCGTATTCTTGGACCCGCCTCTACCATCGGATTTCAAGGAGGCTAATGACGTGACGACACTGTTTGAGGCGACGACCATCCCGA TTTGCGAGGGCCCGCGCGACCAGACCGCCGAGATCCTTTTCGAGATGCCGCCGGGTGCGTGGGATACCCATTTTCATGTTTTTGGCCCAGTTTCATCGTTTCCATACGCAGAACACAGGC TCTATTCCCCACCGGAGTCGCCACTTGAGGATTATCTGGTGTTGATGGAGGCTTTGGGGATCGAGCGCGGCGTTTGTGTCCATCCGAATGTTCATGGTGCCGACAATTCGGTGACGCTCG ACGCAGTTGCGCGGTCCGATGGTCGTCTGCTGGCGGTGATCAAGCCACATCACGAGATGACTTTTGTTCAGCTGCGGGACATGAAGGCGCAGGGGGTCTGCGGGGTACGTTTTGCCTTCA ATCCGCAGCATGGCTCGGGCGAGTTGGATACTCGTTTGTTCGAGCGTATGTTGGACTGGTGCCGCGACCTAGGCTGGTGCGTAAAATTGCATTTCGCGCCCGCTGCGCTGGACGGTCTGG CTGAACGTTTGGCGCGCGTCGATATTCCGATCATCATCGATCATTTCGGGCGGGTGGACACCGCGCAAGGTGTGGATCAGCCGCACTTCCTGCGTTTGCTCGATCTGGCCAAACTGGACC ATGTCTGGATCAAGCTTACGGGGGCAGATCGTATTAGCGGTTCCGGCGCGCCATATGACGATGTCGTGCCCTTCGCGCACGCTTTGGCAGATGTGGCGCCCGACCGCCTCCTCTGGGGTT CGGATTGGCCGCATTCAGGCTATTTCGATCCGAAGCACATACCCAATGACGGCGACTTGTTGAACCTTTTGGCGCGTTTTGCCCCCGATGCTGAACTGCGTCGTAAGATCCTTGTGGACA ACCCGCAGCGCCTGTTCGGGGCTGCTTGAGGAGCCGAGCCGATGCAACCTTTCGTCTACGAAACAGCCCCAGCGCGCGTCGTTTTCGGGCGCGGCACTTCGCAGAATCTGCGGCGGGAAC TTGAGGCCCTGAATTTTGGCAGGGCGCTGGTTCTTTCCACGCCCGACCAAAAAGAACAATCGCTGCGAATTGCCCAGGGCCTGGGTTCTCAGCTGGCGGGGTCGTTCCACGCCGCTGCCA TGCATACGCCTGTCGAGGTCACCTTGCAGGCGCTTGAGGTGCTGAAGGATGTGCAGGCCGATTGCATCGTGGCGATTGGCGGCGGCTCAACCATTGGGTTGGGCAAGGCACTGGCCCTGC GCACCGATCTGCCGCAGATCGTCGTCCCGACGACTTATGCCGGCTCGGAAATGACGCCGATCCTGGGAGAGACGGAAAACGGGCTGAAGACCACACAGCGTAATCCCAAAGTGCAGCCGA GGGTGGTTCTCTACGATGTGGACCTGACTGTGACGCTTCCGGTGCAGGCCTCGGTTACATCAGGCATGAATGCGATCGCCCATGCGGCCGAGGCATTATATGCGCGGGACGGCAATCCGG TGATCTCGCTGATGGCCGAAGAGGCGATCCGCGCGCTGGCCCATGCCCTGCCGCGTATCGTTGCCACTCCCGACGATATCGAAGCGCGCAGCGATGCCCTCTATGGCGCGTGGCTGTGCG GAACGTGCCTGGGTTCGGCCGGAATGGCGTTGCACCATAAGCTCTGCCACACCCTCGGCGGAAGTTTCGATTTGCCACATGCCCCGACCCACACGGTCATCCTCCCCTATGCGCTCGCCT ATAATAGTGATGCGGCCAGGCCCGCAATGGCAGCCATCGCGCGCGCGCTGGGCATGGCGGATGCAGCGATGGGCATGAGAGCGTTGTCCATGCGGTTGGGCGCCCCGACATCGCTGCGTG AGTTGGGCATGGCAGAAGCCGATCTTGACCGCGCCGCCGACCTGGCCACGCAAAATGCCTATTGGAACCCGCGACCCATCGAGCATGGGCCGATTCGTAACCTTCTGGGACGGGCCTGGG CTGGAACTCCGGTCTGAAGGACCTAGAGGACAGTCAATTCATTGATCTGAAGTCACCAACGAGGAGATATGGGATGAACGAGAACATTGCGATCCGCAAATTGGGCCGCCGACTCCGATT GGGCATTGCCGGTGGCGCGGGTCATTCGCTGATTGGTCCGGTTCACCGGGAGGCGGCTCGGCTTGACGATTTGTTCTCTCTCGATGCTGCGGTGCTGTCCAGTAACGCGGAACGCGGGGA TGCTGAGGCCGCGGCTCTCGGAATTCCGCGCTCCTATTCGTCCACCGCCGAGATGTTCGCAATGGAGAAGGCTAGGCCCGACGGTATTGAGGCCGTTGCCATAGCCACGCCGAATGACAG CCATTACCGGATTCTGTGCGAGGCGCTGGACGCCGGGTTGCATGTAATCTGCGACAAGCCTTTAACCTCCACGAAGGCCGAGGCCGACGACGTGCTGGTGCGGGCGAAGGCCGCGGGCAA GGTTGTGGTCCTGACCCACAATTATTCTGGCTACGCCATGGTACGCCAAGCCCGCGCCATGGTCGCCGCCGGTGAACTTGGGAAAATCCACCAGATTCACGGGGTCTACGCTCTGGGCCA GATGGGCCGTTTGTTCGAGGCCGACGAAGGGGGCGTGCCTCCGGGGATGCGTTGGCGGATTGATCCTGCGCGCGGTGGCGACAGTCACGCCCTGGTGGATATCGGCACCCATGTGCACCA TCTGGCTACCTTCATCACGCAGTTACAGGTCGTTGAGGTAATGGCCGATCTTGGGCCGGCGGTTCAAGGCCGCGCGGCCCATGACAGTGCCAACGTCATGTTCCGTATGGAAAACGGAGC TTTCGGATCGTTCTGGGCCACCAAGGCGGCATCGGGGGCCAGCAAGCTGGCGATCGAAGTCTACGGTGACAAGGGCGGCGTCCTGTGGGAGCAGGCCGACGCCAATAACTTGCTACATAT GCGGCAGGGCCAACCCCCAGCCCTGATTGGTCGACAAGTTGCCGGGCTGCATCCTGCGGCAATCCGCGCGATGCGGGGGCCGGGTTATCATTTCGTGGAAGGCTATCGCGAGGCCTTTGC GAATATGTACGTGGATTTCGCCGAACAGATCTTGGCCATGATGGGCAAGGGGGCCGCAGATCACCTGGCATTGGAAGCGCCGTCGGTCGTGGACGGCCTGCGCTCCATGGCGTTCATCGA AGCCTGTGTGGCGTCGTCGCAGGACCGCCAATGGCGGCAGGTGGAGCAAGTCAGTTGATCTCTCAGCGGCTTCGGCATTTTTCCCGGGCTGGCGGCTCCCCGCAGCTCCCTCCGGTGGAA AGAACGGGTAATCAAAATAATATTCTGATTTTAAAGGATGTTCCAGACAGCTGATTATTCCTGAAATTTAGGGCTCTTTCGGCTGTAGCAATTGACTAAAAGCCGAATTTAAGGGTAA TTAAACAAACGCTGTTCGTATTATTTAAACAGGTGAGTGATGGCGATATTCCTGGAAGGCTGGCCGATGGTTTCATCTGAATACCCGGCCAGAAGCGTTGAGGCGCACCCGGCCTATCTG AC GCCAGACTATGTTTTCACGCGAAAGCGTGCGCCGACTCGACCGCTGCGGTTAATTCCTCAGTCTGCGACGGAGCTGTATGGCCCGGTTTATGGACAAGAGAGCGTCCGTCCGGGGGATAA CGACCTGACCCGTCAGCACGAAGCTGAGCCGGTGGGGGAGCGGATTCTGGTGACGGGGCGCGTGACCGACGAAGACGGGCGGGGTGTCCCTAATACGCTGCTAGAGATCTGGCAGGCCAA TGCCGCCGGTCGCTATATCCACAAGCTTGACCAGCATCTTGCCCCGCTTGATCCAAATTTCTCGGGGGCAGGGCGTACGGTTACGGGGGCTGATGGCTCTTATTCCTTCATCACGATCGT GCCGGGCGCCTATCCGGTCGTGGGGCTGCACAATGTCTGGCGCCCGCGCCACATCCATGTGTCGTTGTTCGGTCCGTCCTTCGTGACCCGCTTGGTTACCCAGATATATTTCGAGGGCGA TCCGCTGCTGAAATATGACACGATCTACAACACGGCGCCCGACATCTCGAAGCGCAGCATGGTGGCGCAGTTGGACATGGGCGCCACGCAATCCGAATGGGGCCTGACCTATCGCTTCGA CATCGTTCTGCGTGGGCGCAACGGCAGCTATTTCGAGGAACCCCATGACCACTAAGACCCCACTGACCATCACCCCCTCGCAGACTGTCGGGCCTTTCTATGCCTATTGCCTGACCCCGG AGGACTACGGGACGCTTCCACCGCTGTTCGGCGCGCAGCTTGCGACCGAGGACGCCGAAGGGGAACGGATTACGATCCAGGGAACGATCACGGACGGAGAGGGGGCCATGGTTCCCGATG CCTTGATCGAGATCTGGCAGCCGGACGGGCAGGGGCGTTTTGCTGGAGCCCATCCAGAGCTGCGGAATTCGGCCTTCAAGGGCTTCGGGCGCCGCCACTGTGACAAAAGCGGAAACTTCA GTTTCCAAACCGTGAAGCCTGGCCGGGTGCCCACTGCCGACGGCGTGATGCAGGCACCCCATATCGCTTTGTCGATCTTCGGCAAGGGATTGAACCGCCGGCTCTATACGCGGATCTACT TCGCAGACGAGGCATCGAATGCCGAGGACCCCGTTCTGTCGATGCTGTCCGAGGATGAGCGCGTGACCCTGATCGCCACCTCTGAATCGCCCGCCGCATATCGCCTCGACATCCGCCTGC AAGGCGACGGCGAAACGGTGTTTTTCGAGGCCTGAGTCGGCCGGCAAGTTTGCGGGGATCCGTCCGCCGCAATTGTGTTTCGCTATAGACGCCACGGCTGCCGCATGCCGCCGGGTGGAA GGGCCTTGCAAGGCCTGTCAACGGCGGAGTAAAATCCGGCCAGGCGGCGGAGTAAAACCAGGCCACTTGTGGCCCACGCATGAGACACCCGGGAGGGCGTAGCCCAAGCGGGGGTCTCAT GCGTGTGCGGCGGTTTTCTGGGGGTTCAGCCAGCCTTGCGGGCGCGGCTTTGAGCGAGACGATAGCTGTCGCCGTTCATCTCGAG

11 Hasonlóság CTCGAGACGCTGTTTCTGGGGTCATTCATTCTTGGCGGG CTGCAACTGCTGGTGTGACCGACGCGACCTGGCAGGCCGC GGTGCGCAACTGGCCGGGCGGACTAATGGTGGAGCAAAA GATCGGCATGTCCAGCGCACCTGAAGCTTGGGTGGTTGC TGCAATAGCAGCCTTCCTTATTGGCATGGCGAAGGGCGG TTTGGCCAATGTGGGGGTTATCGCCGTTCCCTTGATGTC CCTGGTCAAGCCGCCGCTTACCGCTGCCGGATTGCTGCTC CCGATCTATGTCGTTTCTGATGCATTCGGCGTCTGGCTT TATCGGCACCGGTATTCTGCCTCCAATCTGCGCATCCTG ATTCCTTCGGGATTTTTTGGGGTCCTGATTGGCTGGTTA TTGGCCGGGCAGATCTCCGACGCGATTGCCAGTGTCATT GTTGGTTTCACCGGCTGCGGCTTCGTGGCTGTGCTGCTG GCACGACGAGGGGTGCCATCGGTGCCGCGTCAAGCCAAC GTGCCCAAAGGATGGTTTCTGGGGGTGGCCACCGGCTTT ACCAGCTTTTTGACTCATTCCGGTGCGGCGACCTTCCAG ATGTTCGTGCTGCCGCAACGGCTGGACAAGACCATGTTC GCGGGCACATCAACGCTTACCTTTGCTGCCATAAACCTA TTCAAGATTCCGTCCTACTGGGCATTGGGACAGCTTTCG ACTTCCTCGGTCATGTCCGCGCTAGTGTTGATTCCGGTG GCCGTGGCCGGGACGTTCGCAGGTGTTTTTGCGACGCGC AGGCTATCGACATCCTGGTTCTTCATTCTGGTCCAGGCG ATGTTGCTGGTGGTCTCCATTCAGCTTCTGTGGAGGGGA ATGTCGGATATCCTGAACTAGCTGGAGATCGCAATGTC AGAACGCTCAATCAATCAGAATGTAATCTTGACATAGA ATACCGTTCCGATTTATTGCTTCGAGTGAAGCTGCCCGT CCGCTGAGATGTCATGACATTTTCCCCGCTTGATTCCGCC CTGCTTGGACCGTTGTTCGCGACCGATGAAATGCGCACG GTCTTCTCCGAACGGCGTTTTTTGGC a két szekvencia teljesen ugyanaz

12 Hasonlóság CTCGAGACGCTGTTTCTGGGGTCATTCATTCTTGGCGGG CTGCAACTGCTGGTGTGACCGACGCGACCTGGCAGGCCGC GGTGCGCAACTGGCCGGGCGGACTAATGGTGGAGCAAAA GATCGGCATGTCCAGCGCACCTGAAGCTTGGGTGGTTGC TGCAATAGCAGCCTTCCTTATTGGCATGGCGAAGGGCGG TTTGGCCAATGTGGGGGTTATCGCCGTTCCCTTGATGTC CCTGGTCAAGCCGCCGCTTACCGCTGCCGGATTGCTGCTC CCGATCTATGTCGTTTCTGATGCATTCGGCGTCTGGCTT TATCGGCACCGGTATTCTGCCTCCAATCTGCGCATCCTG ATTCCTTCGGGATTTTTTGGGGTCCTGATTGGCTGGTTA TTGGCCGGGCAGATCTCCGACGCGATTGCCAGTGTCATT GTTGGTTTCACCGGCTGCGGCTTCGTGGCTGTGCTGCTG GCACGACGAGGGGTGCCATCGGTGCCGCGTCAAGCCAAC GTGCCCAAAGGATGGTTTCTGGGGGTGGCCACCGGCTTT ACCAGCTTTTTGACTCATTCCGGTGCGGCGACCTTCCAG ATGTTCGTGCTGCCGCAACGGCTGGACAAGACCATGTTC GCGGGCACATCAACGCTTACCTTTGCTGCCATAAACCTA TTCAAGATTCCGTCCTACTGGGCATTGGGACAGCTTTCG ACTTCCTCGGTCATGTCCGCGCTAGTGTTGATTCCGGTG GCCGTGGCCGGGACGTTCGCAGGTGTTTTTGCGACGCGC AGGCTATCGACATCCTGGTTCTTCATTCTGGTCCAGGCG ATGTTGCTGGTGGTCTCCATTCAGCTTCTGTGGAGGGGA ATGTCGGATATCCTGAACTAGCTGGAGATCGCAATGTC AGAACGCTCAATCAATCAGAATGTAATCTTGACATAGA ATACCGTTCCGATTTATTGCTTCGAGTGAAGCTGCCCGT CCGCTGAGATGTCATGACATTTTCCCCGCTTGATTCCGCC CTGCTTGGACCGTTGTTCGCGACCGATGAAATGCGCACG GTCTTCTCCGAACGGCGTTTTTTGGC AAACTCGAGACGCTGTTTCTGGGGTCATTCATTCTTGGC GGGCTGCAACTGCTGGTGTGACCGACGCGACCTGGCAGG CCGCGGTGCGCAACTGGCCGGGCGGACTAATGGTGGAGC AAAAGATCGGCATGTCCAGCGCACCTGAAGCTTGGGTGG TTGCTGCAATAGCAGCCTTCCTTATTGGCATGGCGAAGG GCGGTTTGGCCAATGTGGGGGTTATCGCCGTTCCCTTGA TGTCCCTGGTCAAGCCGCCGCTTACCGCTGCCGGATTGCT GCTCCCGATCTATGTCGTTTCTGATGCATTCGGCGTCTG GCTTTATCGGCACCGGTATTCTGCCTCCAATCTGCGCATC CTGATTCCTTCGGGATTTTTTGGGGTCCTGATTGGCTGG TTATTGGCCGGGCAGATCTCCGACGCGATTGCCAGTGTC ATTGTTGGTTTCACCGGCTGCGGCTTCGTGGCTGTGCTG CTGGCACGACGAGGGGTGCCATCGGTGCCGCGTCAAGCC AACGTGCCCAAAGGATGGTTTCTGGGGGTGGCCACCGGC TTTACCAGCTTTTTGACTCATTCCGGTGCGGCGACCTTC CAGATGTTCGTGCTGCCGCAACGGCTGGACAAGACCATG TTCGCGGGCACATCAACGCTTACCTTTGCTGCCATAAAC CTATTCAAGATTCCGTCCTACTGGGCATTGGGACAGCTT TCGACTTCCTCGGTCATGTCCGCGCTAGTGTTGATTCCG GTGGCCGTGGCCGGGACGTTCGCAGGTGTTTTTGCGACG CGCAGGCTATCGACATCCTGGTTCTTCATTCTGGTCCAG GCGATGTTGCTGGTGGTCTCCATTCAGCTTCTGTGGAGG GGAATGTCGGATATCCTGAACTAGCTGGAGATCGCAAT GTCAGAACGCTCAATCAATCAGAATGTAATCTTGACAT AGAATACCGTTCCGATTTATTGCTTCGAGTGAAGCTGCC CGTCCGCTGAGATGTCATGACATTTTCCCCGCTTGATTC CGCCCTGCTTGGACCGTTGTTCGCGACCGATGAAATGCG CACGGTCTTCTCCGAACGGCGTTTTTTGGC GLOBÁLIS, LOKÁLIS Most is - majdnem BLASTN, FASTA

13 ANALÓGIÁK - ADATBANKOK Összahasonlítás már ismert elemekkel

14 Hol kezdődik? Mi a start? … és kódol-e fehérjét? Open reading frames: nyitott leolvasási keretek Áltában ATG-vel kezdődik, de opció Hossz: ajánlás 100 aminosav, de opció Az eredmény hipotetikus, össze kell vetni a valósággal példa1 Hipotetikus fehérje lista  hasonlóság  BLASTP Információból információ generálása Problémák: frameshift mutáció, a globál hasonlóság csődje fehérje szinten Hol kezdődik? Mi a start?

15 Hol kezdődik? Ki tudja? Egyéb elemek azonosítása, genomi elrendeződés Kísérletes ellenőrzés

16 … és kódol-e fehérjét? Open reading frames: nyitott leolvasási keretek Áltában ATG-vel kezdődik, de opció Hossz: ajánlás 100 aminosav, de opció Az eredmény hipotetikus, össze kell vetni a valósággal Hipotetikus fehérje lista  hasonlóság  BLASTP Információból információ generálása Hol kezdődik? Mi a start? Problémák: frameshift mutáció, a globál hasonlóság csődje fehérje szinten

17 FRAME SHIFT MUTÁCIÓ - MEGOLDÁS Minden leolvasásái keretben transzláció Stop kodon nem számít Mindent mindennel összehasonlít fehérje szinten

18 Genomi kontextus gén orf1 pcaB orf2 macA orf3 pcaH pcaG istB funkcó hipotetikus konzervált membrán protein, permeáz? 3-karboxi-cisz-cisz mukonát cikloizomeráz feltételezett hidroláz maleil acetát reduktáz feltételezett oxidáz, dehidrogenáz NAD kötő domain protokatekol-3,4 dioxigenáz béta alegység protokatekol-3,4 dioxigenáz alfa alegység hossz (aa) 259 ~ IS21 transzpozáz, C-terminális homológia (%) , 67, < 60 64, 61, orf1 pcaB orf2 macA orf3 pcaH pcaG istB pSC1/48 (7404bp) MS azonosítás

19 Kodon felhasználás, codon usage Az élőlényekre jellemző a kodon felhasználási gyakoriság Kodon felhasználási táblázatok, adatbankok

20 Kodon felhasználás, codon usage

21 Kodon felhasználás, eltérések

22 ANALÓGIÁK - ADATBANKOK Összahasonlítás már ismert elemekkel

23 GenBank 1979-ben alapítva, LANL (Los Alamos) óta az NCBI gondozza (Bethesda). Web szerver:

24 EMBL 1980-ban alapítva European Molecular Biology Laboratory Heidelberg óta az Európai Bioiformatikai Intézet tartja fenn, EBI- Cambridge. Web szerver:

25 DDBJ Started, 1984 at the National Institute of Genetics (NIG) in Mishima. Still maintained in this institute a team led by Takashi Gojobori. Web server:

26 Mi az adatbázis ? –struktúrált –lehet benne keresni (indexelt) -> tartalom –rendszeresen frissített, naprakész -> új kiadás –komplex hálózatban (hyperlinks) -> linkek Kapcsolódó eszközök (szoftver) hozzáférés, frissítés, törlés, hozzáadás, interaktív kapcsolat adatgyűjtemény

27 Adatbázis típusok Elsődleges adatbázisok –A kísérletezők eredeti elküldött anyagai –A tartalmáért a küldő a felelős példák: GenBank, SNP, GEO Származtatott (másodlagos) adatbázisok –Az elsődleges adatokból készül –Tartalmáért egy harmadik partner a felelős (pl. NCBI) Examples: Refseq, TPA, RefSNP, UniGene, NCBI Protein, Structure, Conserved Domain

28 Elsődlges adatbázisok Nukleinsav EMBL GenBank DDBJ Fehérje Swiss Prot TREMBL, GenPept, G yakran más adatbázisokkal integráltan

29 Integrált szekvencia és bibliografikai adatbázisok Entrez Nukleinsav, fehérje szekvenciákat kapcsol össze irodalmi adatokkal (MEDLINE) és más gyűjteményekkel Gyors, hatékony és felhasználóbarát Amerikai SRS (sequence retrieval system) Univerzális kereső motor szekvencia és más adatbázisokhoz Európai, de világméretű Keresés Boolean operátorokkal: AND, OR, NOT Elválasztott karaktersorokkal

30 EBI GenBank DDBJ EMBL EMBL Entrez SRS getentry NIG CIB NCBI NIH Submissions Updates Submissions Updates Submissions Updates Nemzetközi kooperáció az adatbankok között

31 The National Institutes of Health Bethesda, MD

32 The National Center for Biotechnology Information The Lister Hill Center (NLM) Building 38A The National Library of Medicine Building 38

33 The National Center for Biotechnology Information Az NLM részeként alapították 1988-ban –Nyilvános adatbázisok felállítása U.S. National DNA Sequence Database –Kutatások: biológia számítógéppel –Szoftverek fejlesztése szekvencia analízishez –Disseminate biomedical information

34 NCBI indulólap

35 Genomes Taxonomy Entrez: Integrált adatbázis kezelő PubMed abstracts Nucleotide sequences Protein sequences 3-D Structure Word weight VAST BLAST Phylogeny

36 Az örökké bővülő Entrez - ma Entrez PopSet Structure PubMed Books 3D Domains Taxonomy GEO/GDS UniGene Nucleotide Protein Genome OMIM CDD/CDART Journals SNP UniSTS PubMed Central

37 Entrez: élettudományi internet kereső

38 Entrez Nucleotides

39 Entrez Protein

40 GenBank: Az NCBI elsődleges szekvencia adatbázisa 139. közzététel2003 december 30,968,418 szekvencia 36,553,368,485 Nukleotid >140,000élőlény 138 Gigabyte 570 file kéthavonta teljes közzététel kumulatíve növekedő napi frissítés csak az interneten érhető el letölthető ftp://ftp.ncbi.nih.gov/genbank/

41 Szekvenciák száma (millió) Össz bázispár (milliárd) '82'84'85'86'87'88'90'91'92'93'95'96'97'98'00'01'02' Szekvenciák száma 139 közzététel: 31.0 millió szekvencia 36.6 milliárd nukleotid Átlagos duplázódás ≈ 12 hónap “osztódás” Össz nukleotid szám A GenBank adatainak növekedése időben

42 A GenBank szerveződése: GenBank Divíziók A szekvenciákat 17 alcsoportba (divíziókba) sorolják. 1 szabadalom 5 “High Throughput” 11 Tradicionális Bulk Divisions: Batch Submission ( and FTP) nem pontos gyengén jellemzett ESTExpressed Sequence Tag GSSGenome Survey Sequence HTGHigh Throughput Genomic STSSequence Tagged Site HTCHigh Throughput cDNA

43 A GenBank szerveződése: GenBank Divíziók A szekvenciákat 17 alcsoportba (divíziókba) sorolják. 1 szabadalom 5 “High Throughput” 11 Tradicionális Tradicionális divíziók közvetlen betáplálás (Sequin and BankIt) pontos jól jellemzett PRI Primate PLN Plant and Fungal BCT Bacterial and Archeal INV Invertebrate RODRodent VRL Viral VRT Other Vertebrate MAM Mammalian (ex. ROD and PRI) PHG Phage SYN Synthetic (cloning vectors) UNA Unannotated

44 LOCUS AF bp mRNA linear INV 23-OCT-2002 DEFINITION Limulus polyphemus myosin III mRNA, complete cds. ACCESSION AF VERSION AF GI: KEYWORDS. SOURCE Limulus polyphemus (Atlantic horseshoe crab) ORGANISM Limulus polyphemus Eukaryota; Metazoa; Arthropoda; Chelicerata; Merostomata; Xiphosura; Limulidae; Limulus. REFERENCE 1 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE A myosin III from Limulus eyes is a clock-regulated phosphoprotein JOURNAL J. Neurosci. 18 (12), (1998) MEDLINE PUBMED REFERENCE 2 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE Direct Submission JOURNAL Submitted (29-APR-1998) Whitney Laboratory, University of Florida, 9505 Ocean Shore Blvd., St. Augustine, FL 32086, USA REFERENCE 3 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE Direct Submission JOURNAL Submitted (02-MAR-2000) Whitney Laboratory, University of Florida, 9505 Ocean Shore Blvd., St. Augustine, FL 32086, USA REMARK Sequence update by submitter COMMENT On Mar 2, 2000 this sequence version replaced gi: A Traditional GenBank Record

45 LOCUS AF bp mRNA linear INV 23-OCT-2002 DEFINITION Limulus polyphemus myosin III mRNA, complete cds. ACCESSION AF VERSION AF GI: KEYWORDS. SOURCE Limulus polyphemus (Atlantic horseshoe crab) ORGANISM Limulus polyphemus Eukaryota; Metazoa; Arthropoda; Chelicerata; Merostomata; Xiphosura; Limulidae; Limulus. REFERENCE 1 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE A myosin III from Limulus eyes is a clock-regulated phosphoprotein JOURNAL J. Neurosci. 18 (12), (1998) MEDLINE PUBMED REFERENCE 2 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE Direct Submission JOURNAL Submitted (29-APR-1998) Whitney Laboratory, University of Florida, 9505 Ocean Shore Blvd., St. Augustine, FL 32086, USA REFERENCE 3 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE Direct Submission JOURNAL Submitted (02-MAR-2000) Whitney Laboratory, University of Florida, 9505 Ocean Shore Blvd., St. Augustine, FL 32086, USA REMARK Sequence update by submitter COMMENT On Mar 2, 2000 this sequence version replaced gi: GenBank: Locus LOCUS AF bp mRNA linear INV 23-OCT-2002 Molekula típus Divízió Módosítás Dátum Lókusz név Hossz

46 LOCUS AF bp mRNA linear INV 23-OCT-2002 DEFINITION Limulus polyphemus myosin III mRNA, complete cds. ACCESSION AF VERSION AF GI: KEYWORDS. SOURCE Limulus polyphemus (Atlantic horseshoe crab) ORGANISM Limulus polyphemus Eukaryota; Metazoa; Arthropoda; Chelicerata; Merostomata; Xiphosura; Limulidae; Limulus. REFERENCE 1 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE A myosin III from Limulus eyes is a clock-regulated phosphoprotein JOURNAL J. Neurosci. 18 (12), (1998) MEDLINE PUBMED REFERENCE 2 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE Direct Submission JOURNAL Submitted (29-APR-1998) Whitney Laboratory, University of Florida, 9505 Ocean Shore Blvd., St. Augustine, FL 32086, USA REFERENCE 3 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE Direct Submission JOURNAL Submitted (02-MAR-2000) Whitney Laboratory, University of Florida, 9505 Ocean Shore Blvd., St. Augustine, FL 32086, USA REMARK Sequence update by submitter COMMENT On Mar 2, 2000 this sequence version replaced gi: GenBank azonosítók ACCESSION AF VERSION AF GI:

47 LOCUS AF bp mRNA linear INV 23-OCT-2002 DEFINITION Limulus polyphemus myosin III mRNA, complete cds. ACCESSION AF VERSION AF GI: KEYWORDS. SOURCE Limulus polyphemus (Atlantic horseshoe crab) ORGANISM Limulus polyphemus Eukaryota; Metazoa; Arthropoda; Chelicerata; Merostomata; Xiphosura; Limulidae; Limulus. REFERENCE 1 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE A myosin III from Limulus eyes is a clock-regulated phosphoprotein JOURNAL J. Neurosci. 18 (12), (1998) MEDLINE PUBMED REFERENCE 2 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE Direct Submission JOURNAL Submitted (29-APR-1998) Whitney Laboratory, University of Florida, 9505 Ocean Shore Blvd., St. Augustine, FL 32086, USA REFERENCE 3 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE Direct Submission JOURNAL Submitted (02-MAR-2000) Whitney Laboratory, University of Florida, 9505 Ocean Shore Blvd., St. Augustine, FL 32086, USA REMARK Sequence update by submitter COMMENT On Mar 2, 2000 this sequence version replaced gi: GenBank Organizmus adatok SOURCE Limulus polyphemus (Atlantic horseshoe crab) ORGANISM Limulus polyphemus Eukaryota; Metazoa; Arthropoda; Chelicerata; Merostomata; Xiphosura; Limulidae; Limulus. NCBI’s Taxonómia

48 FEATURES Location/Qualifiers source /organism="Limulus polyphemus" /db_xref="taxon:6850" /tissue_type="lateral eye" CDS /note="N-terminal protein kinase domain; C-terminal myosin heavy chain head; substrate for PKA" /codon_start=1 /product="myosin III" /protein_id="AAC " /db_xref="GI: " /translation="MEYKCISEHLPFETLPDPGDRFEVQELVGTGTYATVYSAIDKQA NKKVALKIIGHIAENLLDIETEYRIYKAVNGIQFFPEFRGAFFKRGERESDNEVWLGI EFLEEGTAADLLATHRRFGIHLKEDLIALIIKEVVRAVQYLHENSIIHRDIRAANIMF SKEGYVKLIDFGLSASVKNTNGKAQSSVGSPYWMAPEVISCDCLQEPYNYTCDVWSIG ITAIELADTVPSLSDIHALRAMFRINRNPPPSVKRETRWSETLKDFISECLVKNPEYR PCIQEIPQHPFLAQVEGKEDQLRSELVDILKKNPGEKLRNKPYNVTFKNGHLKTISGQ BASE COUNT 1201 a 689 c 782 g 1136 t ORIGIN 1 tcgacatctg tggtcgcttt ttttagtaat aaaaaattgt attatgacgt cctatctgtt 3781 aagatacagt aactagggaa aaaaaaaa // GenBank Tulajdonság tábla /protein_id="AAC "/db_xref="GI: " GenPept IDs

49 GenPept: FASTA formátumban >gi| |gb|AAC | myosin III [Limulus polyphemus] MEYKCISEHLPFETLPDPGDRFEVQELVGTGTYATVYSAIDKQANKKVALKIIGHIAENLLDIETEYRIY KAVNGIQFFPEFRGAFFKRGERESDNEVWLGIEFLEEGTAADLLATHRRFGIHLKEDLIALIIKEVVRAV QYLHENSIIHRDIRAANIMFSKEGYVKLIDFGLSASVKNTNGKAQSSVGSPYWMAPEVISCDCLQEPYNY TCDVWSIGITAIELADTVPSLSDIHALRAMFRINRNPPPSVKRETRWSETLKDFISECLVKNPEYRPCIQ EIPQHPFLAQVEGKEDQLRSELVDILKKNPGEKLRNKPYNVTFKNGHLKTISGQPHEKIYVDDLAFLDSP TEEVVLENLEQRYRKGEIYTFAGDVLLTLNPGKVLPLYGDQTAVKYCERGRSDNPPHVFAVADRAYQQML HHKSPQAVILSGVSGSGKSFCTHQVIRHLAFLGAQNKEGMREKLEYLCPLLDTLGNAYTSTNPNSSHFVK ILEVTFTKTGKITGAILFTFLLEARRLTDIPKGERNFHVFYYFYEGLRSEGRLKEFGLEEKNYRYLPELK SSNSPEYVKGYQQFLRALTSLAFTEEEIFAIQKVLAAILLLGETEIQNSAAFKLLGAESSELENTLTQDV NARDVYARAMYLRLFSWIVAVVNRQLSFSRLVFGDVYSVTVIDSPGFENGLHNSLHQLCANVISDNLQNY IQQIIFFKELEEYGEEGVNVPFNLEGGVDHRTLVNKLMDSGQGLLTAISKATQYQRKGESGWMESLQEAD SEELVEFSNVNGKPIVSVKHIFRKVSYDATDLVKKNVEDKTRALTSTMQRSCDPRIRAIFSSENPSPFLS SPRRSSIQENMLLPERTVTDSLHSALSSVLNLASTEDPPHLILCMRPQKKELINDYDSKSVQIQLHALNV LETILIRQFGFARRISFVDFLNRYQYLAFDFNENVELTKENCRLLLLRLKMDGWTLGKNKVFLKYYSEEY LSRIYETHIKKIVKVQAIARKYFVKVRQSKTKPH >gi| |gb|AAA | metC peptide [Escherichia coli MADKKLDTQLVNAGRSKKYSLGAVNSVIQRASSLVFDSVEAKKHATRNRANGELFYGRRGTLTHFSLQQA MCELEGGAGCVLFPCGAAAVANSILAFIEQGDPRVPSSNS

50 Bulk Divíziók Expressed Sequence Tag –1 st pass single read cDNA Genome Survey Sequence –1 st pass single read gDNA High Throughput Genomic –incomplete sequences of genomic clones Sequence Tagged Site –PCR-based mapping reagents szakaszos Submission ( ésvagy ftp) Nem akkurátus Gyengén jellemzett, kevés info

51 EST Divízió: Expressed Sequence Tags RNS géntermék nucleus 30,000 gén ,000 egyedi cDNA klón - egyedi klónok -Két végről szekvenálás cDNA könyvtár 5’ 3’ >IMAGE: ', mRNA sequence NNTCAAGTTTTATGATTTATTTAACTTGTGGAACAAAAATAAACCAGATTAACCACAACCATGCCTTA TTATCAAATGTATAAGANGTAAATATGAATCTTATATGACAAAATGTTTCATTCATTATAACAAATTT AATAATCCTGTCAATNATATTTCTAAATTTTCCCCCAAATTCTAAGCAGAGTATGTAAATTGGAAGTT CTTATGCACGCTTAACTATCTTAACAAGCTTTGAGTGCAAGAGATTGANGAGTTCAAATCTGACCAAG GTTGATGTTGGATAAGAGAATTCTCTGCTCCCCACCTCTANGTTGCCAGCCCTC >IMAGE: ' mRNA sequence GACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCTACTCTCTCTTTCTGG TGGAGGTATCCAGCGTACTCCAAAGATTCAGGTTTACTCACGTCATCCAGCAGAGAATGGAAAGTCAA TTCCTGAATTGCTATGTGTCTGGGTTTCATCCATCCGACATTGAAGTTGACTTACTGAAGAATGGAGA GAATTGAAAAAGTGGAGCATTCAGACTTGTCTTTCAGCAAGGACTGGTCTTTCTATCTCTTGTACTAC TGAATTCACCCCCACTGAAAAAGATGAGTATGCCTGCCGTGTTGAACCATGTNGACTTTGTCACAGNC AAGTTNAGTTTAAGTGGGNATCGAGACATGTAAGGCAGGCATCATGGGAGGTTTTGAAGNATGCCGCN TTGGATTGGGATGAATTCCAAATTTCTGGTTTGCTTGNTTTTTTAATATTGGATATGCTTTTG

52 Genom szekvenálások: GSS, HTG, WGS nyers szekvencia ( HTG divízió ) aprítás BAC inszert (vagy genom) Klónozás, izolálás összerakás szekvenálás GSS divízió vagy “trace archive” egész genomos shotgun kontigok (tradicionális divízió)

53 Trace Archive Elsődleges szekvencia olvasatok WGS and EST projektrekből Nem biztos, hogy a GenBank-ban megvan A legkorábbi hozzáférés genom adatokhoz

54 Shotgun Genom Projektek (WGS) Tradícionális GenBank Divíziók 118 projekt – 1 Virus –78 Bacterium – 5 Archaea –35 Eukarióta: Rat, Mouse, Dog, Chimpanzee, Human Honeybee, Anopheles, Fruit Flies (2) Nematode (C. briggsae) Yeasts (8), Aspergillus (2) Rice

55 NCBI Származtatott adatbázisok ATTGACTA TTGACA CGTGA ATTGACTA TATAGCCG ACGTGC TTGACA CGTGA ATTGACTA TATAGCCG GenBank TATAGCCG AT GA C ATT GA ATT C C GA ATT C C GA ATT C GA ATT C GA ATT C C GA ATT C C UniGene RefSeq Genome Assembly Labs Curators Algorithms TATAGCCG AGCTCCGATA CCGATGACAA

56 RefSeq: NCBI Derivative Sequence Database Curated transcripts and proteins –reviewed –human, mouse, rat, fruit fly, zebrafish, arabidopsis Model transcripts and proteins Assembled Genomic Regions (contigs) –human genome –mouse genome Chromosome records –Human genome –microbial –organelle

57 RefSeq előnyei Nem redundáns expliciten kapcsolt nukleotid és fehérje szekvenciák Frissítve hogy tükrözze a kurrens szekvencia adatokat Adatok validálása Konzisztens formátum Elkülönített hozzáférési kód NCBI gyámság

58 Globál Entrez keresés

59 Szekvenciák adatbankokba küldése NCBI, Genbank Rövid kontigok: BankITBankIT Hosszú szekvenciák: SequinSequin


Letölteni ppt "Tévedések vígjátéka.  Genomi DNS részleges emésztése MboI (Sau3AI)-gyel (kompatibilis véget ad a BamHI-véggel)  A 30 – 45 kb régió méret szerinti elválasztása."

Hasonló előadás


Google Hirdetések