Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaKlára Fábiánné Megváltozta több, mint 10 éve
1
Sebestyén Endre Bioperl Őszi Iskola 2008 november 7.
2
Önálló kódcsomag, amit más perl programok vagy modulok felhasználhatnak CPAN : http://www.cpan.orghttp://www.cpan.org Rengeteg modul szinte minden elképzelhető feladatra Net::FTP XML::Parser
3
http://bioperl.org http://bioperl.org Stabil (1.4.0) és fejlesztői (1.5.2) verzió Különböző csomagok Core : alapmodulok, minden más csomag ezt használja Run : alkalmazások futtatása (ClustaW, EMBOSS, stb) DB : relációs adatbázis projekt, BioSQL Network : protein-protein interakciók GUI : grafikus felület, Perl-TK Ext : C nyelven, szekvenciaillesztő algoritmusok Pedigree : genotípus, marker, linkage adatok manipulálása Microarray : microarray adatok elemzése Pipeline : munkafolyamatok tervezése
4
Bio::Align Szekvenciaillesztések manipulálása Bio::Biblio Irodalmi adatok lekérdezése ▪ Medline ▪ Pubmed Bio::DB EMBL, GenBank, RefSeq, SwissProt Bio::Graphics Elsősorban szekvenciák ábrázolására használható modul Bio::Index FASTA, GenBank fájlok indexelése BLAST eredmények indexelése
5
Bio::Matrix Általános mátrix modul Bio::Ontology GeneOntology adatbázis Bio::Search és Bio::SearchIO BLAST, FASTA, Sim4, stb eredmények feldolgozása Bio::Seq és Bio::SeqIO Szekvenciák kezelése ▪ Konvertálás, módosítás, létrehozás Bio::Tools Különböző programok be/kimenetének feldologzása
6
http://tfbs.genereg.net/ http://tfbs.genereg.net/ Transzkripciós faktor kötőhelyek kezelésére specializálódott modulok Objektumok a különböző kötőhelyeknek, keresési eredményeknek Felület a weben található TFBS adatbázisokhoz BioPerl kompatibilis
7
#!/usr/bin/perl use Bio::DB::GenBank; use Getopt::Std; getopts(’l:'); my $list = $opt_l; open LIST, "$list" or die "$0 : can't open file $list : $!\n"; while ( ) { chomp; @line = split; push @accs, @line; } close LIST; my $db = new Bio::DB::GenBank; foreach my $acc (@accs) { my $seqi = $db->get_Stream_by_acc(["$acc"]); my $seqo = Bio::SeqIO->new('-file' => ">>$acc.genbank", '-format' => 'genbank'); foreach my $seq ( $seqi->next_seq ) { $seqo->write_seq($seq); }
8
Transzkripciós faktor DNS kötő domainek Specifikus szekvencia motívomokat ismer fel A kötődést a konkrét motívum mellett sok egyéb tényező is befolyásolja Kötőhelyek Rövid szekvenciamotívumok (6-12 bp) Promóterben, esetleg a 3’ és 5’ UTR-ben vagy intronokban Sokszor nem egyértelműek, pl G és C is lehet egy helyen
9
Konszenzus szekvencia Lötyögős bázisjelölések ▪ ACACTSSNWTT Ismétlésekkel ▪ ACACTS{1,4}N{1,2}WTT IUPAC-IUB/GCG Code MeaningComplement AAT CCG GGC T/UTA MA or CK RA or GY WA or TS SG or CW YC or TR KG or TM VA or C or GB HA or C or TD DA or G or TH BC or G or TV X/NA or C or G or TN.not A or C or G or T.
10
Lötyögős bázisjelölés mellett/helyett esetleg kisbetű CcCGaGGtDcYtagB
11
Mátrix A/C/G/T mennyiség ▪ Egyszerű darabszám ▪ Gyakoriság ▪ Information content A3000020 C025102 G013103 T260327
12
EPD http://www.epd.isb-sib.ch/http://www.epd.isb-sib.ch/ Eukaryotic Promoter Database Release 95 Egyik fele kísérletes eredmények alapján (4800) ▪ Kukorica ▪ Drosophila ▪ Xenopus ▪ Egér ▪ Ember ▪ stb Tömeges promóterannotáció (13000) ▪ Rizs
13
DBTSS http://dbtss.hgc.jp/http://dbtss.hgc.jp/ Database of Transcriptional Start Sites Release 6.0 cDNS 5’ szekvenálások alapján pontos TSS Alternatív promótereket is tartalamaz Fajok ▪ Egér ▪ Patkány ▪ Fugu ▪ stb
14
DoOP http://doop.abc.huhttp://doop.abc.hu Database of Orthologous Pomoters ▪ Növényi (Viridiplantae) ▪ Referenciafaj : Arabidopsis thaliana ▪ Gerinces (Chordata) ▪ Referenciafaj : ember ▪ Ortológ promótercsoportok ▪ 500, 1000, 3000 bp 5’ upstream régiók
15
PlantProm http://mendel.cs.rhul.ac.uk/mendel.php?topic=plantpromhttp://mendel.cs.rhul.ac.uk/mendel.php?topic=plantprom Növényi promóterek PromoSer http://biowulf.bu.edu/zlab/PromoSer/http://biowulf.bu.edu/zlab/PromoSer/ Ember, egér, patkány SCPD http://rulai.cshl.edu/SCPD/http://rulai.cshl.edu/SCPD/ Sacharomyces cerevisiae DCPD http://www-biology.ucsd.edu/labs/Kadonaga/DCPD.htmlhttp://www-biology.ucsd.edu/labs/Kadonaga/DCPD.html Drosophila CEPDB http://rulai.cshl.edu/cgi-bin/CEPDB/home.cgihttp://rulai.cshl.edu/cgi-bin/CEPDB/home.cgi C. elegans NAR adatbázis (január) és webszerver (július) különszám
16
TRANSFAC http://www.gene-regulation.com/http://www.gene-regulation.com/ Ingyenes/fizetős verzió Transzkripciós faktorok, kötőhelyek, irodalmi adatok Keresőfelület Folyamatosan frissítik a publikációk alapján Mátrixokat és konszenzus szekvenciákat is tartalmaz
17
JASPAR http://jaspar.genereg.net/http://jaspar.genereg.net/ Jobb minőségű, nem redundáns adatok Aránylag kis mennyiségű adat Ingyenes, több formátumban letölthető adatok
18
ORegAnno http://www.oreganno.org/http://www.oreganno.org/ Open REGulatory ANNOtation database cisRED http://www.cisred.org/http://www.cisred.org/ Cis-regulatory element database ▪ ENSEMBL alapján ▪ Ember, egér, patkány, C. elegans Place http://www.dna.affrc.go.jp/PLACE/http://www.dna.affrc.go.jp/PLACE/ PlantCARE http://bioinformatics.psb.ugent.be/webtools/plantcare/html/http://bioinformatics.psb.ugent.be/webtools/plantcare/html/ Növényi kötőhelyeket tartalmazó adatbázisok Irodalmi adatok alapján
19
Konszenzus szekvencia keresés Perl reguláris kifejezés ▪ if ($seq =~ /[AT]{1,}CCT[CG]/) { print “megvan\n” } EMBOSS programcsomag ▪ http://emboss.sourceforge.net/ http://emboss.sourceforge.net/ ▪ Fuzznuc ▪ Parancssoros linux program ▪ [CG](5)TG{A}N(1,5)C
20
Mátrixok TFBS modul Bio::Matrix modul MotifScanner ▪ http://homes.esat.kuleuven.be/~thijs/Work/MotifScann er.html http://homes.esat.kuleuven.be/~thijs/Work/MotifScann er.html ▪ Parancssoros linux program ▪ Background model használata
21
Ortológ gének Különböző fajban ugyanaz a funkció Szervspecifikus gének Szövetspecifikus gének Fejlődési stádium specifikus gének Stb Valamilyen oknál fogva ugyanakkor/ugyanott kell kifejeződniük
22
Rövid oligók gyakoriságának vizsgálata EMBOSS programcsomag ▪ Compseq parancssoros linux program ▪ Oligók (2,3,4,stb) gyakoriságának vizsgálata ▪ Elvárt VS. kapott gyakoriság ▪ Bizonyos oligók alul vagy felülreprezentáltak lehetnek egyes promótercsoportokban ▪ AAA 7 0.0406977 0.0329457 1.2352955 ▪ AAC 3 0.0174419 0.0096899 1.8000042 ▪ AAG 11 0.0639535 0.0348837 1.8333344 ▪ AAT 3 0.0174419 0.0077519 2.2500110 ▪ ACA 1 0.0058140 0.0096899 0.6000014 ▪ ACC 4 0.0232558 0.0116279 2.0000012
23
Phylogenetic footprinting A funkcionális kötőhelyek valószínűleg konzerválódtak a fajok között Szekvenciaillesztés ▪ ClustalW : globális illesztés ▪ Dialign : lokális illesztés Konzervált részek kiválasztása
24
globális illesztés lokális illesztés
25
Egyéb programok MEME http://meme.sdsc.edu/http://meme.sdsc.edu/ ▪ oops, zoops, anr módok ▪ lassú GLAM http://zlab.bu.edu/glamhttp://zlab.bu.edu/glam ▪ Hézagmentes illesztések Tompa, M., Li, N., Bailey, T.L., Church, G.M., De Moor, B., Eskin, E., Favorov, A.V., Frith, M.C., Fu, Y., Kent, W.J., et al. 2005. Assessing computational tools for the discovery of transcription factor binding sites. Nat. Biotechnol. 23: 137–144.
26
http://doop.abc.hu http://doop.abc.hu Keresési módok Szekvenciaazonosító Génazonosító Kulcsszavas leírások Faj Promóter szekvencia
27
Promótercsoport azonosító Leírás Konzervált motívumok száma Fajcsoportok Lehetőség van a szekvenciák letöltésére
28
Szekvenciák Génannotáció Szekvenciaillesztés Keresztreferenciák Konzerválódott régiók
29
UTR régió Faj, méret Motívumok
30
További keresési lehetőség adott motívummal Hasonló szabályozással / expressziós mintázattal rendelkező gének? http://doops.abc.hu http://doops.abc.hu http://doopsearch.abc.hu http://doopsearch.abc.hu
31
Bioperl-hez hasonló API a DoOP adatbázis kezeléséhez Cluster.pm Sequence.pm SequenceFeature.pm Motif.pm
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.