Sebestyén Endre Bioperl Őszi Iskola 2008 november 7.

Slides:



Advertisements
Hasonló előadás
Weblapkészítési tudnivalók 2: Útmutató az elnevezésekhez Pék Ágnes © 2009.
Advertisements

Zenetár a webszerverünkön, avagy XML használata PHP 5 alatt. Ercsey Balázs (laze) – netpeople.hu.
BIOTECHNOLÓGIA D MsC gyakorlat
Kiss-Tóth Marcell Flash és PHP? De még mennyire!
UML Példa © Fülöp Lajos.
Felhasználói felületek és üzleti logika Bollobás Dávid ASP.NET
UNIVERSITY OF SZEGED D epartment of Software Engineering UNIVERSITAS SCIENTIARUM SZEGEDIENSIS Adatbázis alapú rendszerek 1. Gyakorlat Követelmények / SQL.
Operációs rendszerek gyakorlat 10. Gyakorlat Vakulya Gergely.
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR TUDOMÁNYOS DIÁKKÖRI KONFERENCIA NOVEMBER 25. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS,
Piacképes programozói tudás a középiskolában
BioGén tábor 2006 DNS szekvencia analízis, internetes adatbázisok a genetika szolgálatában Kósa János Semmelweis Egyetem ÁOK I.sz Belgyógyászati Klinika.
Kabai József AZ SQL-LEDGER SZABAD ÜGYVITELI RENDSZER
Böngészők Internet Explorer Mozilla Firefox
PERL ízelítő Practical Extraction and Report Language Pathologically Eclectic Rubbish Lister.
PERL ízelítő Practical Extraction and Report Language Pathologically Eclectic Rubbish Lister.
Vizuális modellezés Uml és osztálydiagram UML eszközök
Eddig csak kvali volt... Kvantitatív proteomika 1) a frakcionálás szintjén Pl. 2D gélek összehasonlítása vizuálisan, komputer programokkal, differenciál.
Bioinformatika Szekvenciák és biológiai funkciók ill. genotipusok és fenotipusok egymáshoz rendelése Kós Péter 2009.XI.
Az intergénikus régiók és a genom architektúrájának kapcsolata Craig E Nelson, Bradley M Hersh és Sean B Carrol (Genome Biology 2004, 5:R25) Bihari Péter.
Mikrovezérlők alkalmazástechnikája laboratóriumi gyakorlat Kovács Tamás & Mingesz Róbert 3. óra február 20., 23.
Új funkciók az EBSCOhost-ban november 21. Egyetemi Könyvtár Szeged.
Fejlett programozási technikák II.
Strukturális genomika Gyakorlati feladatok. SNP-k és vizsgálatuk Mi az SNP?
Genome2D: bakteriális transzkriptóma megjelenítését szolgáló eszköz (szoftver) Csernetics Árpád Bioinformatika SZIT ápr. 18.
Bioinformatika Dr. Miskei Márton Tudományos munkatárs.
Entity framework Krizsán Zoltán
Scriptnyelvek 9. gyakorlat Papp Gyula április 29.
Számítógépes grafika OpenGL 1. gyakorlat.
Szombathely Dinamikus WEB programozás: PHP és JSP.
A JAVA TECHNOLÓGIA LÉNYEGE Többlépcsős fordítás A JAVA TECHNOLÓGIA LÉNYEGE Platformfüggetlenség.
Google earth és a térinformatika kapcsolata
Operációs rendszerek gyakorlat 8. Gyakorlat Vakulya Gergely.
PHP III. Fájlok, űrlapok.
MOLECULÁRIS GENETIKA/GENOMIKA 2..
Nyílt könyvtári gyűjtemények az Interneten Szabványos metaadatok: átjárhatóság Tapolcai Ágnes MEK Osztály.
Mikrovezérlők, perifériák laboratóriumi gyakorlat 3. óra szeptember 18. Mingesz Róbert v
Transzpozonok, tumormarkerek
Gimp v2.2 Csanádi Norbert The Gimp.
Az ASP.NET programozási modell Ez az előadó neve beosztása vállalata.
Arabidopsis thaliana tip120 inszerciós mutáns jellemzése
Microsoft Visual FoxPro 9.0
Szoftverek. szoftver (software): A számítógép hardver elemeinek mûködtetését végzõ programok, a gép használatához szükséges szellemi termékek összessége.
Fejlesztés PHP-NUKE portál rendszerre Horváth Zoltán Második Magyarországi PHP Konferencia március 27. Copyright PHP Konferencia,
Flash és PHP? De még mennyire! Kiss-Tóth Marcell
1 Hernyák Zoltán Programozási Nyelvek II. Eszterházy Károly Főiskola Számítástudományi tsz.
1 Hernyák Zoltán Web: Magasszintű Programozási Nyelvek I. Eszterházy.
APEX BMF, II. félév.
Web Architecture. Development of Computing Architectures Monolithic mainframe programming Client Server Real Client Server Web Programming.
Az egyedfejlődés második rész.
Visual Basic 2008 Express Edition
Komoróczy Tamás 1 Java programozási nyelv A nyelv alapjai.
Web fejlesztés V. Illés Zoltán ELTE Informatikai Kar
Illés Zoltán ELTE Informatikai Kar
Objektumvezérelt rendszerek tervezése
Könyvtári honlapok megújítása Miért és hogyan? Vida Andrea Egyetemi Könyvtár Szeged.
Topológiák Hálózati eszközök
WEBSTAR CSOPORT WC S ADATBÁZIS VERZIÓKÖVETÉSE: LIQUIBASE Marics Tamás június 20.
A genom variabilitás orvosi jelentősége Gabor T. Marth, D.Sc. Department of Biology, Boston College Orvosi Genomika kurzus – Debrecen, Hungary,
Ortológ promóter adatbázis létrehozása és elemzése Sebestyén Endre MBK, Bioinformatika csoport 2005.
Ismert transzkripciós faktor kötőhelyek annotálása és elemzése ortológ gerinces promótereken Sebestyén Endre és Barta Endre MBK, Bioinformatika csoport.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Összefoglalás M. Kozlovszky MTA SZTAKI
Incremental change © 2013 Betyár Gábor Rendszerfejlesztés II. 3. Óra.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre
Bevezetés az informatikába 11. előadás Internet. Egyetlen nagy egységes elveken működő világhálózat hálózatok összekapcsolása nagy világhálóvá csomagkapcsolt.
Készítette: Fekete Máté LIVL04
1 Függvények használata – az első függvénynél a formulát háromszor be kell írni, rendre az x, x+h, x-h argumentumokkal, – a második függvénynél az új (feltételes.
Webszerkesztés. IP cím pl: Domain cím - DNS pl: ország nevehttp:// számítógép címe World Wide Web Webszerverre.
Az Endnote bibliográfia adatbázis-kezelő szoftver alapvető használata Skultéti Attila
The lactose (lac) operon - an example for prokaryotic gene regulation
Adatbázisok, adattárak, genomprogramok
Előadás másolata:

Sebestyén Endre Bioperl Őszi Iskola 2008 november 7.

 Önálló kódcsomag, amit más perl programok vagy modulok felhasználhatnak  CPAN :  Rengeteg modul szinte minden elképzelhető feladatra  Net::FTP  XML::Parser

  Stabil (1.4.0) és fejlesztői (1.5.2) verzió  Különböző csomagok  Core : alapmodulok, minden más csomag ezt használja  Run : alkalmazások futtatása (ClustaW, EMBOSS, stb)  DB : relációs adatbázis projekt, BioSQL  Network : protein-protein interakciók  GUI : grafikus felület, Perl-TK  Ext : C nyelven, szekvenciaillesztő algoritmusok  Pedigree : genotípus, marker, linkage adatok manipulálása  Microarray : microarray adatok elemzése  Pipeline : munkafolyamatok tervezése

 Bio::Align  Szekvenciaillesztések manipulálása  Bio::Biblio  Irodalmi adatok lekérdezése ▪ Medline ▪ Pubmed  Bio::DB  EMBL, GenBank, RefSeq, SwissProt  Bio::Graphics  Elsősorban szekvenciák ábrázolására használható modul  Bio::Index  FASTA, GenBank fájlok indexelése  BLAST eredmények indexelése

 Bio::Matrix  Általános mátrix modul  Bio::Ontology  GeneOntology adatbázis  Bio::Search és Bio::SearchIO  BLAST, FASTA, Sim4, stb eredmények feldolgozása  Bio::Seq és Bio::SeqIO  Szekvenciák kezelése ▪ Konvertálás, módosítás, létrehozás  Bio::Tools  Különböző programok be/kimenetének feldologzása

  Transzkripciós faktor kötőhelyek kezelésére specializálódott modulok  Objektumok a különböző kötőhelyeknek, keresési eredményeknek  Felület a weben található TFBS adatbázisokhoz  BioPerl kompatibilis

#!/usr/bin/perl use Bio::DB::GenBank; use Getopt::Std; getopts(’l:'); my $list = $opt_l; open LIST, "$list" or die "$0 : can't open file $list : $!\n"; while ( ) { = } close LIST; my $db = new Bio::DB::GenBank; foreach my $acc { my $seqi = $db->get_Stream_by_acc(["$acc"]); my $seqo = Bio::SeqIO->new('-file' => ">>$acc.genbank", '-format' => 'genbank'); foreach my $seq ( $seqi->next_seq ) { $seqo->write_seq($seq); }

 Transzkripciós faktor  DNS kötő domainek  Specifikus szekvencia motívomokat ismer fel  A kötődést a konkrét motívum mellett sok egyéb tényező is befolyásolja  Kötőhelyek  Rövid szekvenciamotívumok (6-12 bp)  Promóterben, esetleg a 3’ és 5’ UTR-ben vagy intronokban  Sokszor nem egyértelműek, pl G és C is lehet egy helyen

 Konszenzus szekvencia  Lötyögős bázisjelölések ▪ ACACTSSNWTT  Ismétlésekkel ▪ ACACTS{1,4}N{1,2}WTT IUPAC-IUB/GCG Code MeaningComplement AAT CCG GGC T/UTA MA or CK RA or GY WA or TS SG or CW YC or TR KG or TM VA or C or GB HA or C or TD DA or G or TH BC or G or TV X/NA or C or G or TN.not A or C or G or T.

 Lötyögős bázisjelölés mellett/helyett esetleg kisbetű CcCGaGGtDcYtagB

 Mátrix  A/C/G/T mennyiség ▪ Egyszerű darabszám ▪ Gyakoriság ▪ Information content A C G T260327

 EPD  Eukaryotic Promoter Database  Release 95  Egyik fele kísérletes eredmények alapján (4800) ▪ Kukorica ▪ Drosophila ▪ Xenopus ▪ Egér ▪ Ember ▪ stb  Tömeges promóterannotáció (13000) ▪ Rizs

 DBTSS  Database of Transcriptional Start Sites  Release 6.0  cDNS 5’ szekvenálások alapján pontos TSS  Alternatív promótereket is tartalamaz  Fajok ▪ Egér ▪ Patkány ▪ Fugu ▪ stb

 DoOP  Database of Orthologous Pomoters ▪ Növényi (Viridiplantae) ▪ Referenciafaj : Arabidopsis thaliana ▪ Gerinces (Chordata) ▪ Referenciafaj : ember ▪ Ortológ promótercsoportok ▪ 500, 1000, 3000 bp 5’ upstream régiók

 PlantProm  Növényi promóterek  PromoSer  Ember, egér, patkány  SCPD  Sacharomyces cerevisiae  DCPD  Drosophila  CEPDB  C. elegans  NAR adatbázis (január) és webszerver (július) különszám

 TRANSFAC  Ingyenes/fizetős verzió  Transzkripciós faktorok, kötőhelyek, irodalmi adatok  Keresőfelület  Folyamatosan frissítik a publikációk alapján  Mátrixokat és konszenzus szekvenciákat is tartalmaz

 JASPAR  Jobb minőségű, nem redundáns adatok  Aránylag kis mennyiségű adat  Ingyenes, több formátumban letölthető adatok

 ORegAnno  Open REGulatory ANNOtation database  cisRED  Cis-regulatory element database ▪ ENSEMBL alapján ▪ Ember, egér, patkány, C. elegans  Place  PlantCARE  Növényi kötőhelyeket tartalmazó adatbázisok  Irodalmi adatok alapján

 Konszenzus szekvencia keresés  Perl reguláris kifejezés ▪ if ($seq =~ /[AT]{1,}CCT[CG]/) { print “megvan\n” }  EMBOSS programcsomag ▪ ▪ Fuzznuc ▪ Parancssoros linux program ▪ [CG](5)TG{A}N(1,5)C

 Mátrixok  TFBS modul  Bio::Matrix modul  MotifScanner ▪ er.html er.html ▪ Parancssoros linux program ▪ Background model használata

 Ortológ gének  Különböző fajban ugyanaz a funkció  Szervspecifikus gének  Szövetspecifikus gének  Fejlődési stádium specifikus gének  Stb  Valamilyen oknál fogva ugyanakkor/ugyanott kell kifejeződniük

 Rövid oligók gyakoriságának vizsgálata  EMBOSS programcsomag ▪ Compseq parancssoros linux program ▪ Oligók (2,3,4,stb) gyakoriságának vizsgálata ▪ Elvárt VS. kapott gyakoriság ▪ Bizonyos oligók alul vagy felülreprezentáltak lehetnek egyes promótercsoportokban ▪ AAA ▪ AAC ▪ AAG ▪ AAT ▪ ACA ▪ ACC

 Phylogenetic footprinting  A funkcionális kötőhelyek valószínűleg konzerválódtak a fajok között  Szekvenciaillesztés ▪ ClustalW : globális illesztés ▪ Dialign : lokális illesztés  Konzervált részek kiválasztása

 globális illesztés  lokális illesztés

 Egyéb programok  MEME ▪ oops, zoops, anr módok ▪ lassú  GLAM ▪ Hézagmentes illesztések  Tompa, M., Li, N., Bailey, T.L., Church, G.M., De Moor, B., Eskin, E., Favorov, A.V., Frith, M.C., Fu, Y., Kent, W.J., et al Assessing computational tools for the discovery of transcription factor binding sites. Nat. Biotechnol. 23: 137–144.

  Keresési módok  Szekvenciaazonosító  Génazonosító  Kulcsszavas leírások  Faj  Promóter szekvencia

 Promótercsoport azonosító  Leírás  Konzervált motívumok száma  Fajcsoportok  Lehetőség van a szekvenciák letöltésére

Szekvenciák Génannotáció Szekvenciaillesztés Keresztreferenciák Konzerválódott régiók

UTR régió Faj, méret Motívumok

 További keresési lehetőség adott motívummal  Hasonló szabályozással / expressziós mintázattal rendelkező gének?  

 Bioperl-hez hasonló API a DoOP adatbázis kezeléséhez  Cluster.pm  Sequence.pm  SequenceFeature.pm  Motif.pm