Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

A Taxonómiai Project Scott Federhen cikke alapján Nagyová Katarína Biológus IV. 2005.04.25.

Hasonló előadás


Az előadások a következő témára: "A Taxonómiai Project Scott Federhen cikke alapján Nagyová Katarína Biológus IV. 2005.04.25."— Előadás másolata:

1 A Taxonómiai Project Scott Federhen cikke alapján Nagyová Katarína Biológus IV. 2005.04.25.

2  NCBI Taxonómiai adatbank- azon élőlények neveinek és csoportjainak halmaza, melyek a GenBank-ban jelen vannak  2003. Áprilisében 176,890 teljes taxon volt képviselve  A Taxonómiai adatbank két fő eszköze az információ megtekintésére: TAXONOMY BROWSER -az osztályozás hierarchikus megjelenítéséről gondoskodik TAXONOMY ENTREZ -egységes indexelő, kereső és visszakereső gépezetet működtet

3 A Taxonómiai Project története :  1988: NCBI létrejön-a nukleotid szekvencia adatbázisok és a protein szekvencia adatbázisok mindegyike saját taxonómiai rendszerezést tartottak fenn  1990: az NCBI és NLM egy folyóirat-scannelő programot kezdeményez azon irodalomban megjelent szekvenciákra, melyeket az adatbázisokba nem nyújtottak be  1991:a Taxonómiai Project megkezdődik az Entrez indításával asszociációban, célja, hogy az összes létező taxonómiát egyetlen rendszerbe foglalja  TaxMan: egy független fa-strukturált adatbázis-kezelő program, az egyesítés eszköze  1995: a rendszer áthelyezése a SyBase relációs adatbázisba (TAXON), melyet eredetileg Tim Clark fejlesztett ki  Taxonomy Browser első megjelenése a web-en  1997: EMBL és DDBJ, 2001: SWISS-PROT elfogadja az NCBI Taxonomy-t

4  A Taxonomy Project csoport filogenetikus rendszerezést képvisel  A törzsfa egymáshoz illeszti az organizmusok közötti evolúciós kapcsolatokat  A rendszerezés bizonyos részei kevésbé fejlettek  A legmegbízhatóbb információ forrás az elsődleges szisztematikus és filogenetikus irodalom : [http://www.ncbi.nlm.nih.gov/Taxonomy/taxonom yhome.html/index.cgi? chapter=resources]  A rendszerezés szekvencia információ ÉS morfológiai elemzések alapján történik.

5 A Taxonómiai adatbank bővítése:  Naponta több,mint 100 új fajjal bővül az adatbank,és ez az arány nő  Az új nevek forrásai: -EMBL, DDBJ, GenBank-ban megjelent új szekvenciák -egy bizonyos software által talált nevek, amikor a protein szekvencia adatbázisokat az Entrez-hez adják -az NCBI szerkezeti csoportja által talált új nevek a PDB protein struktúra adatbázisban  Folyamatos az adatáramlás külső felhasználóktól is  ”hold until published”(HUP)

6 A Taxonomy Browser(TaxBrowser) [http://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html/]  Hierarchikus megjelenítést nyújt  Csak a taxonok egy részhalmazát jeleníti meg  Folyamatosan frissített  A böngésző kétféle Web oldalt használ: 1. hierarchikus oldalak 2. taxon-specifikus oldalak

7

8

9

10 Különböző módokon kereshetünk nevekre a taxonómiai adatbázisban:  Teljes név (Complete name)- alapértelmezésénél fogva a TaxBrowser erre keres, ha egy szakkifejezést a keresőbe gépelnek.  Szabadkártya vagy csillag (Wild card)- ez egy szabályos kifejezés keresés szabadkártyával. Hasznos, ha bizonytalan a felhasználó a helyesírásban, vagy nem egyértelmű rövidített nevet keres.  Szimbólum készlet (Token set)- a keresett szöveget rendezetlen szimbólum készletként kezeli, amelyet a nevekben meg kell találnia. Pl. a ”sapiens” keresés eredménye: Homo sapiens Homo sapiens neanderthalensis  Fonetikai név- ha a felhasználó kimerítette az összes keresési lehetőséget, akkor ez a keresés módosító használható. Pl. a ”drozofila” és ”kaynohrhabdietees” keresések elfogadható eredményeket adnak, míg a ”seenohrabdietees” és ”eshereesheeya” keresések nem adnak találatot.  Taxonómiai azonosító (Taxonomy ID)- numerikus egyedi azonosító (taxid) alapján történő keresést tesz lehetővé.

11 TaxBrowser keresési eredmény a szabadkártya használatát követően: C* elegans

12  A nevek az adatbázisban jelen lehetnek megkettőzve is.  Ha a teljes név keresés több bejegyzést is talál, akkor egy intermedier név-választó ablak jelenik meg  Mindegyik kettőzött név tartalmaz egy toldalékot, amely különbséget tesz a duplikált nevek között

13 A Taxonómiai Adatbázis: TAXON  A Taxonomy Editor nevezetű software tartja fenn az adatbázist  Mindegyik bejegyzés egy ”taxon”(”node”=csomópont)  A hierarchia csúcsán a gyökér csomópont (”root node”) található  A leszármazási vonal (”lineage”) az elérési út a gyökér csomóponttól bármelyik taxonhoz  A ”subtree” a csomópontok gyűjteménye bármelyik részleges taxon alatt  Mindegyik taxonnak egyedi azonosítója (taxid) van, mely sorrendileg van hozzárendelve. Ha egy taxid törlése bekövetkezik, akkor azt újra nem használják fel.

14 TAXON névtípusok:  Minden taxid egyetlen tudományos névvel rendelkezhet, de több más neve is lehet: különféle szinonímák, köznevek, és egyetlen GenBank köznév  ”Scientific Name”- tudományos nevek, melyek megfelelnek a nevezéktani szabályoknak és kapcsolódnak igazoltan közzétett taxon leírásokhoz. Különböző nevezéktani kódok szabályozzák e nevek leírását. Ezek a következők: Zoological Code (International Code of Zoological Nomenclature, ICZN), Botanical Code (International Code of Botanical Nomenclature, ICBN), Bacteriological Code (International Code of Nomenclature of Bacteria, ICNB), Viral Code (International Code of Virus Classification and Nomenclature, ICVCN) Sok taxonnak azonban nincs hivatalos (tudományos) neve, ezen taxonok nemhivatalos nevet kapnak, mint pl. egy jelentőségteljes azonosítót.Ezek lehetnek: törzs név, mintapéldány név, stb.: Anabaena sp. PCC 7108 Calophyllum sp. 'Fay et al. 1997' Scutellospora sp. Rav1/RBv2/RCv3 Ehrlichia-like sp. 'Schotti variant' Gilia sp. Porter and Heil 7991 Camponotus n. sp. BGW-2001

15  ”Synonym”- ez a névtípus tartalmazza a helyesírási változatokat és azon nevek sokaságát, melyek a szekvencia bejegyzések révén kerültek az adatbázisba és később beolvasztották őket a megfelelő taxonba.  ”Acronym” -azaz mozaikszó névtípus elsődlegesen vírus nevek esetén használt, de a változatok listázására is alkalmas, pl. HIV, LAV-1, HIV1, HIV-1 az 1.típusú humán immunodeficiencia vírus mozaikszavai.  ”Anamorph” -ezt a névtípust gombák aszexuális formáira alkalmazzák.  ”Misspelling” -ezt a névtípust helytelenül leírt nevekre alkalmazzák, mivel azok a szakirodalomban jelen vannak. Ezek csak az Entrez kereső mezőben találhatóak meg. Az Entrez display oldalain megjeleníteni kívánt helytelenül leírt neveket a ”Misnomer” névtípusba sorolják.  ”Common Name” -azaz közfőnév névtípust a köznyelvi nevekre alkalmazzák. A hierarchia bármelyik szintjén megtalálhatóak. Pl.”human”, ”reptiles”. Nagyon sok információt hordozhatnak. Pl. ”Oecomys roberti (Robert’s arboreal rice rat)”  ”BLAST Name” -a Taxonómiai adatbankból kiválasztott speciálisan kijelölt köznevek halmaza. Jól ismert nevek készlete az élőlények nagy halmazaira, mint pl. rovarok, emlősök, gombák, eukarióták. Eredetileg a BLAST részére fejlesztették ki.

16 Egyéb TAXON adattípusok:  Rangok -egyetlen rang, amely különösen fontos, az a fajszint. Biztosítani kell, hogy minden szekvencia bejegyzés az adatbázisban hozzá legyen rendelve egy fajszintű, vagy fajszint alatti csomóponthoz.  Genetikai kódok -alkalmasak protein szekvenciák fordítására, és az adatbázis csomópontjaihoz vannak hozzárendelve.  GenBank divíziók -a GenBank taxonómiai divíziók hozzárendelése a Taxonómiai adatbázisban történik.  Referenciák -az adatbázis lehetővé teszi magyarázatok és hivatkozások tárolását bármelyik taxon esetén.  Rövidített leszármazási vonal (Abbreviated lineage) -a Taxonómiai adatbázis lehetővé teszi azon taxonok megjelölését, amelyek a GenBank flatfile-okban a rövidített osztályozási vonalban megjelenhetnek. A teljes vonal az Entrez-ben indexelt és a Taxonomy Browser-ben jelenik meg.

17 Taxonómia az Entrezben  A TAXON adatbázis az Entrez integrált kereső rendszerének egy csomópontja, amely fontos működési alapelvet biztosít más adatbázisok számára.  Az Etrez néhány hatékony képességgel egészíti ki a TAXON-t, mint pl. Boole-féle keresést tesz lehetővé, külső és belső linkek létrehozása, stb.  Az Entrez Taxonomy honlapjának fókuszpontja a kereső sáv, de értékes bejegyzések a Help és TaxBrowser hotlinkek is.  Az alapértelmezett Entrez kereső használható bármely névre, amely megtalálható a Taxonómiai adatbankban.  Csakúgy, mint más Entrez adatbázisokban, a Taxonomy is támogatja a logikai (Boole-) keresést, a ”History” funkciót és a limitált keresést. A Taxonomy mezők böngészhetők a ”Preview/Index”, Taxonomy specifikus címszavak (”lineage”,”rank”) és más, minden Entrez adatbázisban megtalálható címszavak alatt is (”Entrez Date”).  Bármely keresési eredmény hozzá kapcsolódó linkeket tartalmazhat, pl. ”Nucleotide” link, Genome link.

18 Megjelenítés a Taxonomy Entrezben  ”Summary”-ez az alapértelmezett megjelenítés, négy információ jelenik meg: a taxon tudományos neve, közneve, taxonómiai rangja, BLAST név  ”Brief”-csak a tudományos név jelenik meg  ”Tax ID List”-csak a taxid jelenik meg  ”Info”-a taxonokhoz kapcsolt információkat összefoglalva jeleníti meg  ”Common tree”-vázlatos áttekintést ad a kiválasztott taxon készleten belüli rokonsági kapcsolatokról.  ”LinkOut”-a kiválasztott taxon készlet linkout linkjeit listázza  ”Entrez Links”-más Entrez adatbázisokhoz szolgáltat linkeket

19

20

21 A Taxonomy indexelése az Entrezben  Csakúgy, mint más Entrez adatbázisokban, a tartalom indexelése úgy történik, hogy minden adatbázis bejegyzés minden mezőjéhez egy listát hoznak létre  A TAXON mezőtípusai: ÔNévmezők-a nevekre öt index mező van:”All names [name], Scientific name [sname], Common name [cname], Synonym [synonym], Taxid [uid]” ÔHierarchia mezők:” Lineage, Subtree, Next level,Rank” ÔÖröklött mezők:”genetic code [gc], mitochondrial genetic code [mgc],GenBank division [division]” ÔÁltalános Entrez mezők:”word [word], properties [prop]” ÔTaxonómiai mezők más Entrez adatbázisokban: ”Organism [orgn]”, az azonosító számok a txid előtagként indexeltek

22 KÖSZÖNÖM A FIGYELMET!


Letölteni ppt "A Taxonómiai Project Scott Federhen cikke alapján Nagyová Katarína Biológus IV. 2005.04.25."

Hasonló előadás


Google Hirdetések