A Taxonómiai Project Scott Federhen cikke alapján Nagyová Katarína Biológus IV. 2005.04.25.

Slides:



Advertisements
Hasonló előadás
SZTE Klebelsberg Könyvtár
Advertisements

Zoological Record adatbázis bemutatása A Web of Knowledge platformon Tóth Szász Enikő
ADATBÁZISOK.
Orbán Éva SZIE Állatorvos-tudományi Könyvtár Hagyományos és új terápiás eljárások az információhiány kezelésére Tanulságos esetek az Állatorvos-tudományi.
Operációs Rendszerek I.
 A Web, kezdeti időszakában csak a szöveges file-okat kezelte.  Ma teljes körű multimédia szolgáltatásokat nyújt  Filmet,  Zenét,  Képeket nézhet.
Internet ismeretek II..
Felhasználói felületek és üzleti logika Bollobás Dávid ASP.NET
BioGén tábor 2006 DNS szekvencia analízis, internetes adatbázisok a genetika szolgálatában Kósa János Semmelweis Egyetem ÁOK I.sz Belgyógyászati Klinika.
Online Katalógus aleph.nyf.hu.
2010/2011.Huszár István1. dia Weboldalak tervezése II. (X)HTML.
Információ kezelés Az információ visszakeresésének lehetőségei.
Adatbázis-kezelés.
A web és működése A Világháló három szabványra épül:
Bioinformatika Dr. Miskei Márton Tudományos munkatárs.
Adatbázis-kezelés ACCESS program:
Böngésző programok (Böngészés).
Aki keres, az talál? Igen, talál. Ki ezt, ki azt, de egy szót beütve a google keresőbe (pl.) mindig ugyanazt, hacsak nem kerültek fel új honlapok az adott.
1 Informatikai Szakképzési Portál Adatbázis kezelés Alapfogalmak.
Szemantikus keresők.
Ebsco adatbázisok Koltay Klára 2006/ félév.
Vida Andrea SZTE Egyetemi Könyvtár
Az internetes keresőkben a felhasználó az őt érdeklő szavakra, adatokra kereshet rá egy általában egyszerű oldalon, egy beviteli mező és egyéb szűrési.
PHP szkriptek alkalmazása a webes adatbázis kezelésére
A fajok nevezéktanának nyelvezete
Support.ebsco.com Saját EBSCOhost oktatóprogram Oktatóprogram.
Support.ebsco.com Business Source keresés az EBSCOhost felületen Oktatóprogram.
Support.ebsco.com Az EBSCOhost találati lista Oktatóprogram.
Support.ebsco.com Oktatóprogram Egyszerű keresés létrehozása az EBSCOhost felületen.
Support.ebsco.com Oktatóprogram Cikk olvasása az EBSCOhost felületen.
APEX BMF, II. félév.
11. tétel Adatbázis táblái közti kapcsolatok optimalizálása
Keresőrendszerek.
Adatbázis-kezelés.
Mert kell egy rendszer (legalábbis a biológiában)
Az internetes keresési módszerek
Oktatóprogram Saját EBSCOhost oktatóprogram
Integrált Könyvtári Rendszer. Történeti áttekintés  ‘85-ben kezdődött el a fejlesztés  ‘94-ben már a felhasználók rendelkezésére állt  ‘95-től az OSZK-val.
Adatbáziskezelés. Adat és információ Információ –Új ismeret Adat –Az információ formai oldala –Jelsorozat.
Könyvtár- és informatikai alapismeretek kurzus október 1.
SZTE OPAC, adatbázisok A szakirodalmi keresés kezdő lépései Aranyi Zoltán SZTE Klebelsberg Könyvtár
DNS. Az interneten használt osztott név adatbázis, a DNS (Domain Name Service) folyton használatos: –minden web lap letöltésnél, –levél közvetítésnél.
A web site minősítése Források: Bokor Péter szakdolgozata (2002) és a benne megadott hivatkozások: Dotkom Internet Consulting: Üzleti weboldalak elemzése,
Bevezetés az informatikába 11. előadás Internet. Egyetlen nagy egységes elveken működő világhálózat hálózatok összekapcsolása nagy világhálóvá csomagkapcsolt.
Keresés fajtái Matching (szabadszavas)
Adatbázisszintű adatmodellek
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
Az adatbázis az adatok és a köztük lévő összefüggések rendszere, amelyet egymás mellett tárolunk. Nagyon fontos, hogy az adatbázisunk szerkezetét jól megtervezzük,
A Nation Library of Medicine és adatbázisai Vasas Lívia PhD 1 /21.
KERESÉS ELEKTRONIKUS KÖNYVTÁRI KATALÓGUSOKBAN Kiss Annamária Semmelweis Egyetem Központi Könyvtár 2013.
Internet tudományos használata Skultéti Attila 2015.
Internet tudományos használata Skultéti Attila 2015.
Készítette: Kiss András
Hogyan tájékozódjunk a magyar orvosi szakirodalomban?
OVIDIUS Info-Service Co Ltd.
Útmutató az adatbázis használatához
Az Endnote bibliográfia adatbázis-kezelő szoftver alapvető használata október Skultéti Attila
OVIDIUS Info-Service Co Ltd.
OVIDIUS Info-Service Co Ltd.
Tudományos adatok keresése, avagy a Data Citation Index bemutatása
Internet és kommunikáció
DRUPAL Előadja: Nagy Nikoletta :05.
Navigáció az Interneten:
Adatbázis-kezelés 2. Relációs adatbázisok.
GEGES JÓZSEF Ph.D. OVIDIUS Info-Service Co Ltd.
OVIDIUS Info-Service Co Ltd.
Vasas Lívia lvasas.lib.sote.hu Budapest, október
Az internet minőségi információ halmazainak feltárásáról
Bibliográfia adatbázis-kezelő alkalmazások, EndNote 2018 Skultéti Attila
Előadás másolata:

A Taxonómiai Project Scott Federhen cikke alapján Nagyová Katarína Biológus IV

 NCBI Taxonómiai adatbank- azon élőlények neveinek és csoportjainak halmaza, melyek a GenBank-ban jelen vannak  Áprilisében 176,890 teljes taxon volt képviselve  A Taxonómiai adatbank két fő eszköze az információ megtekintésére: TAXONOMY BROWSER -az osztályozás hierarchikus megjelenítéséről gondoskodik TAXONOMY ENTREZ -egységes indexelő, kereső és visszakereső gépezetet működtet

A Taxonómiai Project története :  1988: NCBI létrejön-a nukleotid szekvencia adatbázisok és a protein szekvencia adatbázisok mindegyike saját taxonómiai rendszerezést tartottak fenn  1990: az NCBI és NLM egy folyóirat-scannelő programot kezdeményez azon irodalomban megjelent szekvenciákra, melyeket az adatbázisokba nem nyújtottak be  1991:a Taxonómiai Project megkezdődik az Entrez indításával asszociációban, célja, hogy az összes létező taxonómiát egyetlen rendszerbe foglalja  TaxMan: egy független fa-strukturált adatbázis-kezelő program, az egyesítés eszköze  1995: a rendszer áthelyezése a SyBase relációs adatbázisba (TAXON), melyet eredetileg Tim Clark fejlesztett ki  Taxonomy Browser első megjelenése a web-en  1997: EMBL és DDBJ, 2001: SWISS-PROT elfogadja az NCBI Taxonomy-t

 A Taxonomy Project csoport filogenetikus rendszerezést képvisel  A törzsfa egymáshoz illeszti az organizmusok közötti evolúciós kapcsolatokat  A rendszerezés bizonyos részei kevésbé fejlettek  A legmegbízhatóbb információ forrás az elsődleges szisztematikus és filogenetikus irodalom : [ yhome.html/index.cgi? chapter=resources]  A rendszerezés szekvencia információ ÉS morfológiai elemzések alapján történik.

A Taxonómiai adatbank bővítése:  Naponta több,mint 100 új fajjal bővül az adatbank,és ez az arány nő  Az új nevek forrásai: -EMBL, DDBJ, GenBank-ban megjelent új szekvenciák -egy bizonyos software által talált nevek, amikor a protein szekvencia adatbázisokat az Entrez-hez adják -az NCBI szerkezeti csoportja által talált új nevek a PDB protein struktúra adatbázisban  Folyamatos az adatáramlás külső felhasználóktól is  ”hold until published”(HUP)

A Taxonomy Browser(TaxBrowser) [  Hierarchikus megjelenítést nyújt  Csak a taxonok egy részhalmazát jeleníti meg  Folyamatosan frissített  A böngésző kétféle Web oldalt használ: 1. hierarchikus oldalak 2. taxon-specifikus oldalak

Különböző módokon kereshetünk nevekre a taxonómiai adatbázisban:  Teljes név (Complete name)- alapértelmezésénél fogva a TaxBrowser erre keres, ha egy szakkifejezést a keresőbe gépelnek.  Szabadkártya vagy csillag (Wild card)- ez egy szabályos kifejezés keresés szabadkártyával. Hasznos, ha bizonytalan a felhasználó a helyesírásban, vagy nem egyértelmű rövidített nevet keres.  Szimbólum készlet (Token set)- a keresett szöveget rendezetlen szimbólum készletként kezeli, amelyet a nevekben meg kell találnia. Pl. a ”sapiens” keresés eredménye: Homo sapiens Homo sapiens neanderthalensis  Fonetikai név- ha a felhasználó kimerítette az összes keresési lehetőséget, akkor ez a keresés módosító használható. Pl. a ”drozofila” és ”kaynohrhabdietees” keresések elfogadható eredményeket adnak, míg a ”seenohrabdietees” és ”eshereesheeya” keresések nem adnak találatot.  Taxonómiai azonosító (Taxonomy ID)- numerikus egyedi azonosító (taxid) alapján történő keresést tesz lehetővé.

TaxBrowser keresési eredmény a szabadkártya használatát követően: C* elegans

 A nevek az adatbázisban jelen lehetnek megkettőzve is.  Ha a teljes név keresés több bejegyzést is talál, akkor egy intermedier név-választó ablak jelenik meg  Mindegyik kettőzött név tartalmaz egy toldalékot, amely különbséget tesz a duplikált nevek között

A Taxonómiai Adatbázis: TAXON  A Taxonomy Editor nevezetű software tartja fenn az adatbázist  Mindegyik bejegyzés egy ”taxon”(”node”=csomópont)  A hierarchia csúcsán a gyökér csomópont (”root node”) található  A leszármazási vonal (”lineage”) az elérési út a gyökér csomóponttól bármelyik taxonhoz  A ”subtree” a csomópontok gyűjteménye bármelyik részleges taxon alatt  Mindegyik taxonnak egyedi azonosítója (taxid) van, mely sorrendileg van hozzárendelve. Ha egy taxid törlése bekövetkezik, akkor azt újra nem használják fel.

TAXON névtípusok:  Minden taxid egyetlen tudományos névvel rendelkezhet, de több más neve is lehet: különféle szinonímák, köznevek, és egyetlen GenBank köznév  ”Scientific Name”- tudományos nevek, melyek megfelelnek a nevezéktani szabályoknak és kapcsolódnak igazoltan közzétett taxon leírásokhoz. Különböző nevezéktani kódok szabályozzák e nevek leírását. Ezek a következők: Zoological Code (International Code of Zoological Nomenclature, ICZN), Botanical Code (International Code of Botanical Nomenclature, ICBN), Bacteriological Code (International Code of Nomenclature of Bacteria, ICNB), Viral Code (International Code of Virus Classification and Nomenclature, ICVCN) Sok taxonnak azonban nincs hivatalos (tudományos) neve, ezen taxonok nemhivatalos nevet kapnak, mint pl. egy jelentőségteljes azonosítót.Ezek lehetnek: törzs név, mintapéldány név, stb.: Anabaena sp. PCC 7108 Calophyllum sp. 'Fay et al. 1997' Scutellospora sp. Rav1/RBv2/RCv3 Ehrlichia-like sp. 'Schotti variant' Gilia sp. Porter and Heil 7991 Camponotus n. sp. BGW-2001

 ”Synonym”- ez a névtípus tartalmazza a helyesírási változatokat és azon nevek sokaságát, melyek a szekvencia bejegyzések révén kerültek az adatbázisba és később beolvasztották őket a megfelelő taxonba.  ”Acronym” -azaz mozaikszó névtípus elsődlegesen vírus nevek esetén használt, de a változatok listázására is alkalmas, pl. HIV, LAV-1, HIV1, HIV-1 az 1.típusú humán immunodeficiencia vírus mozaikszavai.  ”Anamorph” -ezt a névtípust gombák aszexuális formáira alkalmazzák.  ”Misspelling” -ezt a névtípust helytelenül leírt nevekre alkalmazzák, mivel azok a szakirodalomban jelen vannak. Ezek csak az Entrez kereső mezőben találhatóak meg. Az Entrez display oldalain megjeleníteni kívánt helytelenül leírt neveket a ”Misnomer” névtípusba sorolják.  ”Common Name” -azaz közfőnév névtípust a köznyelvi nevekre alkalmazzák. A hierarchia bármelyik szintjén megtalálhatóak. Pl.”human”, ”reptiles”. Nagyon sok információt hordozhatnak. Pl. ”Oecomys roberti (Robert’s arboreal rice rat)”  ”BLAST Name” -a Taxonómiai adatbankból kiválasztott speciálisan kijelölt köznevek halmaza. Jól ismert nevek készlete az élőlények nagy halmazaira, mint pl. rovarok, emlősök, gombák, eukarióták. Eredetileg a BLAST részére fejlesztették ki.

Egyéb TAXON adattípusok:  Rangok -egyetlen rang, amely különösen fontos, az a fajszint. Biztosítani kell, hogy minden szekvencia bejegyzés az adatbázisban hozzá legyen rendelve egy fajszintű, vagy fajszint alatti csomóponthoz.  Genetikai kódok -alkalmasak protein szekvenciák fordítására, és az adatbázis csomópontjaihoz vannak hozzárendelve.  GenBank divíziók -a GenBank taxonómiai divíziók hozzárendelése a Taxonómiai adatbázisban történik.  Referenciák -az adatbázis lehetővé teszi magyarázatok és hivatkozások tárolását bármelyik taxon esetén.  Rövidített leszármazási vonal (Abbreviated lineage) -a Taxonómiai adatbázis lehetővé teszi azon taxonok megjelölését, amelyek a GenBank flatfile-okban a rövidített osztályozási vonalban megjelenhetnek. A teljes vonal az Entrez-ben indexelt és a Taxonomy Browser-ben jelenik meg.

Taxonómia az Entrezben  A TAXON adatbázis az Entrez integrált kereső rendszerének egy csomópontja, amely fontos működési alapelvet biztosít más adatbázisok számára.  Az Etrez néhány hatékony képességgel egészíti ki a TAXON-t, mint pl. Boole-féle keresést tesz lehetővé, külső és belső linkek létrehozása, stb.  Az Entrez Taxonomy honlapjának fókuszpontja a kereső sáv, de értékes bejegyzések a Help és TaxBrowser hotlinkek is.  Az alapértelmezett Entrez kereső használható bármely névre, amely megtalálható a Taxonómiai adatbankban.  Csakúgy, mint más Entrez adatbázisokban, a Taxonomy is támogatja a logikai (Boole-) keresést, a ”History” funkciót és a limitált keresést. A Taxonomy mezők böngészhetők a ”Preview/Index”, Taxonomy specifikus címszavak (”lineage”,”rank”) és más, minden Entrez adatbázisban megtalálható címszavak alatt is (”Entrez Date”).  Bármely keresési eredmény hozzá kapcsolódó linkeket tartalmazhat, pl. ”Nucleotide” link, Genome link.

Megjelenítés a Taxonomy Entrezben  ”Summary”-ez az alapértelmezett megjelenítés, négy információ jelenik meg: a taxon tudományos neve, közneve, taxonómiai rangja, BLAST név  ”Brief”-csak a tudományos név jelenik meg  ”Tax ID List”-csak a taxid jelenik meg  ”Info”-a taxonokhoz kapcsolt információkat összefoglalva jeleníti meg  ”Common tree”-vázlatos áttekintést ad a kiválasztott taxon készleten belüli rokonsági kapcsolatokról.  ”LinkOut”-a kiválasztott taxon készlet linkout linkjeit listázza  ”Entrez Links”-más Entrez adatbázisokhoz szolgáltat linkeket

A Taxonomy indexelése az Entrezben  Csakúgy, mint más Entrez adatbázisokban, a tartalom indexelése úgy történik, hogy minden adatbázis bejegyzés minden mezőjéhez egy listát hoznak létre  A TAXON mezőtípusai: ÔNévmezők-a nevekre öt index mező van:”All names [name], Scientific name [sname], Common name [cname], Synonym [synonym], Taxid [uid]” ÔHierarchia mezők:” Lineage, Subtree, Next level,Rank” ÔÖröklött mezők:”genetic code [gc], mitochondrial genetic code [mgc],GenBank division [division]” ÔÁltalános Entrez mezők:”word [word], properties [prop]” ÔTaxonómiai mezők más Entrez adatbázisokban: ”Organism [orgn]”, az azonosító számok a txid előtagként indexeltek

KÖSZÖNÖM A FIGYELMET!