Bibliográfiai adatbázisok Jehoda Imola MA, MSc Semmelweis Egyetem Egészségügyi Főiskolai Kar Könyvtár 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. Adatbázisok helye az információs rendszerek működési folyamatában Az információs rendszerek alapvető funkciói: - az információ gyűjtése : az információ tartalmának és a gyűjtendő információforrások körének meghatározása - a gyűjtött információ feldolgozása -- formai feldolgozás : számbavétel és azonosítás -- tartalmi feldolgozás : a gyűjtött információ tartalmának tárgyszavakkal történő jellemzése, index, thesaurus - a gyűjtött és feldolgozott információ tárolása adatbázisokban: ADATBÁZIS= az információk logikai kapcsolataikkal együtt tárolt (visszakeresésre alkalmas) halmaza a gyűjtött, feldolgozott és tárolt információ szolgáltatása, azaz az adatbázis használata 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. Az adatbázis építés strukturális alapja: az adatmodell Leírási jellemzői: - egyed : minden olyan dolog (objektum), amely minden más dologtól (objektumtól ) megkülönböztethető, konkrét dolgok absztrakciója, konkrét dolgokat fog át. (könyv= sok könyv, stb.) tulajdonság : az egyedek jellemzője, az egyedeket tulajdonságaikkal írjuk le. (könyv szerzője, címe, kiadója, terjedelme, stb.) Meghatározó tulajdonság vagy kulcs : pl. könyv leltári száma kapcsolat : mindig valóságos egyedek (objektumok) közti viszonyt fejez ki. Pl: könyvtári könyv. Tehát az adatmodell egyedek, tulajdonságok és kapcsolatok halmaza, amely absztrakt módon tükrözi a valós objektumoknak, azok jellemzőinek (tulajdonságainak) és viszonyainak (kapcsolatainak) elvont kategóriáit. Az adatmodell elemek kapcsolódási módjai határozzák meg az adatmodellek szerkezetét. 2019.01.12.
Ma használatos adatbázisok adatmodell típusai fejlődési sorrendben: - hálós adatmodell. Szerkezetét gráffal adjuk meg, melyben a csomópontok az egyedek, az élek pedig a kapcsolatot fejezik ki. Az egyedeket tulajdonságaikkal jellemezzük. - hierarchikus adatmodell. Szerkezetét egy speciális gráffal - FA- adjuk meg. Jelölés mint fenn. Minden egyed csak egy ponton (egy szülő) kapcsolódhat. Pl. MeSH Tree Structures. - relációs adatmodell. Ma leggyakrabban használatos. Az egyed megadása táblázattal (a táblázat oszlopai az egyed tulajdonságai, sorai az egyed konkrét értékei, a mezők a tulajdonságok konkrét értékei ) történik, a kapcsolat nem épül be az adatmodellbe. A relációs adatmodellen alapuló adatbázisok kapcsoló eleme az azonos tartalmú oszlop, vagyis a közös tulajdonság. - objektum orientált adatmodell. Az egyedeket objektumoknak nevezzük. Az objektum tulajdonságai az objektum állapotát (tulajdonságainak aktuális értékét) írják le. A tulajdonságok szerepe azonos a relációs adatmodellével, de lényeges különbség, hogy objektum orientált adatmodellben egy tulajdonság bármi lehet, akár egy másik objektum is. Pl. bibliográfiai rekordhoz valamilyen média csatolható, azaz bármihez bármi. 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. Adatbázisok osztályozása A) működési cél szerint - irányítási - ügyviteli - dokumentációs célú: legjellemzőbb a könyvtári adatbázisokra. Keresés a nagy szöveges adatállományokból a dokumentum tartalma szerint -- > a keresőképet az információkereső nyelvi szótár szavaival és azok kapcsolataival lehet leírni. Általános megnevezésük: információkereső rendszer. B) felhasználás helye szerint - államigazgatás - ipar, kereskedelem - közgyűjtemények C) felhasználási szakterület szerint - átfogó, általános (SCI 120 szakterület) - szakterületi (ERIC, MEDLINE, CINAHL) - interdiszciplináris (Biological Abstract) 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. - egy szűk szakterület problémáinak megoldására létrehozott (INIS,űrkutatás) - egy dokumentumtípust feltáró (szabadalom, szabvány, jogszabály, stb.) D) funkció szerint - forrásra hivatkozó adatbázisok - - bibliográfiai (szakirodalmi) adatbázisok, melyek a dokumentumok, információforrások bibliográfiai leírását, esetenként tartalmi ismertetését is tárolják. - - forrástájékoztató (referal) adatbázisok, amelyek személyek, intézmények, szervezetek adatait dolgozzák fel. (céginformációs, szakértői, stb.) - forrás vagy forrástípusú adatbázisok, azaz a primér információt tartalmazzák. - - numerikus adatbázisok (statisztikák, számsoros jellemzések) - - szöveges - numerikus adatbázisok (képletgyűjtemények, műszaki útmutatók) - - teljes szöveges (full-text) adatbázisok, melyek bármely típusú dokumentum (könyv, folyóirat, jogszabály, stb.) teljes szövegét kereshetően dolgozzák fel. - - szakértői rendszerek vagy tudásbázisok (kompilációk), értékelt információkat dolgoznak fel. (Micromedex modulok) - - integrált adatbázisok, melyek az előző funkciók közül többet is egyesítenek. (integrált könyvtári, kórházi stb. rendszerek más-más típusú moduljai) 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. Bibliográfia (görög eredetű szó) : biblosz = könyv + grapheion = leírás, mely jelölhet 1.) tevékenységet - amelynek során a szak - (és minden más) irodalmat valamilyen szempont szerint számba vesznek, regisztrálnak - a számba vett adatokat (hordozótól függően leírásokat vagy rekordokat) valamilyen logikus szempont szerint csoportosítják (visszakereshetőség alapja) 2.) a tevékenység eredményét (hordozótól függően nyomtatott bibliográfiát vagy bibliográfiai adatbázist) 3.) tudományt, azaz a bibliográfia vagy bibliográfiai adatbázis készítésének tanát A bibliográfiai adatbázis alapegysége a rekord. A rekord egy (1 db) bibliográfiai egységről készített leírás, amely egy komplex bibliográfiai tétel elektronikus változata. Bibliográfiai adatbázisok megjelenése számítástechnika alkalmazásával 1960-as évektől - Chemical Abstracts 1961, Index Medicus 1963, Library of Congress 1966 (MAchine Readable Cataloguing) 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. A bibliográfiai adatbázisok fő funkcionális adatállományai : - bibliográfiai vagy master file --» a dokumentumok bibliográfiai leírását tárolja - invertált file vagy index file --» a keresés általában ebben a betűrendes file-ban kezdődik, és az egyes kifejezésekhez kapcsolódó, azok pontos helyét számsorrenddel meghatározó azonosítók vezetnek el a bibliográfiai adatállományhoz, azaz a kifejezés konkrét helyéhez a dokumentumban. (Táblázat, amelynek első oszlopa „abc” sorrendben tartalmazza a kereshető kifejezéseket, további oszlopai pedig azt, hogy a kifejezés mely dokumentumban fordul elő.) A keresés útja lehet: soros elérés (a keresett adatállományt csak a megelőző adatok elolvasása után érhetjük el) közvetlen elérés (a keresett adatállományt közvetlenül érhetjük el a master és invertált file-ban) adattípusok: a dokumentumokat leíró ismérvek csoportja, amelyek felsorolása az adatszótárban található. (TI,AU,SO,PY, stb.) 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. Az adatállományokban történő keresési kombinációk döntő meghatározója a választott információkereső nyelv. Információkereső nyelv : az a nyelv, amely alkalmas az információk és az információkereső kérdések leírására, azaz a természetes nyelven megfogalmazott kérdések szabályozott nyelvre történő lefordítására. Az információkereső nyelvek típusai : hierarchikus : az információkereső nyelvi szavak tükrözik hogy a keresett kifejezések, fogalmak mely másik fogalomnak vannak alárendelve. A hierarchia szabályai beépülnek a fogalomba, pl. 34 Jogtudomány osztály feltételezi a 3 Társadalomtudomány főosztály felső hierarchia és a 343 Büntetőjog alosztály, alsó hierarchia meglétét. Ezért bővebb fogalmak szerinti tárgyi információkeresésre alkalmasak, általános megnevezésük Osztályozási rendszerek. Jelkészletük többségében számokból áll, ezért számítógépes alkalmazásuk nem jellemző. mellérendelő: a természetes nyelvből egy valamilyen módon szabályozott kontrollált nyelvet hoznak létre, amelyben minden kifejezés egyenrangú, nem érvényesül hierarchia. Eszköz : szinonímák kiküszöbölése, kitüntetett tárgyszó kiválasztása, ld. még típusú utalók beépítése. A rendezés alapja leggyakrabban a betűrend. Ezekből - a dokumentum tartalmát leíró betűrendbe szerkesztett szóláncokból vagy indextételekből – épül fel az index. Az indexelő eljárások során az indexkifejezéseket a dokumentum címéből vagy tartalmából emelik ki. KWIC, KWOC 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. -szemantikai (relációs): A valamely fogalom leírására, megjelenítésére szolgáló kifejezéseket deszkriptoroknak, szótáraikat pedig tezauruszoknak nevezzük --» a tezaurusz tehát egy szakterület természetes nyelven kifejezett fogalmainak szabályozott, szükség szerint változtatható polihierarchikus szótára, amely feltünteti a fogalmak közötti legfontosabb logikai kapcsolatokat (relációkat). A tezaurusszal végzett fogalmi osztályozás alapjai a lexikai egységek. A tezaurusz lexikai egységei a deszkriptorok és a nemdeszkriptorok, melyek az osztályozó fogalmak szabályozott nyelvi kifejezései. Deszkriptor : az adatbázis funkciójának megfelelően az információk leírására és keresésére közvetlenül használható, több hasonló kifejezés közül kiválasztott privilegizált szóalak. Nemdeszkriptor: a deszkriptor szinonímnak tekintett kifejezése, amely az információk leírására és visszakeresésére az őt képviselő deszkriptor figyelembe vételével használható. A tezaurusz fő részei: Deszkriptorcikkek és nemdeszkriptor - cikkek, teljes kapcsolatrendszerükkel, azaz a fogalmak egymás közötti relációit tüntetik fel. Tezauruszok további részei: tárgyköri mutatókötet, hierarchikus mutatókötet, szerkezeti mutatókötet. (MeSH nyomtatott változatának részei, OVID Tools ikon) 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. A gyűjtött, feldolgozott és adatbázisban tárolt információ keresése Információkeresés : a felhasználó információkereső nyelvre lefordított kérdésének összehasonlítása a tárban található, ugyancsak információkereső nyelven megfogalmazott - a dokumentumra vonatkozó - ismérvekkel. (OVID Map of term) Az információkeresés folyamata : - interjú v. öninterjú a keresést végző személlyel - - kívánt vagy szükséges korlátozások (keresés nyelve, keresés időhatára, keresendő dokumentumtípusok meghatározása, földrajzi elhatárolás) - - keresés céljának megfogalmazása (általános tájékozódás v. szakspecifikus, konkrét, kutatással alátámasztott információ) - - van-e már előélete a keresésnek, más adatbázisban, ismert szerző, ismert folyóirat, ismert publikációk, stb. - - a keresőkérdés megfogalmaz(tat)ása természetes nyelvi kifejezésekkel - - mennyire sürgős a keresés - - milyen formátumban célszerű a találatok megjelenítése 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. - a keresés megtervezése - - a keresett témát legjobban lefedő adatbázis(ok) kiválasztása - - a keresési stratégia kialakítása - - - kötött szavas, szabadszavas, kombinált Kötött szavas keresés : a keresőszavakat szabványos, ellenőrzött szókészletből - tezaurusz – merítjük Szabad tárgyszavas (keyword = kulcsszavas) keresés : a cím és a referátum szövegéből kigyűjtött szakkifejezések, amelyek az adatbázis indexében abc sorrendben találhatók. Átmenetet képeznek a kötött szavas és a szabadszavas keresés között. Még nem deszkriptorok, de tudományterminológiai meghonosodásuk után átléphetnek azok jegyzékébe. Szabadszavas (natural language - természetes nyelvi) keresés : a keresendő szavakat (tiltottak kivételével) a teljes rekord szövegéből szabadon választhatjuk. (OVID Books) 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. - a keresési stratégia megfogalmazása - - fogalmi csoportok (keresendő kifejezések) kialakítása az előbbi segédletek (tezaurusz, index) alapján - - ezek egymáshoz kapcsolása a Boole operátorok segítségével ( OR, AND, NOT) Science Direct ab. megnevezés „connectors” Halmaz Bool Algebra Unió Vitamin C OR Ascorbin acid Metszet Blastula AND embryo Komplementer Blastula NOT 2019.01.12.
- - - ADJ=adjacency blastula ADJ embryo, patterning ADJn embryo - - szükség esetén további logikai - relációs - műveletek elvégzése - \< kisebb mint …, - \> nagyobb mint …, - \<=kisebb vagy egyenlő, - \> nagyobb vagy egyenlő …(mai adatbázisoknál általában már gördülő menüből is kiválaszthatók) - - közelségi-távolsági (proximity) operátorok - - - ADJ=adjacency blastula ADJ embryo, patterning ADJn embryo Pl. OVID adatbázisok - - - együtt SAMEn két kereső kifejezés között n-2 számú egyéb szó helyezkedhet el. Pl. blastula SAME4 embryo = blastula word1, word 2, embryo Pl. ISI Web of Science - - - közel NEARn két kereső kifejezés között n-2 számú egyéb szó helyezkedhet el de a kereső kifejezések sorrendje nem számít. Pl. embryo NEAR4 blastula = embryo word1, word2 blastula Pl. EBSCO adatbázisok - - - PRE = preceding a kifejezést megelőző szöveg tartományon belül, PRE/n Scopus ab. (1< n szó <255) PRE/nn Science Direct, PRE/# Dissertation Abstract - - - W = within két kifejezés keresése adott tartományon belül, Dissertation Abstract , W/n Scopus, EBSCO, W/nn, NOT W/nn Science Direct, 2019.01.12.
- - helyettesítés bizonytalan szóalak ismeret esetén: colo?r = lehet W/# pl. computer W/3 carriers, W/PARA pl. internet W/PARA education PARA = within the same paragaph, W/DOC pl. internet W/DOC education, DOC = Citation and Document Text, Dissertation Abstract W/SEG = két kifejezés együttes megjelenése egy mezőn belül pl. lesion W/SEG pancreatic,Science Direct - - helyettesítés bizonytalan szóalak ismeret esetén: colo?r = lehet color, colour helyettesítés más karakterrel: # wom#n = lehet woman, women - - csonkolás : korlátlan csonkolás a szó gyökerénél X$, pl. rat$ minden további lehetséges szóalakra érvényes – rat, rats, rate, ratify, rationalizate, etc. ? korlátozott csonkolás X$n : n(1) azoknak a karaktereknek a száma, amelyek a gyökér szót követhetik, pl. dog, dogs de dogma nem * asterisk alkalmazások bárhol a szóban minden adatbázisnál - - előfordulási gyakoriság mérése mezőn belül. Pl. x. (keresett szó) fd. (mező field neve) / FREQ n (n számú előfordulás lehet), azaz cancer.ab./freq = 5, OVID adatbázisok A keresések további finomítása: LIMIT – REFINING Minden adatbázisban az adatbázis funkciójával összhangban számtalan formai és tartalmi limitálási lehetőséget kínálnak fel. Általános az időhatár, földrajzi, nyelvi, közlemény műfaji limit lehetőség, a többi az ún. tartalmi „subset”-ekből állítható be. 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. - a leggyakoribb alkalmazott keresési stratégiák - - egyszerű gyorskeresés : Boole operátorokkal tájékozódunk az adatbázisban lévő rekordok szerkezetéről, mennyiségéről a továbblépéshez - - hólabda keresés : kevés találat esetén - a már meglévő rekord bibliográfiai jellemzőiből - alkotjuk meg az új keresési stratégiát – Cross Reference - - kerülőutas vagy relevancia visszacsatolásos : az előbbihez hasonló, van ugyan elég találat, de pontosítani szeretnénk a keresést a már meglévő első legrelevánsabb találatok ismérvei alapján - - többszörös egyszerű gyorskeresés : több adatbázisban hajtjuk végre párhuzamosan a keresést, a kapott találati halmazokat összehasonlítjuk, a legrelevánsabb halmazban további finomított kereséseket végzünk - a keresési stratégia végrehajtásának szükséges feltétele : parancs nyelv(ek) ismerete - - paranccsal vezérelt keresés, általában kereskedelmi célú on-line adatbázis forgalmazóknál - - felülettel vezérelt keresés, nagyközönségnek szánt adatbázisoknál, grafikus felületen, ikonos parancs ábrákkal : legtöbb könyvtári adatbázisra jellemző 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. A keresés VÉGEREDMÉNYE: komplex bibliográfiai rekordok (Bibliográfiai leírás, osztályozás, referátum, azonosítók, stb.), melyeket meg kívánunk jeleníteni. A találatok megjelenítési formátumának tervezése, azaz az adatbázis funkcióinak megfelelően mely találati rekordmezők jelenjenek meg. - - display : megfelelő formátum (mezők) kiválasztása - - - megtekintés után végleges mentés vagy - - - keresési stratégia módosítása minden adatbázis számtalan szempontú rendezési lehetőséget kínál fel - - végleges display kiíratás után - - - on-line kinyomtatás (Print) - - - mentés (Save) - - - elektronikus továbbítás (e-mail) 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. Kiadói honlapok a web-en - mint a tájékozódás és az adatbázis használat tanulás eszközei Adatbázis forgalmazók értéknövelt szolgáltatás típusai : - options általában minden adatbázisnál: training, demo, tutorials, educational materials, help, trial, webstat Folyóirat kiadói adatbázisokhoz kapcsolódó értéknövelt szolgáltatás típusok : - My List, My Profile (Scopus) - My Profile, My Alerts (Science Direct), free trial, stb. 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. Néhány ajánlott irodalom: 1.) A szakirodalom haszna és szerkezete. In: Csermely P, Gergely P, Koltay T, Tóth J. Kutatás és közlés a természettudományokban. Budapest: Osiris; 1999. p. 119 - 39. 2.) Jehoda I. Kőtáblától a világhálóig : Az orvos- és egészségtudományi szakirodalmi információs rendszer fejlődése. Budapest : SE EFK; 2004. 3.) Murányi L. A bibliográfiától az adatbázisig. In: Horváth T, Papp I. szerk. Könyvtárosok kézikönyve 2. Budapest: Osiris; 2001. p. 299 – 326. 4.) Ungváry R, Vajda E. Könyvtári információkeresés. 2. jav. kiad. Budapest: Typotex; 2002. 2019.01.12.
„Informatio Medicata 2005” Budapest, 2005.nov.10. Teljes szakirodalom kutatási lehetőségek szabadon: - Magyar Orvosi Bibliográfia = MOB http://www.eski.hu/new3/konyvtar/konyvtar.php - PubMed http://www.ncbi.nlm.nih.gov/entrez/query.fcgi - egyéb interneten szabadon elérhető források Sikeres irodalomkutatást (bibliográfiai adatbázis használatot) kívánok! 2019.01.12.