Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Bibliográfiai adatbázisok

Hasonló előadás


Az előadások a következő témára: "Bibliográfiai adatbázisok"— Előadás másolata:

1 Bibliográfiai adatbázisok
Jehoda Imola MA, MSc Semmelweis Egyetem Egészségügyi Főiskolai Kar Könyvtár

2 „Informatio Medicata 2005” Budapest, 2005.nov.10.
Adatbázisok helye az információs rendszerek működési folyamatában Az információs rendszerek alapvető funkciói: - az információ gyűjtése : az információ tartalmának és a gyűjtendő információforrások körének meghatározása - a gyűjtött információ feldolgozása -- formai feldolgozás : számbavétel és azonosítás -- tartalmi feldolgozás : a gyűjtött információ tartalmának tárgyszavakkal történő jellemzése, index, thesaurus - a gyűjtött és feldolgozott információ tárolása adatbázisokban: ADATBÁZIS= az információk logikai kapcsolataikkal együtt tárolt (visszakeresésre alkalmas) halmaza a gyűjtött, feldolgozott és tárolt információ szolgáltatása, azaz az adatbázis használata

3 „Informatio Medicata 2005” Budapest, 2005.nov.10.
Az adatbázis építés strukturális alapja: az adatmodell Leírási jellemzői: - egyed : minden olyan dolog (objektum), amely minden más dologtól (objektumtól ) megkülönböztethető, konkrét dolgok absztrakciója, konkrét dolgokat fog át. (könyv= sok könyv, stb.) tulajdonság : az egyedek jellemzője, az egyedeket tulajdonságaikkal írjuk le. (könyv szerzője, címe, kiadója, terjedelme, stb.) Meghatározó tulajdonság vagy kulcs : pl. könyv leltári száma kapcsolat : mindig valóságos egyedek (objektumok) közti viszonyt fejez ki. Pl: könyvtári könyv. Tehát az adatmodell egyedek, tulajdonságok és kapcsolatok halmaza, amely absztrakt módon tükrözi a valós objektumoknak, azok jellemzőinek (tulajdonságainak) és viszonyainak (kapcsolatainak) elvont kategóriáit. Az adatmodell elemek kapcsolódási módjai határozzák meg az adatmodellek szerkezetét.

4 Ma használatos adatbázisok adatmodell típusai fejlődési sorrendben:
- hálós adatmodell. Szerkezetét gráffal adjuk meg, melyben a csomópontok az egyedek, az élek pedig a kapcsolatot fejezik ki. Az egyedeket tulajdonságaikkal jellemezzük. - hierarchikus adatmodell. Szerkezetét egy speciális gráffal - FA- adjuk meg. Jelölés mint fenn. Minden egyed csak egy ponton (egy szülő) kapcsolódhat. Pl. MeSH Tree Structures. - relációs adatmodell. Ma leggyakrabban használatos. Az egyed megadása táblázattal (a táblázat oszlopai az egyed tulajdonságai, sorai az egyed konkrét értékei, a mezők a tulajdonságok konkrét értékei ) történik, a kapcsolat nem épül be az adatmodellbe. A relációs adatmodellen alapuló adatbázisok kapcsoló eleme az azonos tartalmú oszlop, vagyis a közös tulajdonság. - objektum orientált adatmodell. Az egyedeket objektumoknak nevezzük. Az objektum tulajdonságai az objektum állapotát (tulajdonságainak aktuális értékét) írják le. A tulajdonságok szerepe azonos a relációs adatmodellével, de lényeges különbség, hogy objektum orientált adatmodellben egy tulajdonság bármi lehet, akár egy másik objektum is. Pl. bibliográfiai rekordhoz valamilyen média csatolható, azaz bármihez bármi.

5 „Informatio Medicata 2005” Budapest, 2005.nov.10.
Adatbázisok osztályozása A) működési cél szerint - irányítási - ügyviteli - dokumentációs célú: legjellemzőbb a könyvtári adatbázisokra. Keresés a nagy szöveges adatállományokból a dokumentum tartalma szerint -- > a keresőképet az információkereső nyelvi szótár szavaival és azok kapcsolataival lehet leírni. Általános megnevezésük: információkereső rendszer. B) felhasználás helye szerint - államigazgatás - ipar, kereskedelem - közgyűjtemények C) felhasználási szakterület szerint - átfogó, általános (SCI 120 szakterület) - szakterületi (ERIC, MEDLINE, CINAHL) - interdiszciplináris (Biological Abstract)

6 „Informatio Medicata 2005” Budapest, 2005.nov.10.
- egy szűk szakterület problémáinak megoldására létrehozott (INIS,űrkutatás) - egy dokumentumtípust feltáró (szabadalom, szabvány, jogszabály, stb.) D) funkció szerint - forrásra hivatkozó adatbázisok - - bibliográfiai (szakirodalmi) adatbázisok, melyek a dokumentumok, információforrások bibliográfiai leírását, esetenként tartalmi ismertetését is tárolják. - - forrástájékoztató (referal) adatbázisok, amelyek személyek, intézmények, szervezetek adatait dolgozzák fel. (céginformációs, szakértői, stb.) - forrás vagy forrástípusú adatbázisok, azaz a primér információt tartalmazzák. - - numerikus adatbázisok (statisztikák, számsoros jellemzések) - - szöveges - numerikus adatbázisok (képletgyűjtemények, műszaki útmutatók) - - teljes szöveges (full-text) adatbázisok, melyek bármely típusú dokumentum (könyv, folyóirat, jogszabály, stb.) teljes szövegét kereshetően dolgozzák fel. - - szakértői rendszerek vagy tudásbázisok (kompilációk), értékelt információkat dolgoznak fel. (Micromedex modulok) - - integrált adatbázisok, melyek az előző funkciók közül többet is egyesítenek. (integrált könyvtári, kórházi stb. rendszerek más-más típusú moduljai)

7 „Informatio Medicata 2005” Budapest, 2005.nov.10.
Bibliográfia (görög eredetű szó) : biblosz = könyv + grapheion = leírás, mely jelölhet 1.) tevékenységet - amelynek során a szak - (és minden más) irodalmat valamilyen szempont szerint számba vesznek, regisztrálnak - a számba vett adatokat (hordozótól függően leírásokat vagy rekordokat) valamilyen logikus szempont szerint csoportosítják (visszakereshetőség alapja) 2.) a tevékenység eredményét (hordozótól függően nyomtatott bibliográfiát vagy bibliográfiai adatbázist) 3.) tudományt, azaz a bibliográfia vagy bibliográfiai adatbázis készítésének tanát A bibliográfiai adatbázis alapegysége a rekord. A rekord egy (1 db) bibliográfiai egységről készített leírás, amely egy komplex bibliográfiai tétel elektronikus változata. Bibliográfiai adatbázisok megjelenése számítástechnika alkalmazásával 1960-as évektől - Chemical Abstracts 1961, Index Medicus 1963, Library of Congress 1966 (MAchine Readable Cataloguing)

8 „Informatio Medicata 2005” Budapest, 2005.nov.10.
A bibliográfiai adatbázisok fő funkcionális adatállományai : - bibliográfiai vagy master file --» a dokumentumok bibliográfiai leírását tárolja - invertált file vagy index file --» a keresés általában ebben a betűrendes file-ban kezdődik, és az egyes kifejezésekhez kapcsolódó, azok pontos helyét számsorrenddel meghatározó azonosítók vezetnek el a bibliográfiai adatállományhoz, azaz a kifejezés konkrét helyéhez a dokumentumban. (Táblázat, amelynek első oszlopa „abc” sorrendben tartalmazza a kereshető kifejezéseket, további oszlopai pedig azt, hogy a kifejezés mely dokumentumban fordul elő.) A keresés útja lehet: soros elérés (a keresett adatállományt csak a megelőző adatok elolvasása után érhetjük el) közvetlen elérés (a keresett adatállományt közvetlenül érhetjük el a master és invertált file-ban) adattípusok: a dokumentumokat leíró ismérvek csoportja, amelyek felsorolása az adatszótárban található. (TI,AU,SO,PY, stb.)

9 „Informatio Medicata 2005” Budapest, 2005.nov.10.
Az adatállományokban történő keresési kombinációk döntő meghatározója a választott információkereső nyelv. Információkereső nyelv : az a nyelv, amely alkalmas az információk és az információkereső kérdések leírására, azaz a természetes nyelven megfogalmazott kérdések szabályozott nyelvre történő lefordítására. Az információkereső nyelvek típusai : hierarchikus : az információkereső nyelvi szavak tükrözik hogy a keresett kifejezések, fogalmak mely másik fogalomnak vannak alárendelve. A hierarchia szabályai beépülnek a fogalomba, pl. 34 Jogtudomány osztály feltételezi a 3 Társadalomtudomány főosztály felső hierarchia és a 343 Büntetőjog alosztály, alsó hierarchia meglétét. Ezért bővebb fogalmak szerinti tárgyi információkeresésre alkalmasak, általános megnevezésük Osztályozási rendszerek. Jelkészletük többségében számokból áll, ezért számítógépes alkalmazásuk nem jellemző. mellérendelő: a természetes nyelvből egy valamilyen módon szabályozott kontrollált nyelvet hoznak létre, amelyben minden kifejezés egyenrangú, nem érvényesül hierarchia. Eszköz : szinonímák kiküszöbölése, kitüntetett tárgyszó kiválasztása, ld. még típusú utalók beépítése. A rendezés alapja leggyakrabban a betűrend. Ezekből - a dokumentum tartalmát leíró betűrendbe szerkesztett szóláncokból vagy indextételekből – épül fel az index. Az indexelő eljárások során az indexkifejezéseket a dokumentum címéből vagy tartalmából emelik ki. KWIC, KWOC

10 „Informatio Medicata 2005” Budapest, 2005.nov.10.
-szemantikai (relációs): A valamely fogalom leírására, megjelenítésére szolgáló kifejezéseket deszkriptoroknak, szótáraikat pedig tezauruszoknak nevezzük --» a tezaurusz tehát egy szakterület természetes nyelven kifejezett fogalmainak szabályozott, szükség szerint változtatható polihierarchikus szótára, amely feltünteti a fogalmak közötti legfontosabb logikai kapcsolatokat (relációkat). A tezaurusszal végzett fogalmi osztályozás alapjai a lexikai egységek. A tezaurusz lexikai egységei a deszkriptorok és a nemdeszkriptorok, melyek az osztályozó fogalmak szabályozott nyelvi kifejezései. Deszkriptor : az adatbázis funkciójának megfelelően az információk leírására és keresésére közvetlenül használható, több hasonló kifejezés közül kiválasztott privilegizált szóalak. Nemdeszkriptor: a deszkriptor szinonímnak tekintett kifejezése, amely az információk leírására és visszakeresésére az őt képviselő deszkriptor figyelembe vételével használható. A tezaurusz fő részei: Deszkriptorcikkek és nemdeszkriptor - cikkek, teljes kapcsolatrendszerükkel, azaz a fogalmak egymás közötti relációit tüntetik fel. Tezauruszok további részei: tárgyköri mutatókötet, hierarchikus mutatókötet, szerkezeti mutatókötet. (MeSH nyomtatott változatának részei, OVID Tools ikon)

11 „Informatio Medicata 2005” Budapest, 2005.nov.10.
A gyűjtött, feldolgozott és adatbázisban tárolt információ keresése Információkeresés : a felhasználó információkereső nyelvre lefordított kérdésének összehasonlítása a tárban található, ugyancsak információkereső nyelven megfogalmazott - a dokumentumra vonatkozó - ismérvekkel. (OVID Map of term) Az információkeresés folyamata : - interjú v. öninterjú a keresést végző személlyel - - kívánt vagy szükséges korlátozások (keresés nyelve, keresés időhatára, keresendő dokumentumtípusok meghatározása, földrajzi elhatárolás) - - keresés céljának megfogalmazása (általános tájékozódás v. szakspecifikus, konkrét, kutatással alátámasztott információ) - - van-e már előélete a keresésnek, más adatbázisban, ismert szerző, ismert folyóirat, ismert publikációk, stb. - - a keresőkérdés megfogalmaz(tat)ása természetes nyelvi kifejezésekkel - - mennyire sürgős a keresés - - milyen formátumban célszerű a találatok megjelenítése

12 „Informatio Medicata 2005” Budapest, 2005.nov.10.
- a keresés megtervezése - - a keresett témát legjobban lefedő adatbázis(ok) kiválasztása - - a keresési stratégia kialakítása - - - kötött szavas, szabadszavas, kombinált Kötött szavas keresés : a keresőszavakat szabványos, ellenőrzött szókészletből - tezaurusz – merítjük Szabad tárgyszavas (keyword = kulcsszavas) keresés : a cím és a referátum szövegéből kigyűjtött szakkifejezések, amelyek az adatbázis indexében abc sorrendben találhatók. Átmenetet képeznek a kötött szavas és a szabadszavas keresés között. Még nem deszkriptorok, de tudományterminológiai meghonosodásuk után átléphetnek azok jegyzékébe. Szabadszavas (natural language - természetes nyelvi) keresés : a keresendő szavakat (tiltottak kivételével) a teljes rekord szövegéből szabadon választhatjuk. (OVID Books)

13 „Informatio Medicata 2005” Budapest, 2005.nov.10.
- a keresési stratégia megfogalmazása - - fogalmi csoportok (keresendő kifejezések) kialakítása az előbbi segédletek (tezaurusz, index) alapján - - ezek egymáshoz kapcsolása a Boole operátorok segítségével ( OR, AND, NOT) Science Direct ab. megnevezés „connectors” Halmaz Bool Algebra Unió Vitamin C OR Ascorbin acid Metszet Blastula AND embryo Komplementer Blastula NOT

14 - - - ADJ=adjacency blastula ADJ embryo, patterning ADJn embryo
- - szükség esetén további logikai - relációs - műveletek elvégzése - \< kisebb mint …, - \> nagyobb mint …, - \<=kisebb vagy egyenlő, - \> nagyobb vagy egyenlő …(mai adatbázisoknál általában már gördülő menüből is kiválaszthatók) - - közelségi-távolsági (proximity) operátorok - - - ADJ=adjacency blastula ADJ embryo, patterning ADJn embryo Pl. OVID adatbázisok - - - együtt SAMEn két kereső kifejezés között n-2 számú egyéb szó helyezkedhet el. Pl. blastula SAME4 embryo = blastula word1, word 2, embryo Pl. ISI Web of Science - - - közel NEARn két kereső kifejezés között n-2 számú egyéb szó helyezkedhet el de a kereső kifejezések sorrendje nem számít. Pl. embryo NEAR4 blastula = embryo word1, word2 blastula Pl. EBSCO adatbázisok - - - PRE = preceding a kifejezést megelőző szöveg tartományon belül, PRE/n Scopus ab. (1< n szó <255) PRE/nn Science Direct, PRE/# Dissertation Abstract - - - W = within két kifejezés keresése adott tartományon belül, Dissertation Abstract , W/n Scopus, EBSCO, W/nn, NOT W/nn Science Direct,

15 - - helyettesítés bizonytalan szóalak ismeret esetén: colo?r = lehet
W/# pl. computer W/3 carriers, W/PARA pl. internet W/PARA education PARA = within the same paragaph, W/DOC pl. internet W/DOC education, DOC = Citation and Document Text, Dissertation Abstract W/SEG = két kifejezés együttes megjelenése egy mezőn belül pl. lesion W/SEG pancreatic,Science Direct - - helyettesítés bizonytalan szóalak ismeret esetén: colo?r = lehet color, colour helyettesítés más karakterrel: # wom#n = lehet woman, women - - csonkolás : korlátlan csonkolás a szó gyökerénél X$, pl. rat$ minden további lehetséges szóalakra érvényes – rat, rats, rate, ratify, rationalizate, etc. ? korlátozott csonkolás X$n : n(1) azoknak a karaktereknek a száma, amelyek a gyökér szót követhetik, pl. dog, dogs de dogma nem * asterisk alkalmazások bárhol a szóban minden adatbázisnál - - előfordulási gyakoriság mérése mezőn belül. Pl. x. (keresett szó) fd. (mező field neve) / FREQ n (n számú előfordulás lehet), azaz cancer.ab./freq = 5, OVID adatbázisok A keresések további finomítása: LIMIT – REFINING Minden adatbázisban az adatbázis funkciójával összhangban számtalan formai és tartalmi limitálási lehetőséget kínálnak fel. Általános az időhatár, földrajzi, nyelvi, közlemény műfaji limit lehetőség, a többi az ún. tartalmi „subset”-ekből állítható be.

16 „Informatio Medicata 2005” Budapest, 2005.nov.10.
- a leggyakoribb alkalmazott keresési stratégiák - - egyszerű gyorskeresés : Boole operátorokkal tájékozódunk az adatbázisban lévő rekordok szerkezetéről, mennyiségéről a továbblépéshez - - hólabda keresés : kevés találat esetén - a már meglévő rekord bibliográfiai jellemzőiből - alkotjuk meg az új keresési stratégiát – Cross Reference - - kerülőutas vagy relevancia visszacsatolásos : az előbbihez hasonló, van ugyan elég találat, de pontosítani szeretnénk a keresést a már meglévő első legrelevánsabb találatok ismérvei alapján - - többszörös egyszerű gyorskeresés : több adatbázisban hajtjuk végre párhuzamosan a keresést, a kapott találati halmazokat összehasonlítjuk, a legrelevánsabb halmazban további finomított kereséseket végzünk - a keresési stratégia végrehajtásának szükséges feltétele : parancs nyelv(ek) ismerete - - paranccsal vezérelt keresés, általában kereskedelmi célú on-line adatbázis forgalmazóknál - - felülettel vezérelt keresés, nagyközönségnek szánt adatbázisoknál, grafikus felületen, ikonos parancs ábrákkal : legtöbb könyvtári adatbázisra jellemző

17 „Informatio Medicata 2005” Budapest, 2005.nov.10.
A keresés VÉGEREDMÉNYE: komplex bibliográfiai rekordok (Bibliográfiai leírás, osztályozás, referátum, azonosítók, stb.), melyeket meg kívánunk jeleníteni. A találatok megjelenítési formátumának tervezése, azaz az adatbázis funkcióinak megfelelően mely találati rekordmezők jelenjenek meg. - - display : megfelelő formátum (mezők) kiválasztása - - - megtekintés után végleges mentés vagy - - - keresési stratégia módosítása minden adatbázis számtalan szempontú rendezési lehetőséget kínál fel - - végleges display kiíratás után - - - on-line kinyomtatás (Print) - - - mentés (Save) - - - elektronikus továbbítás ( )

18 „Informatio Medicata 2005” Budapest, 2005.nov.10.
Kiadói honlapok a web-en - mint a tájékozódás és az adatbázis használat tanulás eszközei Adatbázis forgalmazók értéknövelt szolgáltatás típusai : - options általában minden adatbázisnál: training, demo, tutorials, educational materials, help, trial, webstat Folyóirat kiadói adatbázisokhoz kapcsolódó értéknövelt szolgáltatás típusok : - My List, My Profile (Scopus) - My Profile, My Alerts (Science Direct), free trial, stb.

19 „Informatio Medicata 2005” Budapest, 2005.nov.10.
Néhány ajánlott irodalom: 1.) A szakirodalom haszna és szerkezete. In: Csermely P, Gergely P, Koltay T, Tóth J. Kutatás és közlés a természettudományokban. Budapest: Osiris; p 2.) Jehoda I. Kőtáblától a világhálóig : Az orvos- és egészségtudományi szakirodalmi információs rendszer fejlődése. Budapest : SE EFK; 2004. 3.) Murányi L. A bibliográfiától az adatbázisig. In: Horváth T, Papp I. szerk. Könyvtárosok kézikönyve 2. Budapest: Osiris; p. 299 – 326. 4.) Ungváry R, Vajda E. Könyvtári információkeresés. 2. jav. kiad. Budapest: Typotex; 2002.

20 „Informatio Medicata 2005” Budapest, 2005.nov.10.
Teljes szakirodalom kutatási lehetőségek szabadon: - Magyar Orvosi Bibliográfia = MOB - PubMed - egyéb interneten szabadon elérhető források Sikeres irodalomkutatást (bibliográfiai adatbázis használatot) kívánok!


Letölteni ppt "Bibliográfiai adatbázisok"

Hasonló előadás


Google Hirdetések