Tartalmi feltárás bevezetés.

Slides:



Advertisements
Hasonló előadás
Számítógépes katalógusok
Advertisements

Keresés a számítógépes katalógusokban
Tamás Kincső, OSZK, Analitikus Feldolgozó Osztály, osztályvezető A részdokumentumok szolgáltatása az ELDORADO-ban ELDORADO konferencia a partnerkönyvtárakkal.

Kamarai prezentáció sablon
Készítette: Boros Erzsi
Könyvtárismeret Dokumentumok típusai.
Tengeralattjáró győzelmi hírek elmaradása – kilövés
Erőállóképesség mérése Találjanak teszteket az irodalomban
ETO kereshetőségének és böngészhetőségének problémái az ALEPH-ben
MATEMATIKA Év eleji felmérés 3. évfolyam
Képességszintek.
Humánkineziológia szak
Osztályozási rendszerek, információkereső nyelvek I
Online Katalógus aleph.nyf.hu.
Mellár János 5. óra Március 12. v
Műveletek logaritmussal
Utófeszített vasbeton lemez statikai számítása Részletes számítás
A tételek eljuttatása az iskolákba
Általános könyvtárismeret
INFORMATIKA KÖNYVTÁRHASZNÁLATI TÉMAKÖR II.
Tartalmi feltárás bevezetés.
Egyetemes Tizedes Osztályozás
A természetes nyelvű tartalmi feltárás
Az esszé Segédlet tanulóknak és tanároknak
VÁLOGATÁS ISKOLÁNK ÉLETÉBŐL KÉPEKBEN.
Védőgázas hegesztések
Könyvtárhasználat.
1. IS2PRI2 02/96 B.Könyv SIKER A KÖNYVELÉSHEZ. 2. IS2PRI2 02/96 Mi a B.Könyv KönyvelésMérlegEredményAdóAnalitikaForintDevizaKönyvelésMérlegEredményAdóAnalitikaForintDeviza.
Besorolási rekordok adatcsere formátuma
Műszaki tudományok az interneten
Rendszer és modell szeptember-december Előadó: Bornemisza Imre egyetemi adjunktus.
A könyvtárak és a könyvek osztályozása
Gazdálkodási modul Gazdaságtudományi ismeretek I. Üzemtan KÖRNYEZETGAZDÁLKODÁSI MÉRNÖKI MSc TERMÉSZETVÉDELMI MÉRNÖKI MSc.
Szerkezeti elemek teherbírásvizsgálata összetett terhelés esetén:
NOVÁK TAMÁS Nemzetközi Gazdaságtan
DRAGON BALL GT dbzgtlink féle változat! Illesztett, ráégetett, sárga felirattal! Japan és Angol Navigáláshoz használd a bal oldali léptető elemeket ! Verzio.
A közép- és emelt szintű vizsga tanári értékelése
Szótárak: fajták és tipologizálás
szakmérnök hallgatók számára
Logikai szita Izsó Tímea 9.B.
Szemantikus keresők.
2007. május 22. Debrecen Digitalizálás és elektronikus hozzáférés 1 DEA: a Debreceni Egyetem elektronikus Archívuma Karácsony Gyöngyi DE Egyetemi és Nemzeti.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Tárgyszórendszer tárgyszavas osztályozás feladata: a tematikailag összetartozó dokumentumok leírása csoportosítása.
A világ dokumentumtermésének az összegyűjtéséhez (20.század 2. fele)
VARIÁCIÓK ISMÉTLÉS NÉLKÜLI ESET DEFINÍCIÓ
A pneumatika alapjai A pneumatikában alkalmazott építőelemek és működésük vezérlő elemek (szelepek)
Csurik Magda Országos Tisztifőorvosi Hivatal
A klinikai transzfúziós tevékenység Ápolás szakmai ellenőrzése
Adatbázis kezelés. Az adatbázis tágabb értelemben egy olyan adathalmaz, amelynek elemei – egy meghatározott tulajdonságuk alapján – összetartozónak tekinthetők.
A tezaurusz alkalmazása a BME- OMIKK ALEPH rendszerében.
QualcoDuna interkalibráció Talaj- és levegövizsgálati körmérések évi értékelése (2007.) Dr. Biliczkiné Gaál Piroska VITUKI Kht. Minőségbiztosítási és Ellenőrzési.
1. Melyik jármű haladhat tovább elsőként az ábrán látható forgalmi helyzetben? a) A "V" jelű villamos. b) Az "M" jelű munkagép. c) Az "R" jelű rendőrségi.
Kvantitatív módszerek
Keresés a weben Kulcsszavas keresés: Google (
DIDAKTIKA ÉS OKTATÁSSZERVEZÉS II.
> aspnet_regiis -i 8 9 TIPP: Az „Alap” telepítés gyors, nem kérdez, de később korlátozhat.
Könyvtárak.
Adatbáziskezelés. Adat és információ Információ –Új ismeret Adat –Az információ formai oldala –Jelsorozat.
A KÖVETKEZŐKBEN SZÁMOZOTT KÉRDÉSEKET VAGY KÉPEKET LÁT SZÁMOZOTT KÉPLETEKKEL. ÍRJA A SZÁMOZOTT KÉRDÉSRE ADOTT VÁLASZT, VAGY A SZÁMOZOTT KÉPLET NEVÉT A VÁLASZÍV.
1 Az igazság ideát van? Montskó Éva, mtv. 2 Célcsoport Az alábbi célcsoportokra vonatkozóan mutatjuk be az adatokat: 4-12 évesek,1.
Keresés fajtái Matching (szabadszavas)
Könyv-és könyvtárhasználat 8. osztály. Könyvtári katalógusok Könyvtári katalógus Könyvtári katalógus 1. leíró betűrendes katalógus - szerző szerinti leíró.
Könyvtárhasználat, tájékozódást segítő eszközök
FELHASZNÁLÓI TRÉNINGEK Bevezetés a könyvtári katalógusok használatába.
Keresési módszerek könyvtári katalógusokban. A könyvtári katalógus funkciója A könyvtár állományában meglévő dokumentumok feltárása Az egyes példány adatainak.
Operációkutatás I. 1. előadás
Hogyan tájékozódjunk a magyar orvosi szakirodalomban?
Elektronikus szótárhasználat
Előadás másolata:

Tartalmi feltárás bevezetés

könyvtári szolgáltatás dokumentum dokumentum dokumentum információ dokumentumok gyűjtése feldolgozás / feltárás dokumentumok rendszerezése könyvtári szolgáltatás felhasználó

megtalálásának biztosítása a feltárás célja: dokumentumok információk nyilvántartása rend(szer)ezése megtalálásának biztosítása

bibliográfiai tétel leíró (bibliográfiai) adatok besorolási adatok a leírás tárgyát képező dokumentum összes feltárt ismérve leíró (bibliográfiai) adatok besorolási adatok tartalmi jellemzők

!!nem különíthető el teljesen egymástól!! feltárás formai bibliográfiai feltárás, címleírás tartalmi tartalmi feltárás / osztályozás / szakozás !!nem különíthető el teljesen egymástól!!

rendszerezés / formai feltárás a dokumentumok formai jellemzőit emeli ki a legalapvetőbb rendezési mód – a betűrendbe sorolás - alapja a sorrend (=besorolás) alapja a rendszó

rendszerezés / formai feltárás rendszó: a besorolás alapjául szolgáló szó a mű szerzőjének (szerkesztőjének, egyéb közreműködőjének) a neve a mű címe a közreadó intézmény neve betűrend: könyvtári katalógusok (betűrendes / tárgyszó) lexikonok, enciklopédiák, szótárak tárgy- és névmutatók

rendszerezés / tartalmi feltárás lehetővé teszi a dokumentumok tartalmuk alapján való visszakeresését egy témával kapcsolatos dokumentumok összegyűjtését azonos témájú dokumentumok csoportosítását a kialakított dokumentum-csoportok rendezését egyedi tartalmi informácók leírását szisztematikus katalógusok szerkesztését a lekérdezést, böngészést

eszköze az osztályozási nyelv  információkereső nyelv módszer tevékenység  szakozás eszköze az osztályozási nyelv  információkereső nyelv

osztályozási nyelv rendszer az ismeretek szervezésének egyik módszere a dokumentumok tartalmának meghatározására ismertetőjegyek szerinti beosztására alapja: az ismeretek fogalmi felosztása a köztük lévő kapcsolatok feltárása Pl. ETO, tezaurusz stb (szakozás) az ismeretek szervezésének egyik módszere a dokumentumtárolás része

osztályozáselméleti iskolák tudományfelosztáson alapuló nyelvészeti statisztikai

szerkezetük hierarchikus osztályozáselméleti iskolák 1. tudományfelosztáson alapuló osztályozások jellemzőik: filozófiai tudományfelosztás + természetes logika (a klasszikus logika szabályai szerint) szerkezetük hierarchikus pl.: Dewey Tizedes Osztályozása, Cutter Kiterjesztõ Osztályozása, az Egyetemes Tizedes Osztályozás, a Library of Congress rendszere, Ranganathan rendszere stb. egy adott kornak a dokumentumokban megjelenő ismérveit tükrözik

!! egy tudományág : egy hely  egy könyv : egy hely !! osztályozáselméleti iskolák 1. tudományfelosztáson alapuló osztályozások korlátaik: szigorú logikai elvek határozzák meg nem lehet átfedés: !! egy tudományág : egy hely  egy könyv : egy hely !! nehézkessé válhatnak /nehezen fejleszthetőek

osztályozáselméleti iskolák 2. nyelvészeti irányzat információkeresõ nyelvek: 20. század elejétõl szavaik: szövegből vett szavak címszó kulcsszó: az információ lényegére jellemzõ, a tartalmi feltárásra alkalmas tárgyszó: a tartalmat röviden, egyértelmûen kifejezõ, természetes nyelvű szó deszkriptor: a legáltalánosabb információkeresõ nyelvi kifejezés nemdeszkriptor: az információk feldolgozására és keresésére közvetlenül nem használható kifejezés osztályozási táblázat, tárgyszójegyzék, tezaurusz: az információkeresõ nyelvek szavai rendszerezett jegyzéke, vagy listája („szótár”)

osztályozáselméleti iskolák 3. statisztikai irányzat matematika szűkebb területeinek felhasználása elméletben és gyakorlatban elvei: alapja a természetes nyelv ennek statisztikai törvényszerűségeit állapítja meg ezek alapján hozza létre osztályait, a klasztereket. számítógépek megjelenése  lehetőség szöveges információk nagy tömegének kezelésére  automatikus osztályozás

az automatizálás mértéke a felhasználás célja az információkereső nyelvek csoportosításának szempontjai: az alkalmazott nyelv módszerek mélység szerkezet tartalom az automatizálás mértéke a felhasználás célja

információkereső nyelvek csoportjai 1. szempont: az alkalmazott nyelv természetes nyelven alapulók szabályozott nyelvű: tárgyszavas, deszkriptoros rendszerek mesterséges nyelvű: ETO

adott dokumentum eredeti szövegéből való kifejezések, ill. információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv természetes nyelvű adott dokumentum eredeti szövegéből való kifejezések, ill. ezek egységesített formája

információkeresõ nyelvek csoportjai 1 információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv természetes nyelvű kulcsszó: átmeneti elem a formai és tartalmi feltárás között (pl. címek tartalmilag releváns szavai) könyvtári rendszerekben: címekben, szerzőségi közlésben előforduló szavak tágabb értelemben származhat a tartalmi feltárásból is csak a (sok esetben ez az alcímek privilégiuma). Peter Luhn: Key-Word-In-Context: a jellemző kifejezések előfordulnak /annál többször, minél lényegesebbek

természetes nyelvű kulcsszavak szabályozása: információkeresõ nyelvek csoportjai 1. 1. szempont: az alkalmazott nyelv szabályozott természetes nyelvű kulcsszavak szabályozása: szóalakok összevonása homonímák megkülönböztetése szinonímák elemzése tárgyszó: egy tárgykört vagy annak részletét a legrövidebben megfogalmazó kifejezés szabványosított természetes nyelvű a dokumentum tartalmi jellemzésére felhasználható lehetővé teszi a tárgyi alapú visszakeresést

információs tezaurusz : információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv szabályozott információs tezaurusz : az osztályozási kifejezések egymás közti (nyelvi/logikai) kapcsolatainak szabályozása fogalmi összefüggéseik feltüntetésével a lexikai egysége a deszkriptor: az információk feltárására és keresésére közvetlenül alkalmazható, tartalmilag kitüntetett kifejezés

a dokumentumok tartalmát kódokkal, szimbólumokkal írja le információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv mesterséges információkereső a dokumentumok tartalmát kódokkal, szimbólumokkal írja le pl. számokkal: Dewey, ETO

mellérendelő alá/fölérendelő információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei mellérendelő alá/fölérendelő

önállóak (kulcsszó, tárgyszó) egymástól függetlenek információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei mellérendelő fogalmai önállóak (kulcsszó, tárgyszó) egymástól függetlenek természetes nyelvűek egy-két szintig bármely kapcsolatot ki tudnak fejezni

az osztályozandó fogalmakat egyetlen egésznek fogják fel információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei hierarchikus az osztályozandó fogalmakat egyetlen egésznek fogják fel a hierarchiát mindig a legáltalánosabb fogalomtól lefelé építik alapjuk filozófiai tudományfelosztás, ezt természetes logikával tovább bontják kifejezik a fogalmak közötti alá/fölérendeltségi összefüggéseket az alá- és fölérendeltséggel kialakított hierarchia-szinteket terminológiailag is megkülönböztetik egymástól: ETO: főosztály, osztály, alosztály, szakcsoport stb.

információkeresõ nyelvek csoportjai 2 információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei hierarchikus újabb szintek beillesztése megoldható az egyes fogalmak részletezhetők a bontások döntési pontok: csak egy felosztást lehet a további bontás alapjának tekinteni  merevek a dokumentumok tartalmának differenciált feltárására nem alkalmasak nem kedveznek a visszakeresésnek

átfogó problémák leírására szolgáló rendszerek információkeresõ nyelvek csoportjai 3. szempont: az osztályozás mélysége generalizáló: átfogó problémák leírására szolgáló rendszerek osztályozási fogalmaik általánosak  deduktív (nemzetközi információcserében, szakterületek speciális információkeresõ nyelveinek összefogásában) individualizáló: mély tartalmi feltárást biztosítanak egyedi információkat írnak le  induktív

információkeresõ nyelvek csoportjai 4. szempont: szerkezet prekoordinált posztkoordinált

az osztályok sorrendje kapcsolatrendszere információkeresõ nyelvek csoportjai 4. szempont: szerkezet prekoordinált: meghatározott az osztályok sorrendje kapcsolatrendszere az osztályozási fogalom helye független a dokumentum tartalmától osztályozási folyamat valamely jelzethez való besorolás a jelzetelemek meghatározott szabályok szerinti összekapcsolása ETO

információkeresõ nyelvek csoportjai 4 információkeresõ nyelvek csoportjai 4. szempont: szerkezet posztkoordinált: a lexikai egységek a dokumentum tartalmától függõen rendelhetõk egymás mellé fogalmak sorrendje elõzetesen nem szabályozott nem kapcsolja össze az ismérveket nincs jelzetalkotás az elemek összekapcsolása a keresés szakaszában jön létre pl. tárgyszavazás

információkeresõ nyelvek csoportjai 5. szempont: tartalom egyetemes speciális

információkeresõ nyelvek csoportjai 5. szempont: tartalom egyetemes felölelik az emberi tudás egészét a különféle szakterületek fogalmait összehangoltan rendezik el.

információkeresõ nyelvek csoportjai 5. szempont: tartalom speciális szakterületi osztályozási rendszerek: egy-egy tudományterület / szakterület / ágazat ismereteit tartalmazzák szakemberek, kutatók sajátos igényeit figyelembe vehetik

nem automatikus: nem használ gépi megoldásokat félautomatikus információkeresõ nyelvek csoportjai 6. szempont: az automatizálás mértéke nem automatikus: nem használ gépi megoldásokat félautomatikus lexikai egységek megállapítása intellektuális úton rendezés és a szelektálás számítógéppel automatikus: géppel történik az osztályozási fogalmak meghatározása csoportosítása

információkeresõ nyelvek csoportjai 7. szempont: a felhasználás célja tudományokat osztályozók (filozófiai, történeti stb.) ismeretközvetítők (könyvtári, bibliográfiai, dokumentációs stb.) ismeretszervezők (kutatási, irányítási stb.).

az osztályozás szintjei: regisztráció  formai leírás adatai alapján határozza meg a tartalmat osztályozás  több szinten: széles besorolás, mélyebb tartalmi feltárás referálás  tartalmi kivonat tömörítés  minden lényeges tartalmi elemet tartalmaz (helyettesíti a dokumentumot) analitikus-szintetikus feltárás  több, hasonló témával foglalkozó dokumentum tartalmi szintézise (pl. szemle, trendtanulmány, döntéselőkészítő prognózis)

osztályozási fogalmak feltártsági mutató: egy dokumentumra eső ismérvek száma kihagyási tényező = eredeti releváns mondatai / kivonat releváns mondatai?? (0 és egy közötti érték) zaj = a kivonat nem releváns mondatainak száma / a kivonat összes mondatának száma (=nem releváns informácók)

osztályozási fogalmak tulajdonságok  azoknak a dolgoknak a köre, amelyekre ez igaz osztályalkotás  hasonló tulajdonságok alapján történő csoportosítás

osztályozási fogalmak fogalom: tárgyakról szóló tudásrendszer fogalom tartalma: ismertetőjegyek együttese fogalom terjedelme = a fogalommal általánosított objektumok összessége (fordított viszony)

osztályozási rendszerek 1. hierarchikus rendszerek Bacon 1605: Instauratio magna (The two books of Francis Bacon on the proficience and advancement of learning divine and human): a tudományos megismerés alapja a tapasztalat az emberi értelem feladata a tapasztalatok feldolgozása, általánosítása három forrás  három emanáció: emlékezet  történelem képzelet  költészet értelem  bölcsészet

osztályozási rendszerek 1. hierarchikus rendszerek Nathaniel B osztályozási rendszerek 1. hierarchikus rendszerek Nathaniel B. Shurtleff 19. század első fele: először használja az osztályozásban tízes számrendszert

osztályozási rendszerek 1. hierarchikus rendszerek Dewey 1885 Dewey Decimal Classifiation = DDC (Tizedes Osztályozás) alapja: filozófiai tudományfelosztás jelzeteit gyakran összekapcsolják a Kongresszusi Könyvtár tárgyszavaival (LCSH) és osztályozási jelzeteivel (LCC) 30 nyelvre fordították le 2000 elején 22 keresőszolgáltatás használta

osztályozási rendszerek 1. hierarchikus rendszerek Dewey jellemzői: gyakorlati jellegű jelzetelés, tizedes törtek használata a tízes számrendszer merev keretei között mechanikus: tíz főosztály tíz-tíz osztály tíz-tíz alosztály

osztályozási rendszerek 1. hierarchikus rendszerek Dewey tudományfelosztás és jelzetek: 100 philosophy and related disciplines 200 religion 300 social sciences 400 language 500 pure sciences 600 technology (applied sciences) 700 arts 800 literature and rhetoric 900 general geography, history, etc

osztályozási rendszerek 1. hierarchikus rendszerek Dewey közös alosztások: formai, nyelvi, földrajzi, irodalmi műfajok (nullával kezdődő számjegyek) a nyelvek jelölése a nyelvészet és az irodalom osztályaiban megegyező számjegyekkel a földrajzi helyek jelölésére külön függelék a hierarchikus táblázat mellett betűrendes mutató (relatív index - a szakrendszer szerves része) 

osztályozási rendszerek 1 osztályozási rendszerek 1. hierarchikus rendszerek Egyetemes Tizedes Osztályozás a fogalmak hasonlóságán és különbözőségén alapul fogalmak alá- és fölérendeltségét fejezi ki mindig a tágabb fogalom alá rendeli a szűkebb fogalmakat Magyarországon a legelterjedtebb osztályozási rendszer a természetes nyelvektől független jelzetek: számjegyekből, írásjelekből, betűkből a tizedes törtek rendszerének szabályai szerint épül fel

átfogó osztályozási rendszer osztályozási rendszerek 1. hierarchikus rendszerek Egyetemes Tizedes Osztályozás átfogó osztályozási rendszer 60 000 osztályból és segédtáblázatokból áll teljes kiadás négy, rövidített 20 nyelven internetes szolgáltatásokban is alkalmazható (2000 elején 11)

a számformátumú jelzeteknek nincsenek nyelvi korlátaik osztályozási rendszerek 1. hierarchikus rendszerek Egyetemes Tizedes Osztályozás kereshetősége a számformátumú jelzeteknek nincsenek nyelvi korlátaik nem felhasználóbarát osztályozó rendszer: fogalmaira az ETO-számok természetes nyelvű feloldásait ismerve lehet keresni a központozások / mellékjelek használata bonyolult

osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás nyelvtanilag szabványosított formájú természetes nyelven alapuló kifejezés a dokumentum, információ lényegének, leírására alkalmas rövid, tömör, egyértelmű

osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás tárgyszóként használhatók: tudományszakok, tudományos elméletek, tudományos problémák, eljárások neve, tudományos szakkifejezések objektumok, élőlények, dolgok nevei tartalmi és formai tulajdonságok megnevezései intézmények, szervezetek, testületek nevei események nevei földrajzi nevek korszakok, időpontok és időtartamok nevei személynevek, alkotások nevei közismert rövidítések

osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás a tárgyszavak formai szabályai: előnyös, ha főnév jelzőt csak szerkezetben lehet használni lehetőleg egyes számban használjuk (kivéve csoportok, gyűjtőfogalmak neveit és a plurale tantum-okat) tárgyszóalkotásnál figyelembe kell venni: a szinonimákat (a rokon értelmű fogalmakat) homonimákat (azonos alakú, de különböző értelmű szavakat)

osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás a tárgyszavak tulajdonságai: pontosan leírják a dokumentumokat egymást szoros betűrendben követik  a formailag hasonló fogalmak kerülnek egymás mellé (lexikonok, szótárak, tárgyszavas könyvkatalógusok) tárgyszókatalógus: a tárgyszavak alapján létrehozott betűrendes katalógus

osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás rendszerező tárgyszavas rendszer: átfogó fogalmak  altárgyszavak az azonos témakörökkel foglalkozó információk egy helyen találhatók rendszerező tárgyszókatalógusok: egy-egy csoporton belüli bontás formai földrajzi időbeli tárgyi szempontok alapján

osztályozási rendszerek 3. tezaurusz a rendszerező tárgyszókatalógusok továbbfejlesztett formái természetes nyelven kifejezett fogalmak szótára tartalmilag szabályozott szükség szerint változtatható a legfontosabb fogalmi összefüggéseket is tartalmazza  hierarchikus elsősorban a számítógépes információkeresésben és -feldolgozásban használatosak

osztályozási rendszerek 3. tezaurusz egy-egy szakterület fogalmai szótár formában adott szókészlet felhasználásával alkotóelemei a deszkriptorok: szabványos nyelvi formában megfogalmazott tárgyszavak tágabb, szűkebb, valamint rokon fogalmaik vannak

osztályozási rendszerek 3. tezaurusz tezaurusz részei főrész lexikai egységei a deszkriptorcikkek (tezauruszcikkek), nemdeszkriptorcikkek vezérdeszkriptor: meghatározza a deszkriptorcikk helyét rá vonatkoznak a deszkriptorcikkben meghatározott relációk szinonimák (H : helyette, helyettesít, helyette is) szakcsoportos / szakrendi részek lexikai egységek betűrendes mutatója