Tartalmi feltárás bevezetés
könyvtári szolgáltatás dokumentum dokumentum dokumentum információ dokumentumok gyűjtése feldolgozás / feltárás dokumentumok rendszerezése könyvtári szolgáltatás felhasználó
megtalálásának biztosítása a feltárás célja: dokumentumok információk nyilvántartása rend(szer)ezése megtalálásának biztosítása
bibliográfiai tétel leíró (bibliográfiai) adatok besorolási adatok a leírás tárgyát képező dokumentum összes feltárt ismérve leíró (bibliográfiai) adatok besorolási adatok tartalmi jellemzők
!!nem különíthető el teljesen egymástól!! feltárás formai bibliográfiai feltárás, címleírás tartalmi tartalmi feltárás / osztályozás / szakozás !!nem különíthető el teljesen egymástól!!
rendszerezés / formai feltárás a dokumentumok formai jellemzőit emeli ki a legalapvetőbb rendezési mód – a betűrendbe sorolás - alapja a sorrend (=besorolás) alapja a rendszó
rendszerezés / formai feltárás rendszó: a besorolás alapjául szolgáló szó a mű szerzőjének (szerkesztőjének, egyéb közreműködőjének) a neve a mű címe a közreadó intézmény neve betűrend: könyvtári katalógusok (betűrendes / tárgyszó) lexikonok, enciklopédiák, szótárak tárgy- és névmutatók
rendszerezés / tartalmi feltárás lehetővé teszi a dokumentumok tartalmuk alapján való visszakeresését egy témával kapcsolatos dokumentumok összegyűjtését azonos témájú dokumentumok csoportosítását a kialakított dokumentum-csoportok rendezését egyedi tartalmi informácók leírását szisztematikus katalógusok szerkesztését a lekérdezést, böngészést
eszköze az osztályozási nyelv információkereső nyelv módszer tevékenység szakozás eszköze az osztályozási nyelv információkereső nyelv
osztályozási nyelv rendszer az ismeretek szervezésének egyik módszere a dokumentumok tartalmának meghatározására ismertetőjegyek szerinti beosztására alapja: az ismeretek fogalmi felosztása a köztük lévő kapcsolatok feltárása Pl. ETO, tezaurusz stb (szakozás) az ismeretek szervezésének egyik módszere a dokumentumtárolás része
osztályozáselméleti iskolák tudományfelosztáson alapuló nyelvészeti statisztikai
szerkezetük hierarchikus osztályozáselméleti iskolák 1. tudományfelosztáson alapuló osztályozások jellemzőik: filozófiai tudományfelosztás + természetes logika (a klasszikus logika szabályai szerint) szerkezetük hierarchikus pl.: Dewey Tizedes Osztályozása, Cutter Kiterjesztõ Osztályozása, az Egyetemes Tizedes Osztályozás, a Library of Congress rendszere, Ranganathan rendszere stb. egy adott kornak a dokumentumokban megjelenő ismérveit tükrözik
!! egy tudományág : egy hely egy könyv : egy hely !! osztályozáselméleti iskolák 1. tudományfelosztáson alapuló osztályozások korlátaik: szigorú logikai elvek határozzák meg nem lehet átfedés: !! egy tudományág : egy hely egy könyv : egy hely !! nehézkessé válhatnak /nehezen fejleszthetőek
osztályozáselméleti iskolák 2. nyelvészeti irányzat információkeresõ nyelvek: 20. század elejétõl szavaik: szövegből vett szavak címszó kulcsszó: az információ lényegére jellemzõ, a tartalmi feltárásra alkalmas tárgyszó: a tartalmat röviden, egyértelmûen kifejezõ, természetes nyelvű szó deszkriptor: a legáltalánosabb információkeresõ nyelvi kifejezés nemdeszkriptor: az információk feldolgozására és keresésére közvetlenül nem használható kifejezés osztályozási táblázat, tárgyszójegyzék, tezaurusz: az információkeresõ nyelvek szavai rendszerezett jegyzéke, vagy listája („szótár”)
osztályozáselméleti iskolák 3. statisztikai irányzat matematika szűkebb területeinek felhasználása elméletben és gyakorlatban elvei: alapja a természetes nyelv ennek statisztikai törvényszerűségeit állapítja meg ezek alapján hozza létre osztályait, a klasztereket. számítógépek megjelenése lehetőség szöveges információk nagy tömegének kezelésére automatikus osztályozás
az automatizálás mértéke a felhasználás célja az információkereső nyelvek csoportosításának szempontjai: az alkalmazott nyelv módszerek mélység szerkezet tartalom az automatizálás mértéke a felhasználás célja
információkereső nyelvek csoportjai 1. szempont: az alkalmazott nyelv természetes nyelven alapulók szabályozott nyelvű: tárgyszavas, deszkriptoros rendszerek mesterséges nyelvű: ETO
adott dokumentum eredeti szövegéből való kifejezések, ill. információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv természetes nyelvű adott dokumentum eredeti szövegéből való kifejezések, ill. ezek egységesített formája
információkeresõ nyelvek csoportjai 1 információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv természetes nyelvű kulcsszó: átmeneti elem a formai és tartalmi feltárás között (pl. címek tartalmilag releváns szavai) könyvtári rendszerekben: címekben, szerzőségi közlésben előforduló szavak tágabb értelemben származhat a tartalmi feltárásból is csak a (sok esetben ez az alcímek privilégiuma). Peter Luhn: Key-Word-In-Context: a jellemző kifejezések előfordulnak /annál többször, minél lényegesebbek
természetes nyelvű kulcsszavak szabályozása: információkeresõ nyelvek csoportjai 1. 1. szempont: az alkalmazott nyelv szabályozott természetes nyelvű kulcsszavak szabályozása: szóalakok összevonása homonímák megkülönböztetése szinonímák elemzése tárgyszó: egy tárgykört vagy annak részletét a legrövidebben megfogalmazó kifejezés szabványosított természetes nyelvű a dokumentum tartalmi jellemzésére felhasználható lehetővé teszi a tárgyi alapú visszakeresést
információs tezaurusz : információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv szabályozott információs tezaurusz : az osztályozási kifejezések egymás közti (nyelvi/logikai) kapcsolatainak szabályozása fogalmi összefüggéseik feltüntetésével a lexikai egysége a deszkriptor: az információk feltárására és keresésére közvetlenül alkalmazható, tartalmilag kitüntetett kifejezés
a dokumentumok tartalmát kódokkal, szimbólumokkal írja le információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv mesterséges információkereső a dokumentumok tartalmát kódokkal, szimbólumokkal írja le pl. számokkal: Dewey, ETO
mellérendelő alá/fölérendelő információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei mellérendelő alá/fölérendelő
önállóak (kulcsszó, tárgyszó) egymástól függetlenek információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei mellérendelő fogalmai önállóak (kulcsszó, tárgyszó) egymástól függetlenek természetes nyelvűek egy-két szintig bármely kapcsolatot ki tudnak fejezni
az osztályozandó fogalmakat egyetlen egésznek fogják fel információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei hierarchikus az osztályozandó fogalmakat egyetlen egésznek fogják fel a hierarchiát mindig a legáltalánosabb fogalomtól lefelé építik alapjuk filozófiai tudományfelosztás, ezt természetes logikával tovább bontják kifejezik a fogalmak közötti alá/fölérendeltségi összefüggéseket az alá- és fölérendeltséggel kialakított hierarchia-szinteket terminológiailag is megkülönböztetik egymástól: ETO: főosztály, osztály, alosztály, szakcsoport stb.
információkeresõ nyelvek csoportjai 2 információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei hierarchikus újabb szintek beillesztése megoldható az egyes fogalmak részletezhetők a bontások döntési pontok: csak egy felosztást lehet a további bontás alapjának tekinteni merevek a dokumentumok tartalmának differenciált feltárására nem alkalmasak nem kedveznek a visszakeresésnek
átfogó problémák leírására szolgáló rendszerek információkeresõ nyelvek csoportjai 3. szempont: az osztályozás mélysége generalizáló: átfogó problémák leírására szolgáló rendszerek osztályozási fogalmaik általánosak deduktív (nemzetközi információcserében, szakterületek speciális információkeresõ nyelveinek összefogásában) individualizáló: mély tartalmi feltárást biztosítanak egyedi információkat írnak le induktív
információkeresõ nyelvek csoportjai 4. szempont: szerkezet prekoordinált posztkoordinált
az osztályok sorrendje kapcsolatrendszere információkeresõ nyelvek csoportjai 4. szempont: szerkezet prekoordinált: meghatározott az osztályok sorrendje kapcsolatrendszere az osztályozási fogalom helye független a dokumentum tartalmától osztályozási folyamat valamely jelzethez való besorolás a jelzetelemek meghatározott szabályok szerinti összekapcsolása ETO
információkeresõ nyelvek csoportjai 4 információkeresõ nyelvek csoportjai 4. szempont: szerkezet posztkoordinált: a lexikai egységek a dokumentum tartalmától függõen rendelhetõk egymás mellé fogalmak sorrendje elõzetesen nem szabályozott nem kapcsolja össze az ismérveket nincs jelzetalkotás az elemek összekapcsolása a keresés szakaszában jön létre pl. tárgyszavazás
információkeresõ nyelvek csoportjai 5. szempont: tartalom egyetemes speciális
információkeresõ nyelvek csoportjai 5. szempont: tartalom egyetemes felölelik az emberi tudás egészét a különféle szakterületek fogalmait összehangoltan rendezik el.
információkeresõ nyelvek csoportjai 5. szempont: tartalom speciális szakterületi osztályozási rendszerek: egy-egy tudományterület / szakterület / ágazat ismereteit tartalmazzák szakemberek, kutatók sajátos igényeit figyelembe vehetik
nem automatikus: nem használ gépi megoldásokat félautomatikus információkeresõ nyelvek csoportjai 6. szempont: az automatizálás mértéke nem automatikus: nem használ gépi megoldásokat félautomatikus lexikai egységek megállapítása intellektuális úton rendezés és a szelektálás számítógéppel automatikus: géppel történik az osztályozási fogalmak meghatározása csoportosítása
információkeresõ nyelvek csoportjai 7. szempont: a felhasználás célja tudományokat osztályozók (filozófiai, történeti stb.) ismeretközvetítők (könyvtári, bibliográfiai, dokumentációs stb.) ismeretszervezők (kutatási, irányítási stb.).
az osztályozás szintjei: regisztráció formai leírás adatai alapján határozza meg a tartalmat osztályozás több szinten: széles besorolás, mélyebb tartalmi feltárás referálás tartalmi kivonat tömörítés minden lényeges tartalmi elemet tartalmaz (helyettesíti a dokumentumot) analitikus-szintetikus feltárás több, hasonló témával foglalkozó dokumentum tartalmi szintézise (pl. szemle, trendtanulmány, döntéselőkészítő prognózis)
osztályozási fogalmak feltártsági mutató: egy dokumentumra eső ismérvek száma kihagyási tényező = eredeti releváns mondatai / kivonat releváns mondatai?? (0 és egy közötti érték) zaj = a kivonat nem releváns mondatainak száma / a kivonat összes mondatának száma (=nem releváns informácók)
osztályozási fogalmak tulajdonságok azoknak a dolgoknak a köre, amelyekre ez igaz osztályalkotás hasonló tulajdonságok alapján történő csoportosítás
osztályozási fogalmak fogalom: tárgyakról szóló tudásrendszer fogalom tartalma: ismertetőjegyek együttese fogalom terjedelme = a fogalommal általánosított objektumok összessége (fordított viszony)
osztályozási rendszerek 1. hierarchikus rendszerek Bacon 1605: Instauratio magna (The two books of Francis Bacon on the proficience and advancement of learning divine and human): a tudományos megismerés alapja a tapasztalat az emberi értelem feladata a tapasztalatok feldolgozása, általánosítása három forrás három emanáció: emlékezet történelem képzelet költészet értelem bölcsészet
osztályozási rendszerek 1. hierarchikus rendszerek Nathaniel B osztályozási rendszerek 1. hierarchikus rendszerek Nathaniel B. Shurtleff 19. század első fele: először használja az osztályozásban tízes számrendszert
osztályozási rendszerek 1. hierarchikus rendszerek Dewey 1885 Dewey Decimal Classifiation = DDC (Tizedes Osztályozás) alapja: filozófiai tudományfelosztás jelzeteit gyakran összekapcsolják a Kongresszusi Könyvtár tárgyszavaival (LCSH) és osztályozási jelzeteivel (LCC) 30 nyelvre fordították le 2000 elején 22 keresőszolgáltatás használta
osztályozási rendszerek 1. hierarchikus rendszerek Dewey jellemzői: gyakorlati jellegű jelzetelés, tizedes törtek használata a tízes számrendszer merev keretei között mechanikus: tíz főosztály tíz-tíz osztály tíz-tíz alosztály
osztályozási rendszerek 1. hierarchikus rendszerek Dewey tudományfelosztás és jelzetek: 100 philosophy and related disciplines 200 religion 300 social sciences 400 language 500 pure sciences 600 technology (applied sciences) 700 arts 800 literature and rhetoric 900 general geography, history, etc
osztályozási rendszerek 1. hierarchikus rendszerek Dewey közös alosztások: formai, nyelvi, földrajzi, irodalmi műfajok (nullával kezdődő számjegyek) a nyelvek jelölése a nyelvészet és az irodalom osztályaiban megegyező számjegyekkel a földrajzi helyek jelölésére külön függelék a hierarchikus táblázat mellett betűrendes mutató (relatív index - a szakrendszer szerves része)
osztályozási rendszerek 1 osztályozási rendszerek 1. hierarchikus rendszerek Egyetemes Tizedes Osztályozás a fogalmak hasonlóságán és különbözőségén alapul fogalmak alá- és fölérendeltségét fejezi ki mindig a tágabb fogalom alá rendeli a szűkebb fogalmakat Magyarországon a legelterjedtebb osztályozási rendszer a természetes nyelvektől független jelzetek: számjegyekből, írásjelekből, betűkből a tizedes törtek rendszerének szabályai szerint épül fel
átfogó osztályozási rendszer osztályozási rendszerek 1. hierarchikus rendszerek Egyetemes Tizedes Osztályozás átfogó osztályozási rendszer 60 000 osztályból és segédtáblázatokból áll teljes kiadás négy, rövidített 20 nyelven internetes szolgáltatásokban is alkalmazható (2000 elején 11)
a számformátumú jelzeteknek nincsenek nyelvi korlátaik osztályozási rendszerek 1. hierarchikus rendszerek Egyetemes Tizedes Osztályozás kereshetősége a számformátumú jelzeteknek nincsenek nyelvi korlátaik nem felhasználóbarát osztályozó rendszer: fogalmaira az ETO-számok természetes nyelvű feloldásait ismerve lehet keresni a központozások / mellékjelek használata bonyolult
osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás nyelvtanilag szabványosított formájú természetes nyelven alapuló kifejezés a dokumentum, információ lényegének, leírására alkalmas rövid, tömör, egyértelmű
osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás tárgyszóként használhatók: tudományszakok, tudományos elméletek, tudományos problémák, eljárások neve, tudományos szakkifejezések objektumok, élőlények, dolgok nevei tartalmi és formai tulajdonságok megnevezései intézmények, szervezetek, testületek nevei események nevei földrajzi nevek korszakok, időpontok és időtartamok nevei személynevek, alkotások nevei közismert rövidítések
osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás a tárgyszavak formai szabályai: előnyös, ha főnév jelzőt csak szerkezetben lehet használni lehetőleg egyes számban használjuk (kivéve csoportok, gyűjtőfogalmak neveit és a plurale tantum-okat) tárgyszóalkotásnál figyelembe kell venni: a szinonimákat (a rokon értelmű fogalmakat) homonimákat (azonos alakú, de különböző értelmű szavakat)
osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás a tárgyszavak tulajdonságai: pontosan leírják a dokumentumokat egymást szoros betűrendben követik a formailag hasonló fogalmak kerülnek egymás mellé (lexikonok, szótárak, tárgyszavas könyvkatalógusok) tárgyszókatalógus: a tárgyszavak alapján létrehozott betűrendes katalógus
osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás rendszerező tárgyszavas rendszer: átfogó fogalmak altárgyszavak az azonos témakörökkel foglalkozó információk egy helyen találhatók rendszerező tárgyszókatalógusok: egy-egy csoporton belüli bontás formai földrajzi időbeli tárgyi szempontok alapján
osztályozási rendszerek 3. tezaurusz a rendszerező tárgyszókatalógusok továbbfejlesztett formái természetes nyelven kifejezett fogalmak szótára tartalmilag szabályozott szükség szerint változtatható a legfontosabb fogalmi összefüggéseket is tartalmazza hierarchikus elsősorban a számítógépes információkeresésben és -feldolgozásban használatosak
osztályozási rendszerek 3. tezaurusz egy-egy szakterület fogalmai szótár formában adott szókészlet felhasználásával alkotóelemei a deszkriptorok: szabványos nyelvi formában megfogalmazott tárgyszavak tágabb, szűkebb, valamint rokon fogalmaik vannak
osztályozási rendszerek 3. tezaurusz tezaurusz részei főrész lexikai egységei a deszkriptorcikkek (tezauruszcikkek), nemdeszkriptorcikkek vezérdeszkriptor: meghatározza a deszkriptorcikk helyét rá vonatkoznak a deszkriptorcikkben meghatározott relációk szinonimák (H : helyette, helyettesít, helyette is) szakcsoportos / szakrendi részek lexikai egységek betűrendes mutatója