Tartalmi feltárás bevezetés
könyvtári szolgáltatás dokumentum dokumentum dokumentum információ dokumentumok gyűjtése feldolgozás / feltárás dokumentumok rendszerezése könyvtári szolgáltatás felhasználó
megtalálásának biztosítása a feltárás célja: dokumentumok információk nyilvántartása rend(szer)ezése megtalálásának biztosítása
bibliográfiai tétel leíró (bibliográfiai) adatok besorolási adatok a leírás tárgyát képező dokumentum összes feltárt ismérve leíró (bibliográfiai) adatok besorolási adatok tartalmi jellemzők
!!nem különíthető el teljesen egymástól!! feltárás formai bibliográfiai feltárás, címleírás tartalmi tartalmi feltárás / osztályozás / szakozás !!nem különíthető el teljesen egymástól!!
rendszerezés / formai feltárás a dokumentumok formai jellemzőit emeli ki a legalapvetőbb rendezési mód – a betűrendbe sorolás - alapja
rendszerezés / formai feltárás rendszó: a besorolás alapjául szolgáló szó a mű szerzőjének (szerkesztőjének, egyéb közreműködőjének) a neve a mű címe a közreadó intézmény neve betűrend: könyvtári katalógusok (betűrendes / tárgyszó) lexikonok, enciklopédiák, szótárak tárgy- és névmutatók
rendszerezés / tartalmi feltárás tartalmi ismérvek, ismertetőjegyek megállapítása szakozás, osztályozás: csoportképzés az azonos tulajdonságok alapján csoportok megkülönböztetése a különbségek alapján eszköze az osztályozási (információkereső) nyelv
osztályozási nyelv rendszer az ismeretek szervezésének egyik módszere a dokumentum / információ tartalmának meghatározására a dokumentumok / információk ismertetőjegyek szerinti rendszerezésére alapja: az ismeretek fogalmi felosztása (tudományfelosztás) a köztük lévő kapcsolatok feltárása (ETO, tezaurusz) az ismeretek szervezésének egyik módszere a dokumentumtárolás része
osztályozási nyelv szavai: szövegszó címszó kulcsszó: tartalmi feltárásra alkalmas szövegszó tárgyszó: szabványosított kifejezés deszkriptor (- nemdeszkriptor): információkereső nyelvi kifejezés szimbólum
rendszerezés / tartalmi feltárás lehetővé teszi a dokumentumok tartalmuk alapján való visszakeresését egy témával kapcsolatos dokumentumok összegyűjtését azonos témájú dokumentumok csoportosítását a kialakított dokumentum-csoportok rendezését egyedi tartalmi informácók leírását szisztematikus katalógusok szerkesztését a lekérdezést, böngészést
osztályozáselméleti iskolák tudományfelosztáson alapuló nyelvészeti statisztikai
szerkezetük hierarchikus osztályozáselméleti iskolák 1. tudományfelosztáson alapuló osztályozások jellemzőik: filozófiai tudományfelosztás + természetes logika (a klasszikus logika szabályai szerint) szerkezetük hierarchikus Dewey tizedes osztályozása, Cutter kiterjesztő osztályozása, Egyetemes Tizedes Osztályozás, Library of Congress rendszere, Ranganathan rendszere stb. egy adott kornak a dokumentumokban megjelenő ismérveit tükrözik
!! egy tudományág : egy hely osztályozáselméleti iskolák 1. tudományfelosztáson alapuló osztályozások korlátaik: szigorú logikai elvek határozzák meg nem lehet átfedés: !! egy tudományág : egy hely egy könyv : egy hely !! nehézkessé válhatnak /nehezen fejleszthetőek
osztályozáselméleti iskolák 2. nyelvészeti irányzat információkeresõ nyelvek: 20. század elejétõl szavaik: szövegből vett szavak címszó kulcsszó: az információ lényegére jellemzõ, a tartalmi feltárásra alkalmas tárgyszó: a tartalmat röviden, egyértelmûen kifejezõ, természetes nyelvű szó deszkriptor: a legáltalánosabb információkeresõ nyelvi kifejezés nemdeszkriptor: az információk feldolgozására és keresésére közvetlenül nem használható kifejezés osztályozási táblázat, tárgyszójegyzék, tezaurusz: az információkeresõ nyelvek szavai rendszerezett jegyzéke, vagy listája („szótár”)
osztályozáselméleti iskolák 3. statisztikai irányzat matematika szűkebb területeinek felhasználása elméletben és gyakorlatban elvei: alapja a természetes nyelv ennek statisztikai törvényszerűségeit állapítja meg ezek alapján hozza létre osztályait, a klasztereket. számítógépek megjelenése lehetőség szöveges információk nagy tömegének kezelésére automatikus osztályozás
az automatizálás mértéke a felhasználás célja az információkereső nyelvek csoportosításának szempontjai: az alkalmazott nyelv módszerek mélység szerkezet tartalom az automatizálás mértéke a felhasználás célja
információkereső nyelvek csoportjai 1. szempont: az alkalmazott nyelv természetes nyelven alapulók szabályozott nyelvű: tárgyszavas, deszkriptoros rendszerek mesterséges nyelvű: ETO
adott dokumentum eredeti szövegéből való kifejezések, ill. információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv természetes adott dokumentum eredeti szövegéből való kifejezések, ill. ezek egységesített formája
információkeresõ nyelvek csoportjai 1 információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv természetes kulcsszó: átmeneti elem a formai és tartalmi feltárás között (pl. címek tartalmilag releváns szavai) könyvtári rendszerekben: címekben, szerzőségi közlésben előforduló szavak tágabb értelemben: tartalmi feltárásból (alcímek) Peter Luhn: Key-Word-In-Context: a jellemző kifejezések előfordulnak /annál többször, minél lényegesebbek
természetes nyelvű kulcsszavak szabályozása: információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv szabályozott természetes nyelvű kulcsszavak szabályozása: szóalakok összevonása homonímák megkülönböztetése szinonímák elemzése tárgyszó: egy tárgykört vagy annak részletét a legrövidebben megfogalmazó kifejezés szabványosított természetes nyelvű a dokumentum tartalmi jellemzésére felhasználható lehetővé teszi a tárgyi alapú visszakeresést
információs tezaurusz : információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv szabályozott információs tezaurusz : az osztályozási kifejezések egymás közti (nyelvi/logikai) kapcsolatainak szabályozása fogalmi összefüggéseik feltüntetésével a lexikai egysége a deszkriptor: az információk feltárására és keresésére közvetlenül alkalmazható, tartalmilag kitüntetett kifejezés
a dokumentumok tartalmát kódokkal, szimbólumokkal írja le információkeresõ nyelvek csoportjai 1. szempont: az alkalmazott nyelv mesterséges információkereső a dokumentumok tartalmát kódokkal, szimbólumokkal írja le pl. számokkal: Dewey, ETO
mellérendelő alá/fölérendelő információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei mellérendelő alá/fölérendelő
önállóak (kulcsszó, tárgyszó) egymástól függetlenek információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei mellérendelő a nyelv fogalmai önállóak (kulcsszó, tárgyszó) egymástól függetlenek természetes nyelvűek egy-két szintig bármely kapcsolatot ki tudnak fejezni
az osztályozandó fogalmak: egyetlen egész információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei hierarchikus az osztályozandó fogalmak: egyetlen egész hierarchia: a legáltalánosabb fogalomtól lefelé alapjuk: filozófiai tudományfelosztás további bontás: természetes logikával a fogalmak közötti alá/fölérendeltségi összefüggések kifejezése az alá- és fölérendeltséggel kialakított hierarchia-szinteket terminológiailag is megkülönböztetik egymástól: ETO: főosztály, osztály, alosztály, szakcsoport stb.
információkeresõ nyelvek csoportjai 2 információkeresõ nyelvek csoportjai 2. szempont: az osztályozás módszerei hierarchikus újabb szintek beillesztése megoldható az egyes fogalmak részletezhetők a bontások döntési pontok: csak egy felosztást lehet a további bontás alapjának tekinteni merevek a dokumentumok tartalmának differenciált feltárására nem alkalmasak nem kedveznek a visszakeresésnek
átfogó problémák leírására szolgáló rendszerek információkeresõ nyelvek csoportjai 3. szempont: az osztályozás mélysége generalizáló: átfogó problémák leírására szolgáló rendszerek osztályozási fogalmaik általánosak deduktív (nemzetközi információcserében, szakterületek speciális információkeresõ nyelveinek összefogásában) individualizáló: mély tartalmi feltárást biztosítanak egyedi információkat írnak le induktív
információkeresõ nyelvek csoportjai 4. szempont: szerkezet prekoordinált posztkoordinált
független a dokumentum tartalmától osztályozási folyamat információkeresõ nyelvek csoportjai 4. szempont: szerkezet prekoordinált: meghatározott az osztályok sorrendje kapcsolatrendszere az osztályozási fogalom helye független a dokumentum tartalmától osztályozási folyamat valamely jelzethez való besorolás a jelzetelemek meghatározott szabályok szerinti összekapcsolása ETO
információkeresõ nyelvek csoportjai 4 információkeresõ nyelvek csoportjai 4. szempont: szerkezet posztkoordinált: a lexikai egységek a dokumentum tartalmától függõen rendelhetõk egymás mellé fogalmak sorrendje elõzetesen nem szabályozott nem kapcsolja össze az ismérveket nincs jelzetalkotás az elemek összekapcsolása a keresés szakaszában jön létre pl. tárgyszavazás
információkeresõ nyelvek csoportjai 5. szempont: tartalom egyetemes speciális
információkeresõ nyelvek csoportjai 5. szempont: tartalom egyetemes felölelik az emberi tudás egészét a különféle szakterületek fogalmait összehangoltan rendezik el.
információkeresõ nyelvek csoportjai 5. szempont: tartalom speciális szakterületi osztályozási rendszerek: egy-egy tudományterület / szakterület / ágazat ismereteit tartalmazzák szakemberek, kutatók sajátos igényeit is figyelembe vehetik
nem automatikus: nem használ gépi megoldásokat félautomatikus információkeresõ nyelvek csoportjai 6. szempont: az automatizálás mértéke nem automatikus: nem használ gépi megoldásokat félautomatikus lexikai egységek megállapítása intellektuális úton rendezés és a szelektálás számítógéppel automatikus: géppel történik az osztályozási fogalmak meghatározása csoportosítása
információkeresõ nyelvek csoportjai 7. szempont: a felhasználás célja tudományokat osztályozók (filozófiai, történeti stb.) ismeretközvetítők (könyvtári, bibliográfiai, dokumentációs stb.) ismeretszervezők (kutatási, irányítási stb.).
az osztályozás szintjei: regisztráció formai leírás adatai alapján határozza meg a tartalmat tartalmi feltárás a dokumentum formai jegyeinél mélyebb referálás tartalmi kivonat tömörítés minden lényeges tartalmi elemet tartalmaz (helyettesíti a dokumentumot) analitikus-szintetikus feltárás több, hasonló témával foglalkozó dokumentum tartalmi szintézise (pl. szemle, trendtanulmány, döntéselőkészítő prognózis)
osztályozási fogalmak fogalom: tárgyakról szóló tudásrendszer fogalom tartalma: ismertetőjegyek együttese fogalom terjedelme = a fogalommal általánosított objektumok összessége F O R D Í T O V I S Z N Y
osztályozási rendszerek 1. hierarchikus rendszerek Bacon 1605: Instauratio magna (The two books of Francis Bacon on the proficience and advancement of learning divine and human): a tudományos megismerés alapja a tapasztalat az emberi értelem feladata a tapasztalatok feldolgozása, általánosítása három forrás három emanáció: emlékezet történelem képzelet költészet értelem bölcsészet
osztályozási rendszerek 1. hierarchikus rendszerek Nathaniel B osztályozási rendszerek 1. hierarchikus rendszerek Nathaniel B. Shurtleff 19. század első fele: először használja az osztályozásban tízes számrendszert
osztályozási rendszerek 1. hierarchikus rendszerek Dewey 1885 Dewey Decimal Classifiation = DDC (Tizedes Osztályozás) alapja: filozófiai tudományfelosztás jelzeteit gyakran összekapcsolják a Kongresszusi Könyvtár tárgyszavaival (LCSH) és osztályozási jelzeteivel (LCC) 30 nyelvre fordították le 2000 elején 22 keresőszolgáltatás használta
osztályozási rendszerek 1. hierarchikus rendszerek Dewey jellemzői: gyakorlati jellegű jelzetelés, tizedes törtek használata a tízes számrendszer merev keretei között mechanikus: tíz főosztály tíz-tíz osztály tíz-tíz alosztály
osztályozási rendszerek 1. hierarchikus rendszerek Dewey tudományfelosztás és jelzetek: 100 philosophy and related disciplines 200 religion 300 social sciences 400 language 500 pure sciences 600 technology (applied sciences) 700 arts 800 literature and rhetoric 900 general geography, history, etc
osztályozási rendszerek 1. hierarchikus rendszerek Dewey közös alosztások: formai, nyelvi, földrajzi, irodalmi műfajok (nullával kezdődő számjegyek) a nyelvek jelölése a nyelvészet és az irodalom osztályaiban megegyező számjegyekkel a földrajzi helyek jelölésére külön függelék a hierarchikus táblázat mellett betűrendes mutató (relatív index - a szakrendszer szerves része)
osztályozási rendszerek 1 osztályozási rendszerek 1. hierarchikus rendszerek Egyetemes Tizedes Osztályozás a fogalmak hasonlóságán és különbözőségén alapul fogalmak alá- és fölérendeltségét fejezi ki mindig a tágabb fogalom alá rendeli a szűkebb fogalmakat Magyarországon a legelterjedtebb osztályozási rendszer a természetes nyelvektől független jelzetek: számjegyekből, írásjelekből, betűkből a tizedestörtek rendszerének szabályai szerint épül fel
átfogó osztályozási rendszer osztályozási rendszerek 1. hierarchikus rendszerek Egyetemes Tizedes Osztályozás átfogó osztályozási rendszer 60 000 osztályból és segédtáblázatokból áll teljes kiadás négy, rövidített 20 nyelven internetes szolgáltatásokban is alkalmazható
a számformátumú jelzeteknek nincsenek nyelvi korlátaik osztályozási rendszerek 1. hierarchikus rendszerek Egyetemes Tizedes Osztályozás kereshetősége a számformátumú jelzeteknek nincsenek nyelvi korlátaik nem felhasználóbarát osztályozó rendszer: fogalmaira az ETO-számok természetes nyelvű feloldásait ismerve lehet keresni a központozások / mellékjelek használata bonyolult
osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás nyelvtanilag szabványosított formájú, természetes nyelven alapuló kifejezés a dokumentum, információ lényegének, leírására alkalmas rövid, tömör, egyértelmű
osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás tárgyszóként használhatók: tudományszakok, tudományos elméletek, tudományos problémák, eljárások neve, tudományos szakkifejezések objektumok, élőlények, dolgok nevei tartalmi és formai tulajdonságok megnevezései intézmények, szervezetek, testületek nevei események nevei földrajzi nevek korszakok, időpontok és időtartamok nevei személynevek, alkotások nevei közismert rövidítések
osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás a tárgyszavak formai szabályai: előnyös, ha főnév jelzőt csak szerkezetben lehet használni lehetőleg egyes számban használjuk (kivéve csoportok, gyűjtőfogalmak neveit és a plurale tantum-okat) tárgyszóalkotásnál figyelembe kell venni: a szinonimákat (a rokon értelmű fogalmakat) homonimákat (azonos alakú, de különböző értelmű szavakat)
osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás a tárgyszavak tulajdonságai: pontosan leírják a dokumentumokat egymást szoros betűrendben követik a formailag hasonló fogalmak kerülnek egymás mellé (lexikonok, szótárak, tárgyszavas könyvkatalógusok) tárgyszókatalógus: a tárgyszavak alapján létrehozott betűrendes katalógus
osztályozási rendszerek 2. mellérendelő (tárgyszavas) osztályozás rendszerező tárgyszavas rendszer: átfogó fogalmak altárgyszavak az azonos témakörökkel foglalkozó információk egy helyen találhatók rendszerező tárgyszókatalógusok: egy-egy csoporton belüli bontás formai földrajzi időbeli tárgyi szempontok alapján
osztályozási rendszerek 3. tezaurusz a rendszerező tárgyszókatalógusok továbbfejlesztett formái természetes nyelven kifejezett fogalmak szótára tartalmilag szabályozott szükség szerint változtatható a legfontosabb fogalmi összefüggéseket is tartalmazza hierarchikus
osztályozási rendszerek 3. tezaurusz egy-egy szakterület fogalmai szótár formában adott szókészlet felhasználásával alkotóelemei a deszkriptorok: szabványos nyelvi formában megfogalmazott tárgyszavak tágabb, szűkebb, valamint rokon fogalmaik vannak
osztályozási rendszerek 3. tezaurusz tezaurusz részei főrész lexikai egységei deszkriptorcikkek (tezauruszcikkek), nemdeszkriptorcikkek vezérdeszkriptor: meghatározza a deszkriptorcikk helyét rá vonatkoznak a deszkriptorcikkben meghatározott relációk szinonimák (H : helyette, helyettesít, helyette is) szakcsoportos / szakrendi részek lexikai egységek betűrendes mutatója