A természetes nyelvű tartalmi feltárás

Slides:



Advertisements
Hasonló előadás
Számítógépes katalógusok
Advertisements

Keresés a számítógépes katalógusokban
Tamás Kincső, OSZK, Analitikus Feldolgozó Osztály, osztályvezető A részdokumentumok szolgáltatása az ELDORADO-ban ELDORADO konferencia a partnerkönyvtárakkal.
AZ EPICT TANÁRTOVÁBBKÉPZÉS HATÁSVIZSGÁLATA IKT-METRIA FELVÉTELEK ALAPJÁN Az IKT-metria mérőeszköz.
„Esélyteremtés és értékalakulás” Konferencia Megyeháza Kaposvár, 2009
ADATBÁZISOK.
Weblap szerkesztés HTML oldal felépítése Nyitó tag Záró tag Nyitó tag Záró tag oldalfej tözs.
Erőállóképesség mérése Találjanak teszteket az irodalomban
ETO kereshetőségének és böngészhetőségének problémái az ALEPH-ben
Szemiot i ka.
Dömsödy Andrea ELTE PPK szeptember 18.
Humánkineziológia szak
Könyvtár- és informatikai alapismeretek Tematikus információforrások
Osztályozási rendszerek, információkereső nyelvek I
Online Katalógus aleph.nyf.hu.
Műveletek logaritmussal
Táblázat kezelő programok
Általános könyvtárismeret
INFORMATIKA KÖNYVTÁRHASZNÁLATI TÉMAKÖR II.
Tartalmi feltárás II. tárgyszavazás
A számítógépes nyelvfeldolgozás alapjai
A hatékony információkeresés alapjai
Tartalmi feltárás bevezetés.
Tűrések, illesztések Áll: 34 diából.
Könyvtárhasználat.
Besorolási rekordok adatcsere formátuma
Műszaki tudományok az interneten
A könyvtárak és a könyvek osztályozása
6. Előadás Merevítő rendszerek típusok, szerepük a tervezésben
Darupályák tervezésének alapjai
DRAGON BALL GT dbzgtlink féle változat! Illesztett, ráégetett, sárga felirattal! Japan és Angol Navigáláshoz használd a bal oldali léptető elemeket ! Verzio.
dr. Szalkai István Pannon Egyetem, Veszprém
A szócikk.
Szótárak: fajták és tipologizálás
szakmérnök hallgatók számára
A háború és a modern fegyveres erő
Adatszerkezetek 1. előadás
Szemantikus keresők.
Ebsco adatbázisok Koltay Klára 2006/ félév.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Tartalmi feltárás bevezetés.
Tárgyszórendszer tárgyszavas osztályozás feladata: a tematikailag összetartozó dokumentumok leírása csoportosítása.
A világ dokumentumtermésének az összegyűjtéséhez (20.század 2. fele)
Készítette: Gocsál Ákos, Gocsál Klára, Fehér Péter 1 A program megvalósulását az Apertus Közalapítvány támogatta. Internet az oktatásban – taneszközök.
Csurik Magda Országos Tisztifőorvosi Hivatal
Szaknyelvi és terminológiai ismeretek SZTE 2010 Kiss Gábor TINTA Könyvkiadó, kissgabo kukac tintakiado pont hu.
2006. május 15P2P hálózatok 1 Fóliák a vizsgára: 1. előadás  Bevezető: 11-16, 21,  Usenet: előadás:  Bevezető: 3-8  Napster: 
Adatbázis kezelés. Az adatbázis tágabb értelemben egy olyan adathalmaz, amelynek elemei – egy meghatározott tulajdonságuk alapján – összetartozónak tekinthetők.
A tezaurusz alkalmazása a BME- OMIKK ALEPH rendszerében.
Adatbázis kezelés.
Fontos szempontok a glosszárium (MultiTerm adatbázis) elkészítéséhez
Határozatlan integrál
Válság Kényszer és lehetőség. A magyar gazdaság örökölt hátrányai.
Nyelvi interfészek. IBM Watson 8:20 ill. 3:00.
Szeged, április 16. CACAO projekt katalógusok, digitális könyvtárak lekérdezése saját nyelven Moldován István Országos.
Könyvtárak.
Programozási alapismeretek 8. előadás. ELTE Szlávi-Zsakó: Programozási alapismeretek 8.2/  További programozási.
Keresés fajtái Matching (szabadszavas)
Könyv-és könyvtárhasználat 8. osztály. Könyvtári katalógusok Könyvtári katalógus Könyvtári katalógus 1. leíró betűrendes katalógus - szerző szerinti leíró.
Könyvtárhasználat, tájékozódást segítő eszközök
Adatbázisszintű adatmodellek
PsycINFO és az APA Style Csajbók Edit Semmelweis Egyetem Központi Könyvtár február 15. Klinikai Szakpszichológus képzés Könyvtári.
FELHASZNÁLÓI TRÉNINGEK Bevezetés a könyvtári katalógusok használatába.
Adatbázisok használata a tájékoztatási gyakorlatban Dr. Nagy Enikő Csomád,
Keresési módszerek könyvtári katalógusokban. A könyvtári katalógus funkciója A könyvtár állományában meglévő dokumentumok feltárása Az egyes példány adatainak.
PsycINFO és az APA Style
A könyvtárak állományának tagolódása
Elektronikus szótárhasználat
Magyar Orvosi Bibliográfia (MOB) és Magyar Tudományos Művek Tára (MTMT) Áncsán Gizella Központi Könyvtár, 2014.
Navigáció az Interneten:
Előadás másolata:

A természetes nyelvű tartalmi feltárás

természetes nyelven alapulók ismétlés 1.: információkereső nyelvek csoportjai 1. szempont: az alkalmazott nyelv természetes nyelven alapulók szabályozott nyelvű: tárgyszavas, deszkriptoros rendszerek mesterséges nyelvű: ETO

!! egy tudományág : egy hely  egy könyv : egy hely !! ismétlés 2.: osztályozáselméleti iskolák tudományfelosztáson alapuló osztályozások korlátaik: szigorú logikai elvek határozzák meg nem lehet átfedés: !! egy tudományág : egy hely  egy könyv : egy hely !! nehézkessé válhatnak /nehezen fejleszthetőek

ismétlés 3.: osztályozáselméleti iskolák 2. nyelvészeti irányzat információkeresõ nyelvek: 20. század elejétõl szavaik: szövegből vett szavak címszó kulcsszó: az információ lényegére jellemzõ, a tartalmi feltárásra alkalmas tárgyszó: a tartalmat röviden, egyértelmûen kifejezõ, természetes nyelvű szó deszkriptor: a legáltalánosabb információkeresõ nyelvi kifejezés nemdeszkriptor: az információk feldolgozására és keresésére közvetlenül nem használható kifejezés osztályozási táblázat, tárgyszójegyzék, tezaurusz: az információkeresõ nyelvek szavai rendszerezett jegyzéke, vagy listája („szótár”)

nincs szabályozott szótár, szójegyzék kötetlen rendszerek keresőszavak a szöveg elemeiből tetszőlegesen (szövegszavak, kulcsszavak, címszavak) nincs szabályozott szótár, szójegyzék

a keresőszavak: szabványos, ellenőrzött, kötött szókészletből kötöttszavas rendszerek a keresőszavak: szabványos, ellenőrzött, kötött szókészletből keresőnyelvi szótárak alapján pl. tárgyszójegyzék, a tezaurusz, osztályozási táblázat mutatói

átmeneti / vegyes rendszerek pl. betűrendbe sorolt tárgyszóláncok előnyök: egyszerű rugalmas hátrányok: az egyes tárgykörök fogalmai szétszóródnak az abc-rendben szemantikai problémák jelennek meg a fogalmi struktúra gyenge

természetes nyelvű információkeresõ nyelvek szabályozása szóalakok összevonása homonímák megkülönböztetése szinonímák elemzése tárgyszavak kialakítása

tárgyszó nyelvtanilag szabványosított formájú természetes nyelven alapuló annál egyszerűbb kifejezés a dokumentum, információ lényegének, leírására alkalmas rövid, tömör, egyértelmű tárgyszójegyzék, tárgyszórendszer alkotóegysége lehet

szabad tárgyszó / tárgyszólista / tárgyszórendszer bármely szó bármely alakban bármely új szó nincs lista

szabad tárgyszó / tárgyszólista / tárgyszórendszer Civil organizations and regional identity in the south Hungarian great plain / István Murányi et al. 1. Civil szervezetek 2. Regionális Identitás 3. Dél-Alföld 4. időföldrajz

szabad tárgyszó / tárgyszólista / tárgyszórendszer Magyarország litosztratigráfiai alapegységei : Táblázatok és rövid leírások = Basic Litostragigraphic units of Hungary : Charts and short descriptions / Magyar Állami Földtani Intézet 1. Magyarország 2. Litosztratigráfiai alapegységek 3.Litosztratigráfia 4. általános földtan

szabad tárgyszó / tárgyszólista / tárgyszórendszer tárgyszavak, sorrendben alakjuk nem szabályozott utalások a szinonimákról tárgyszavakra http://www.npsoft.hu/demos/lelo2001/subject_index.html AGY - AIDS - AKUPUNKTÚRA - ALAPELLÁTÁS - ALKOHOLIZMUS - ÁLLATORVOSTAN - ÁLLATORVOSTUDOMÁNY – ÁLLATTAN - ALLERGIOLÓGIA ÉS IMMUNOLÓGIA - ANALITIKAI KÉMIA - ANATÓMIA - ANDROLÓGIA - ANESZTEZIOLÓGIA - ANTIBIOTIKUMOK - ANTROPOLÓGIA - ANYAGCSERE

szabad tárgyszó / tárgyszólista / tárgyszórendszer tárgyszavak magyarázatok kapcsolatok

a tárgyszórendszer elemei: tárgyszavak kategóriái téma: tudományszakok, tudományos elméletek, tudományos problémák, eljárások neve, tudományos szakkifejezések (történettudomány, mérés, belgyógyászat stb.) objektumok, élőlények, dolgok nevei (Parlament, híd, cserje, kézirat) nevek: személy/testület /intézmény (Bach-család, Szegedi Tudományegyetem, Alkotmánybíróság) földrajzi hely (Békés megye, Alföld, Kárpátok) idő: korszak / időpont /időtartam (Középkor, 1997, i..e. 2. évezred) tartalmi és formai tulajdonságok (antológia, törvény, bibliográfia) események nevei (Mohácsi csata) közismert rövidítések (MTA, NATO)

a tárgyszórendszer elemei: tárgyszavak szófaja lehetőleg főnév pl. „oktat, oktatni, oktató  Oktatás egyes szám - többes szám: többes számú alak gyűjtőfogalom Növények, Kutyák ….(magyar fajták) De: Kutya, stb. (pl. tacskó, tenyésztés)

a tárgyszórendszer elemei: tárgyszavak szófaja jelző: csak szerkezetben inverzió: jelző hátravetése Kutyanevek, magyar a természetes nyelvi forma megtartása Magyar kutyanevek

a tárgyszórendszer elemei: tárgyszavak alakja többtagú kifejezések ? Kvantitatív analízis Kelta civilizáció

a tárgyszórendszer elemei: tárgyszavak alakja rövidítések, mozaikszók? NATO, ENSZ, MÁV

a tárgyszórendszer elemei: magyarázatok a homonimák szétválasztása, pl. - Komló (növény) - Komló (város) a tárgyszó jelentésének pontosítása, egyértelművé tétele Gyermek (kamaszkorú)

a tárgyszórendszer elemei: kapcsolatok hivatkozások: tárgyszavak és tárgyszavak közötti kapcsolatok „Lásd még” hivatkozás logikai, hierarchikus katcsolatok: a tárgyszavak közötti egy adott kifejezés kapcsolata(i): nem-faj egész-rész rokonsági kapcsolatok

a tárgyszórendszer elemei: kapcsolatok utalók: tárgyszóként nem használt kifejezések a szinonimák jelölésére: az azonos jelentésű kifejezések egyike tárgyszó a többi nem használható tárgyszóként 150 7 $aPedagógia 450 7 $aNeveléstudomány  lásd 550 7 $aNeveléselmélet  lásd még 550 7 $aNevelésfilozófia  lásd még

tárgyszórendszer szerkezete tiszta tárgyszórendszer: rendező elv: betűrend következetes szóalak-használat tárgyszó: főnév/főnév elöl

tárgyszórendszer szerkezete rendszerező tárgyszavas rendszer: átfogó fogalmak  altárgyszavak az azonos témakörökkel foglalkozó információk egy helyen találhatók rendszerező tárgyszókatalógusok: egy-egy csoporton belüli bontás formai földrajzi időbeli tárgyi szempontok alapján

tárgyszórendszer szerkezete rendszerezett: alárendelő: rendezőelv: tartalmi jegy bokrosító: klasszikus, bokrosítva a tartalmilag összetartozó kifejezések együtt vannak Kémia, szerves Kémia, szervetlen

tárgyszórendszer szerkezete vegyes szerkezet rendezőelv: betűrend+felbontás permutált: tárgyszókifejezések ciklikus forgatása

tárgyszórendszer szerkezete lánceljárás: tárgyszókifejezések tagjai a fogalmi szintek sorrendjében United States - Foreign relations - 1783-1865 United States - Foreign relations - Juvenile literature United States - Foreign relations - Japan United States - History - 1865

tárgyszórendszer szerkezete tárgyszóláncok = alosztályozás (idő, formai, tematikus, földrajzi) Kelta mondák, Wales és Írország Macedón irodalom, novella, antológia Magyarország története, 1700-1712, tanulmányok Neveléstörténet, cseh, 1612-1656, kiállítási katalógus Számítógéphálózat, World Wide Web, segédprogram

a tárgyszórendszer kialakításának szempontjai a feldolgozandó állomány típusa / mérete felhasználói igények, szóhasználat tematikus kapcsolatok lehetőség a folyamatos frissítésre a fejlesztés lehetőségei

tezaurusz egy-egy szakterület fogalmai szótár formában adott, természetes nyelvű szókészlet felhasználásával alkotóelemei a deszkriptorok: szabványos nyelvi formában megfogalmazott tárgyszavak tágabb, szűkebb, valamint rokon fogalmaik vannak

tezaurusz tezaurusz részei főrész lexikai egységei a deszkriptorcikkek (tezauruszcikkek), nemdeszkriptorcikkek vezérdeszkriptor: meghatározza a deszkriptorcikk helyét rá vonatkoznak a deszkriptorcikkben meghatározott relációk szinonimák (H : helyette, helyettesít, helyette is) szakcsoportos / szakrendi részek lexikai egységek betűrendes mutatója

tezaurusz a rendszerező tárgyszókatalógusok továbbfejlesztett formái természetes nyelven kifejezett fogalmak szótára tartalmilag szabályozott szükség szerint változtatható a legfontosabb fogalmi összefüggéseket is tartalmazza  hierarchikus elsősorban a számítógépes információkeresésben és -feldolgozásban használatosak

tezaurusz-hivatkozások OSZK-tezaurusz: F = Lásd még általánosabban A = Lásd még specifikusabban T = Lásd még átfogóbban P = Lásd még részletesebben R = Lásd még oksági összefüggésben E = Lásd még okozati összefüggésben X = Lásd még egyéb összefüggésben

index különbözõ osztályozási mûveletek végtermékei általános értelemben: mutató eredetileg név- és szómutató tágabb értelemben a jellemzõk rendezett jegyzéke különbözõ osztályozási mûveletek végtermékei eszköze a tárgyszó indexkifejezés: olyan tárgyszó, melyek az eredeti forrás valamely fontos tartalmi, tárgyi, személyi, földrajzi, idő, formai aspektusát mutatja indextétel: egy forrásra vonatkozó tárgyszavak a tárgyszavak egymáshoz kapcsolódásával keletkezik az eredeti forrás tárgyi-tematikus reprezentációja

index az osztályozási kifejezéseket valamilyen szövegkörnyezet, tárgyszólánc stb. feltüntetésével adja meg az osztályozási kifejezések rendezésére ciklikus permutációt használ három nagy csoport: címindex, tárgyindex hivatkozási index

az indexelés funkciói a szabályozott keresőnyelv szavaival le kell tudnia írni a dokumentumok / tartalmak lényeges vonásait a tárgyszavak rendje segítségével határozza meg a tárolási-keresési rendszert katalógus, OPAC-tárgyszómodulja bibliográfia, adatbázis tárgyszóindexe stb. tegye lehetővé a böngészést a keresőképek / keresőkérdések / a keresés témáinak a leírását