Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

ETO-jelzetek posztkoordinált visszakeresése Piros Attila Témavezető: Dr Boda István.

Hasonló előadás


Az előadások a következő témára: "ETO-jelzetek posztkoordinált visszakeresése Piros Attila Témavezető: Dr Boda István."— Előadás másolata:

1 ETO-jelzetek posztkoordinált visszakeresése Piros Attila Témavezető: Dr Boda István

2 Cél Olyan indexelő és kereső algoritmus és azt megvalósító program kidolgozása, ami lehetővé teszi dokumentumok tartalmi feltárását és visszakeresését az Egyetemes Tizedes Osztályozás felhasználásával. Olyan indexelő és kereső algoritmus és azt megvalósító program kidolgozása, ami lehetővé teszi dokumentumok tartalmi feltárását és visszakeresését az Egyetemes Tizedes Osztályozás felhasználásával.

3 Miért az ETO? Egyetemes, minden szakterületre kiterjedő, hierarchikus rendszer Egyetemes, minden szakterületre kiterjedő, hierarchikus rendszer 0 – Általános tartalmú írásművek. 00 – A tudomány és kultúra legáltalánosabb alapjai. 004 – Számítástechnika – Szoftver. Program – Programozás – Programok elemei – Változó – Változó deklaráció – Explicit változó deklaráció.

4 Miért az ETO? Rugalmas Rugalmas –A hierarchiában nem szereplő fogalmak leírására általános és speciális alosztások rendszere áll rendelkezésre  (075.8)(47+51)=161.1 Matematikai logika és halmazelmélet. Egyetemi tankönyv orosz nyelven.  :004.7 Osztott idejű adatfeldolgozás számítógépes hálózatokban. –Névalosztások is használhatók  T-SQL Szabványos lekérdező nyelv (SQL) – T-SQL  =93C++ C++ -ban írt szövegszerkesztő program –Bővíthető más osztályozási nyelvből vett jelzetekkel

5 Miért az ETO? Világszerte elterjedt és használt Világszerte elterjedt és használt –Egyike a világ két legelterjedtebb osztályozási rendszerének –A táblázatok legalább 51 nyelvre le vannak fordítva –Több, mint száz éve használják (Magyarországon is) dokumentumok tartalmi feltárására  Létező nagy gyűjtemények vannak már feldolgozva vele  Olyan rendszerre van szükségünk, ami már rögzített jelzetek feldolgozására (retrospektív konverzió) is alkalmas –Folyamatosan karbantartott és aktualizált

6 Miért az ETO? Online elérhető: Online elérhető: –egyelőre csak osztály, 51 nyelven (magyarul is!) –UDC Summary (böngészhető) –UDCS Linked Data, letölthető SKOS (XML/RDF) formátumban: –Minden osztály és alosztás (műveletek is) saját URI-al rendelkezik

7 Eddigi megoldások Csak részmegoldások vannak Csak részmegoldások vannak Ok: az ETO természetes nyelvi jellege, a szabályainak ebből adódó bonyolultsága és következetlensége Ok: az ETO természetes nyelvi jellege, a szabályainak ebből adódó bonyolultsága és következetlenségePéldául: –műveletek használhatósága és jelentése táblázatonként változó  Pl. összekötés, viszonyítás, aposztróf –részjelzetek határa és szerepe nem mindig egyértelmű  szempont szerinti általánosan közös alosztások és speciális alosztások  számjelzetes speciális alosztások  pont-nullás alosztások ( – világnézet alapja tantárgy)

8 Megoldástípusok Prekoordináció: Prekoordináció: –Jelzetelemek manuális kiemelése. –Így működtek az offline szakkatalógusok is. –Hátrányai:  Nem automatizálható  Intervallumok kezelésére alkalmatlan (megfelelő kereső algoritmus megoldhatná)  Csak a kiemelt jelzetek kereshetők, minden más elvész a kereső számára  Nagy az indexelő felelősége

9 Megoldástípusok Jelzetelemek egyesével történő bevitele: Jelzetelemek egyesével történő bevitele: –A rendszer nem a kész ETO-szám beírását várja el, hanem az egyes jelzetelemek megadását. –Előnye:  böngészhetővé tehetők az elemek, ami megkönnyítheti az indexelést –Hátrányai:  Körülményes a jelzetbevitel  Nem automatizálható  Nem kezeli eléggé az ETO rugalmasságát (több azonos típusú alosztás, alosztások műveletei stb.)

10 Megoldástípusok Keresés csonkolással: Keresés csonkolással: –Hátrányai:  A kereső személyre nagy terhet ró az ETO rugalmassága miatt (mindig számba kell venni minden lehetőséget, alaposan ismerni kell az ETO-t és a rendszert (!) is)  nagyon lassúak ezek a keresések, és indexszel sem gyorsíthatók  intervallumok kezelése lehetetlen (visszahívás sérül)  számok egymáshoz való kapcsolódása (tehát az az információ, hogy pl. melyik alosztás melyik részjelzethez kapcsolódik) elvész (nagy a zaj, a precízió sérül)  mivel az ETO maga is hierarchikus rendszer, egy kereső algoritmusnak ezt csonkolás nélkül is kezelnie kell.

11 Cél Olyan módszert adni a jelzetek eltárolására és visszakeresésére, amely a lehető legnagyobb pontosságú és teljességű találati listát eredményezi anélkül, hogy akár a indexelőtől akár a keresőtől az elmentendő illetve visszakeresendő jelzetek szabályos elkészítésén vagy kiválasztásán túl bármiféle erőfeszítést igényelne Olyan módszert adni a jelzetek eltárolására és visszakeresésére, amely a lehető legnagyobb pontosságú és teljességű találati listát eredményezi anélkül, hogy akár a indexelőtől akár a keresőtől az elmentendő illetve visszakeresendő jelzetek szabályos elkészítésén vagy kiválasztásán túl bármiféle erőfeszítést igényelne (mint például a fontosnak vélt jelzetelemek kiemelését, a jelzetek csonkolását, permutációját vagy a szabványos jelzetelemek más karakterrel történő helyettesítését). A hatékonyság empirikus vizsgálata. A hatékonyság empirikus vizsgálata.

12 Teendők ETO által felvetett kérdések és problémák elemzése: ETO által felvetett kérdések és problémák elemzése: –A jelzeten belül milyen információkat kell figyelembe venni és invertálni illetve elmenteni –Mire kell figyelni a jelzetek elemzésekor, milyen problémák lehetnek Kész (jöhetnek elő új kérdések, az ETO is változik)

13 Teendők Automata elkészítése: Automata elkészítése: –Véges automata, bemenő jelei az index karakterei, kimenet egy XML, ami reprezentálja a jelzetet. Diagram kész, implementáció folyamatban XML séma definíció: XML séma definíció: –Elsősorban technikai célt szolgál –A UDC Summary URI-ainak segítségével felhasználható a komplex jelzetek összekötésére a UDC Linked Data-val A séma definíció készen van

14 Teendők Az adatok adatbázisba mentése Az adatok adatbázisba mentése Alapelvek le vannak írva Keresés részletes kidolgozása és implementálása Keresés részletes kidolgozása és implementálása Alapelvek le vannak írva

15 Irodalomjegyzék Adatbázis transzformációalapú kereshetőségjavítása: ETO-kereshetőség a BME OMIKK Aleph rendszerében / Marton József; Prokné Palik Mária.- Bp.: TMT, 56. évf. (2009) 2. sz. Adatbázis transzformációalapú kereshetőségjavítása: ETO-kereshetőség a BME OMIKK Aleph rendszerében / Marton József; Prokné Palik Mária.- Bp.: TMT, 56. évf. (2009) 2. sz. Egyetemes Tizedes Osztályozás. – Bp.: OSZK-KI, Egyetemes Tizedes Osztályozás. – Bp.: OSZK-KI, Az ETO alkalmazása a gépesített dokumentációs és könyvtári munkában / Orosz Gábor. – In: Szöveggyűjtemény az osztályozás és indexelés kérdéseinek tanumányozásához. – Bp.: Tankönyvkiad., Az ETO alkalmazása a gépesített dokumentációs és könyvtári munkában / Orosz Gábor. – In: Szöveggyűjtemény az osztályozás és indexelés kérdéseinek tanumányozásához. – Bp.: Tankönyvkiad., Az ETO az Országos Széchényi Könyvtár számítógépes rendszerében / Zöldi Péter. – In: Könyvtári Figyelő, sz. - Az ETO az Országos Széchényi Könyvtár számítógépes rendszerében / Zöldi Péter. – In: Könyvtári Figyelő, sz. - Bevezetés az információkereső nyelvek elméletébe és gyakorlatába. – B. Hajdu Ágnes; Babiczky Béla. – Bp.: Universitas kiad., 1998 Bevezetés az információkereső nyelvek elméletébe és gyakorlatába. – B. Hajdu Ágnes; Babiczky Béla. – Bp.: Universitas kiad., 1998 Észrevételek egy ETO-ról szóló tanulmányhoz / Ungváry Rudolf. – In: Könyvtári Figyelő, sz. - Észrevételek egy ETO-ról szóló tanulmányhoz / Ungváry Rudolf. – In: Könyvtári Figyelő, sz. - Könyvtári feldolgozó munka : Osztályozás és szakkatalógus szerkesztés / Babiczky Béla – Bp.: Tankönyvkiadó, Könyvtári feldolgozó munka : Osztályozás és szakkatalógus szerkesztés / Babiczky Béla – Bp.: Tankönyvkiadó, Könyvtári információkeresés / Ungváry Rudolf, Vajda Erik. – Bp.: Typotex, Könyvtári információkeresés / Ungváry Rudolf, Vajda Erik. – Bp.: Typotex, Könyvtári osztályozási segédletek : a segédkönyvtárosképzés céljára / Mándy Gábor. - Könyvtári osztályozási segédletek : a segédkönyvtárosképzés céljára / Mándy Gábor. - Kutatási tervezet az ETO-nak mint gépesített referencia-keresőrendszer indexelési nyelvének kiértékelésére / Orosz Gábor. – In: Szöveggyűjtemény az osztályozás és indexelés kérdéseinek tanumányozásához. – Bp.: Tankönyvkiad., – p Kutatási tervezet az ETO-nak mint gépesített referencia-keresőrendszer indexelési nyelvének kiértékelésére / Orosz Gábor. – In: Szöveggyűjtemény az osztályozás és indexelés kérdéseinek tanumányozásához. – Bp.: Tankönyvkiad., – p Régi ETO, új ETO / Mándy Gábor. – In: Könyvtári Figyelő, sz. - Régi ETO, új ETO / Mándy Gábor. – In: Könyvtári Figyelő, sz. - Research Project for the Evaluation of the UDC as the Indexing Language for a Mechanized Reference Retrieval System: Progress Report for the Period July 1, 1965-January 31, 1966 / Pauline Atherton Cochrane; Robert R. Freeman Research Project for the Evaluation of the UDC as the Indexing Language for a Mechanized Reference Retrieval System: Progress Report for the Period July 1, 1965-January 31, 1966 / Pauline Atherton Cochrane; Robert R. Freeman UDC Summary Linked Data. - UDC Summary Linked Data. - UDC as Linked Data. – In: UDC Blog, UDC as Linked Data. – In: UDC Blog, UDC Summary. - UDC Summary. - Könyvtárosok kézikönyve : 2. kötet / Horváth Tibor; Papp István Könyvtárosok kézikönyve : 2. kötet / Horváth Tibor; Papp István Az Egyetemes Tizedes Osztályozás (ETO) alapelvei, reviziójának és kiadásának szabályai / Csengődy Eszter. – Budapest: OMIKK, 1983 Az Egyetemes Tizedes Osztályozás (ETO) alapelvei, reviziójának és kiadásának szabályai / Csengődy Eszter. – Budapest: OMIKK, 1983 Szemléletváltozás az ETO jelzetszerkesztésében / Babiczky Béla. – In: Könyvtári Figyelő, sz. Szemléletváltozás az ETO jelzetszerkesztésében / Babiczky Béla. – In: Könyvtári Figyelő, sz.

16 Köszönöm a figyelmet.


Letölteni ppt "ETO-jelzetek posztkoordinált visszakeresése Piros Attila Témavezető: Dr Boda István."

Hasonló előadás


Google Hirdetések