Digitalizáció és online megjelenés Ambrus Attila József PTE Központi Könyvtár ambrusa@lib.pte.hu FEEK-nap 2007 Pécs, 2007. május 5.
Az információ megjelenése Az emberiség írott, képi, hangzó és egyéb információját egyre nagyobb mértékben digitalizálják és/vagy állítják elő eredetileg is digitális formában. Az internet egyre jelentősebb információforrás lesz a társadalmi információk terjesztésében és megőrzésében. A Web általában nem megbízható a hosszú távú információ megőrzésében (weblapok születnek, költöznek és halnak el). Nem csak a Neten jelennek meg információk, hanem különböző adathordozókon (CD, MD, DVD, BluRay stb.) A digitálisan rögzített információk veszélyeztetettsége nagy (hordozó és energiaforrás-függő)! Pl. A Viking űrszonda (1970) adatait tartalmazó számítógépes szalagok ma már olvashatatlanok!
Archiválandó kiadványok Például: Az MTA és egyéb kutatóintézetek kiadványai Oktatási intézmények tudományos kiadványai Tudományos kiadók kis példányszámú, esetleg már forgalomban nem kapható kiadványai OM, NKA és egyéb állami költségvetésből támogatott kiadványok Helyi önkormányzatok, civil szervezetek kiadványai, nyilvánosságnak szánt dokumentumok Határontúli magyar szervezetek kiadványai Nyomtatásba nem kerülő kiadványok, hírlevelek, fórumok, blogok, e-mail levelezések szövegei Régi, korabeli dokumentumok, könyvek, periodikák
Digitalizációs munka (1. fázis) Szkennelés Képként Szövegként Előfeldolgozás Bitmélység kiválasztása Textbox méretezése Karakterfelismerés Hibalehetőség nincs Hibalehetőség van Szófelismerés, szövegfeldolgozás Nincs Gépi és emberi ellenőrzés szükséges
Digitalizációs munka (2. fázis) Formátum kiválasztása .JPG, .PNG (kis méret) .HTML (kis méret); .PDF (eredeti kinézet megtartása) Kereshetőség Nem lehetséges Lehetséges (szövegszintű, pontos kereshetőség) Védelem Nehézkes (képlopó program) Nehézkes (jelszóval védett terület) Hatékonyság Ha fontos az eredeti forma, akkor kiváló Jó hatásfokú, ha a tartalom a fontos
Lehetséges fájlformátumok Kiadói formátumok (QuarkXPress, PageMaker, Corel Ventura, Corel Draw, különböző e-book típusok) – rendszerint zárt formátumok, ezekeknek a konverziója ajánlott! Az interneten előforduló leggyakoribb fájlformátumok .DOC .RTF .PDF .PHP .HTML --------- szövegállomány .GIF .JPG .PNG -------------------------- képállomány .WAV .MP3 .WMA ---------------------- hangállomány .MPG .AVI .SWF ------------------------ mozgókép
Kép digitalizálása 24 bites verzió 1 bites verzió
Szövegmegjelenítés a WEB-en Közkedvelt formátum, mert egyszerűen létrehozható; tartalma jelszóval védhető, a tartalom megjelenése ugyanaz, mint a szerző gépén; kis fájlmérete miatt gyorsan letölthető. HTML - egy leíró nyelv, melyet weboldalak készítéséhez fejlesztettek ki. Alapvető programozási ismeret szükséges; a tartalom gyorsan megjeleníthető; kicsi fájlméret; gyors keresési lehetőség a szövegben; (legelterjedtebb formátum a weben).
Karakterfelismerési problémák Ékezethibák (Eger/Egér/Éger --- Alma/Álma) Írásjelek tévesztése (- – — , . ; :) Betűcserék (M m, D O, R P, a á) Felismerési problémák pl. az (i) betűnél (í, i, I, 1, !, j, l, t) Számok és betűk keverése (g 9, J 3, O 0, S 8) Az o, ó, ö, ő ü, ű betűk felismerési hibái
Recognita ejtette karakterfelismerési hibák Eredeti szöveg képfájlként Recognita ejtette karakterfelismerési hibák Wordben kézzel javított szöveg
Egy elektronikus könyvtár felépítése Szelektív archiválás (gyűjtőkör) Archiválás több forrásból: - Internet - Kiadókkal való megegyezés - Szerzőktől való begyűjtés + engedélyek - CD-ROM - Saját digitalizálás Szöveg- és minőség-ellenőrzés Karakter-konverzió (ISO-8859-2, UNICODE) Formátum-konverzió (HTML, PDF)
A tartalom esetleges LEGÁLIS
A tartalom szakmailag ellenőrzött LEGÁLIS
A tartalom szakmailag ellenőrzött LEGÁLIS
A tartalom szakmailag ellenőrzött LEGÁLIS
A tartalom szakmailag ellenőrzött „Szürke” LEGÁLIS
A tartalom ellenőrzése bizonytalan „Szürke” LEGÁLIS
Ellenőrizetlen tartalom ILLEGÁLIS
Ellenőrizetlen tartalom ILLEGÁLIS
Online folyóiratok katalogizálása Magyarországon nincs nagy, üzleti alapú teljes szöveges folyóirat szolgáltató! (EISZ - Akadémia Kiadó) Egyéni kiadói (könyvtári) kezdeményezések Szétszórt, változó, feldolgozatlan A magyar folyóiratok online változatai/elérhetősége: pl. a PTE Központi Könyvtár gyűjteménye = 1530 cím
E-folyóirat nyilvántartás (PTE KK)
Online folyóiratok szolgáltatása (Elektronikus Periodika Archívum) AZ EPA fejlesztése 2003-ban kezdődött Közvetlen kiadói kapcsolatok Folyóirat-cikkek archiválása Gyűjtőkör: - tudományos szakfolyóiratok - kulturális, irodalmi lapok - határontúli magyar periodikák - e-mail-ben terjesztett hírlevelek
Ambrus Attila József (ambrusa@lib.pte.hu) PTE Központi Könyvtár Köszönöm a figyelmet! Ambrus Attila József (ambrusa@lib.pte.hu) PTE Központi Könyvtár