10 millió publikált oldal az Interneten Biszak Sándor ARCANUM Adatbázis
–– Alapítva 1989 –– Alapító Magyar Szabadalmi Hivatal Cél a CD-ROM magyarországi bevezetése Első CD-ROM 1991Nemzetközi Szabadalmi Osztályozás Első DVD-ROM 2000 150 CD-ROM and DVD-ROM az elmúlt 20 évben: Bibla, versek, lexikonok, stb. és nagy számban levéltári és könyvtári adatbázisok
Technológia: 10-15 adatrögzítő, szedő, ugyanennyi korrektor — Régmúlt — Technológia: 10-15 adatrögzítő, szedő, ugyanennyi korrektor Előny: igen jó szövegminőség (99.95-99.99%): 10.000 betűnként 1-5 hiba Hátrány: havonta maximum 4-5000 oldal feldolgozása nagyon drága Kiadványok: iparjogvédelmi adatbázisok (védjegy, szabadalom, osztályozási rendszer), VersTár, Biblia, Pallas Nagy Lexikon, Miszáth, Jókai összes, stb.
— Közelmúlt — A világ megváltozott, elsősorban a Google Books megjelenésével. A digitalizálás a tömeges feldolgozás irányába indult el. (Patents!, Books) Technológia: nagy tömegű digitalizálás (szkennelés), automatikus szövegfelismerés (OCR) Előny: nagy mennyiség, olcsó Hátrány: szövegminőség (98-99%), 10.000 betűnként 100-200 hiba Publikálás: kétrétegű PDF Szkennelt, hiteles kép Alatta az automatikusan felismert szöveg Saját fejlesztésű internetes kereső – Betekintés az indexbe - Csonkolás jobbról, balról - Szomszédossági keresés -Találat kivilágítása - Tetszőleges méretű adatbázis (akár több millió oldal) – Nagy sebesség
— A JELEN. Mindent digitalizálunk — Oklevelek, egyedi iratok, régi könyvek könyvszkennerrel BookEye 3 A1 color és Zeutschel OMNISCAN 12000 Kapacitásunk: 2000 felvétel / nap A1 (60×80 cm) és A2 dokumentum méret 36 bit színmélység, 100-600 DPI felbontás Sebesség: szürke 1 mp, szines 4 mp Beépített, 100 mm-es tartományban állítható motoros könyvtartó UV-mentes nagy fényerejű fehér LED Tökéletes, tükrözésmentes megvilágítás Könyv-görbület korrekció Kíméletes, csak a szkennelés ideje alatti fényterhelés
— A JELEN. Mindent digitalizálunk — Qidenus RBS Pro TT robotszkenner legfontosabb jellemzői könyvszkennelő robot a minőségi nagytömegű digitalizáláshoz 2 az 1-ben eszköz: teljesen automata mód (2000 oldal/óra teljesítmény); manuális, félautomata mód (900 oldal/óra) Szabadalmaztatott lapozó megoldás: „bionikus ujj” Gyökeresen új könyvtartó rendszer Hatékony dupla-lapozás ellenőrzés A legújabb Canon DSLR kamerák használata, 300-400 dpi felbontás A borítólapok, a kötésből kiszakadt oldalak digitalizálása QiSoft programcsomag: képfeldolgozás, formátum-konverzió, munkafolyamat irányítás, OCR, metaadatok Asztali kivitel: kompakt, hordozható, gazdaságos
— A JELEN. Mindent digitalizálunk — Könyvek, folyóiratok, képeslapok 2 Canon X10C nagysebességű szkenner Kapacitásunk: 20.000 oldal / nap 2009-ben 3 millió oldalt digitalizáltunk Canon imageFORMULA DR-X10C Maximális felbontás 600 DPI Maximumális méret A3 (1m) Kétoldalas szines szkennelés Ultrahangos duplalap-behúzás érzékelő, kapocs detektálás Por mentes szkennelőrendszer „Újra-próbáló” lapbehúzás Szkennelési sebesség: szines 128 lap/min; szürke vagy FF 128 lap/min Nagyvolumenű terhelhetőség: 60,000 oldal/nap Sima, begyűrődésmentes adagoló- és görgőmechanizmus fotók és régi újságok esetén is!
— A JELEN. Mindent digitalizálunk — Térképek, tervek, plakátok nagy formátumú szkennerrel Három VIDAR szkenner Kapacitás: 1000 térkép / nap VIDAR SELECT P42 PLUS Maximumális felbontás: 600 DPI Max. dokumentum szélesség: 106 cm Max. dokumentum hossz: korlátlan Max. dokumentum vastagság: 15 mm Színmélység: 42 bit/24 bit Tripla 4-soros CCD (RGB Triplets + Panchromatic B/W) Precíz színkalibráció, kiváló színhűség, zaj nélküli képek nagyfrekvenciás, hideg fényű megvilágítás Computer-vezérelt sima görgőmechanizmus 400 megabit/sec sebességű adatátvitel
——— Specialitásunk a régi térkép ——— - Digitalizáltuk a Habsburg Birodalom katonai felméréseit (1., 2. és 3.) - Magyarország történeti a kataszteri térképeit XIX. század (100,000 szelvény) - Horvátország történeti kataszteri térképeit (30,000 szelvény)
—— Specialitásunk a régi térkép —— Térkép a képből: - georeferálás: GPS koordináta minden pixelre - nagyméretű mozaik a szelvényekből - publikálás DVD-ROM-on vagy Interneten (Google maps)
Magyar Távirati Iroda (MTI) 1920-1950: 850.000 oldal –– Internetes adatbázisaink –– 10 millió oldal Magyar Távirati Iroda (MTI) 1920-1950: 850.000 oldal
Magyar Szabadalmi Adatbázis 1896-2009: szabadalmak, védjegyek –– Internetes adatbázisaink — 10 millió oldal Magyar Szabadalmi Adatbázis 1896-2009: szabadalmak, védjegyek
Parlamenti Napló 1861-1990: 700.000 oldal –– Internetes adatbázisaink –– 10 millió oldal Parlamenti Napló 1861-1990: 700.000 oldal
–– Internetes adatbázisaink –– 10 millió oldal Magyar Országos Levéltár Középkori oklevelek adatbázis: 110.000 oklevél 500.000 kép A MOL összes kiadványa: 200.000 oldal Királyi Könyvek 1526-1918: 100.000 kép Kataszteri térképek (50.000 szelvény); Kéziratos térképek (120.000 szelvény)
— Internetes adatbázisaink — 10 millió oldal Önkormányzati levéltárak közös adatbázisa: - Levéltári kiadványok: 500.000 oldal - MSZMP vezető testületi jegyzőkönyvek 1956-1990: 250.000 oldal - Kataszteri térképek: 100.000 térképszelvény
–– Internetes adatbázisaink –– 10 millió oldal Múzeumi kiadványok: 48 múzeum 900.000 oldal
–– Internetes adatbázisaink –– 10 millió oldal Képeslapok: 4 múzeum 150.000 képeslap
— Helyi lapok tömeges digitalizálása — Digitalizálás lapadagolós szkennerrel? Előnye: igen jó minőségű szkennelés, jó minőségű OCR Hátránya: a köteteket lapokra kell bontani Döntés: a kötetek szétszedése, visszakötés nélküli tárolása, szolgáltatás digitálisan Digitalizálás mikrofilmről? Előnye: viszonylag egyszerű, gyors, teljes Hátránya: igen rossz minőségű, szövegfelismerésre (OCR) alkalmatlan Nem biztosítható az elfogadható színvonalú keresés
— Felajánlás a közgyűjteményeknek — — A jövő — Országos együttműködés lehetősége, közös publikálás Tudományos periodikumok: ADT (Arcanum Digitális Tudománytár) Helyi lapok Napilapok Lexikonok, könyvritkaságok Helytörténeti gyűjtemények — Felajánlás a közgyűjteményeknek — 2011 kötet térítés mentes digitalizálása 2011-ben Partnerintézményeket keresünk Helyszíni kitelepülés, mini digitalizálási konferenciák Tartalmak közös kiválasztása Digitális tartalmak átadása, igény esetén publikálása
Köszönöm a figyelmet! ——— www.arcanum.hu ———