Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

10 millió publikált oldal az Interneten

Hasonló előadás


Az előadások a következő témára: "10 millió publikált oldal az Interneten"— Előadás másolata:

1 10 millió publikált oldal az Interneten
Biszak Sándor ARCANUM Adatbázis

2 –– Alapítva 1989 –– Alapító Magyar Szabadalmi Hivatal
Cél a CD-ROM magyarországi bevezetése Első CD-ROM 1991Nemzetközi Szabadalmi Osztályozás Első DVD-ROM 2000 150 CD-ROM and DVD-ROM az elmúlt 20 évben: Bibla, versek, lexikonok, stb. és nagy számban levéltári és könyvtári adatbázisok

3 Technológia: 10-15 adatrögzítő, szedő, ugyanennyi korrektor
— Régmúlt — Technológia: adatrögzítő, szedő, ugyanennyi korrektor Előny: igen jó szövegminőség ( %): betűnként 1-5 hiba Hátrány: havonta maximum oldal feldolgozása nagyon drága Kiadványok: iparjogvédelmi adatbázisok (védjegy, szabadalom, osztályozási rendszer), VersTár, Biblia, Pallas Nagy Lexikon, Miszáth, Jókai összes, stb.

4 — Közelmúlt — A világ megváltozott, elsősorban a Google Books megjelenésével. A digitalizálás a tömeges feldolgozás irányába indult el. (Patents!, Books) Technológia: nagy tömegű digitalizálás (szkennelés), automatikus szövegfelismerés (OCR) Előny: nagy mennyiség, olcsó Hátrány: szövegminőség (98-99%), betűnként hiba Publikálás: kétrétegű PDF Szkennelt, hiteles kép Alatta az automatikusan felismert szöveg Saját fejlesztésű internetes kereső – Betekintés az indexbe - Csonkolás jobbról, balról - Szomszédossági keresés -Találat kivilágítása - Tetszőleges méretű adatbázis (akár több millió oldal) – Nagy sebesség

5 — A JELEN. Mindent digitalizálunk —
Oklevelek, egyedi iratok, régi könyvek könyvszkennerrel BookEye 3 A1 color és Zeutschel OMNISCAN 12000 Kapacitásunk: 2000 felvétel / nap A1 (60×80 cm) és A2 dokumentum méret 36 bit színmélység, DPI felbontás Sebesség: szürke 1 mp, szines 4 mp Beépített, 100 mm-es tartományban állítható motoros könyvtartó UV-mentes nagy fényerejű fehér LED Tökéletes, tükrözésmentes megvilágítás Könyv-görbület korrekció Kíméletes, csak a szkennelés ideje alatti fényterhelés

6 — A JELEN. Mindent digitalizálunk —
Qidenus RBS Pro TT robotszkenner legfontosabb jellemzői könyvszkennelő robot a minőségi nagytömegű digitalizáláshoz 2 az 1-ben eszköz: teljesen automata mód (2000 oldal/óra teljesítmény); manuális, félautomata mód (900 oldal/óra) Szabadalmaztatott lapozó megoldás: „bionikus ujj” Gyökeresen új könyvtartó rendszer Hatékony dupla-lapozás ellenőrzés A legújabb Canon DSLR kamerák használata, dpi felbontás A borítólapok, a kötésből kiszakadt oldalak digitalizálása QiSoft programcsomag: képfeldolgozás, formátum-konverzió, munkafolyamat irányítás, OCR, metaadatok Asztali kivitel: kompakt, hordozható, gazdaságos

7 — A JELEN. Mindent digitalizálunk —
Könyvek, folyóiratok, képeslapok 2 Canon X10C nagysebességű szkenner Kapacitásunk: oldal / nap 2009-ben 3 millió oldalt digitalizáltunk Canon imageFORMULA DR-X10C Maximális felbontás 600 DPI Maximumális méret A3 (1m) Kétoldalas szines szkennelés Ultrahangos duplalap-behúzás érzékelő, kapocs detektálás Por mentes szkennelőrendszer „Újra-próbáló” lapbehúzás Szkennelési sebesség: szines lap/min; szürke vagy FF 128 lap/min Nagyvolumenű terhelhetőség: 60,000 oldal/nap Sima, begyűrődésmentes adagoló- és görgőmechanizmus fotók és régi újságok esetén is!

8 — A JELEN. Mindent digitalizálunk —
Térképek, tervek, plakátok nagy formátumú szkennerrel Három VIDAR szkenner Kapacitás: 1000 térkép / nap VIDAR SELECT P42 PLUS Maximumális felbontás: 600 DPI Max. dokumentum szélesség: 106 cm Max. dokumentum hossz: korlátlan Max. dokumentum vastagság: 15 mm Színmélység: 42 bit/24 bit Tripla 4-soros CCD (RGB Triplets + Panchromatic B/W) Precíz színkalibráció, kiváló színhűség, zaj nélküli képek nagyfrekvenciás, hideg fényű megvilágítás Computer-vezérelt sima görgőmechanizmus 400 megabit/sec sebességű adatátvitel

9 ——— Specialitásunk a régi térkép ———
- Digitalizáltuk a Habsburg Birodalom katonai felméréseit (1., 2. és 3.) - Magyarország történeti a kataszteri térképeit XIX. század (100,000 szelvény) - Horvátország történeti kataszteri térképeit (30,000 szelvény)

10 —— Specialitásunk a régi térkép ——
Térkép a képből: - georeferálás: GPS koordináta minden pixelre - nagyméretű mozaik a szelvényekből - publikálás DVD-ROM-on vagy Interneten (Google maps)

11 Magyar Távirati Iroda (MTI) 1920-1950: 850.000 oldal
–– Internetes adatbázisaink –– 10 millió oldal Magyar Távirati Iroda (MTI) : oldal

12 Magyar Szabadalmi Adatbázis 1896-2009: szabadalmak, védjegyek
–– Internetes adatbázisaink — 10 millió oldal Magyar Szabadalmi Adatbázis : szabadalmak, védjegyek

13 Parlamenti Napló 1861-1990: 700.000 oldal
–– Internetes adatbázisaink –– 10 millió oldal Parlamenti Napló : oldal

14 –– Internetes adatbázisaink ––
10 millió oldal Magyar Országos Levéltár Középkori oklevelek adatbázis: oklevél kép A MOL összes kiadványa: oldal Királyi Könyvek : kép Kataszteri térképek ( szelvény); Kéziratos térképek ( szelvény)

15 — Internetes adatbázisaink —
10 millió oldal Önkormányzati levéltárak közös adatbázisa: - Levéltári kiadványok: oldal - MSZMP vezető testületi jegyzőkönyvek : oldal - Kataszteri térképek: térképszelvény

16 –– Internetes adatbázisaink ––
10 millió oldal Múzeumi kiadványok: 48 múzeum oldal

17 –– Internetes adatbázisaink ––
10 millió oldal Képeslapok: 4 múzeum képeslap

18 — Helyi lapok tömeges digitalizálása —
Digitalizálás lapadagolós szkennerrel? Előnye: igen jó minőségű szkennelés, jó minőségű OCR Hátránya: a köteteket lapokra kell bontani Döntés: a kötetek szétszedése, visszakötés nélküli tárolása, szolgáltatás digitálisan Digitalizálás mikrofilmről? Előnye: viszonylag egyszerű, gyors, teljes Hátránya: igen rossz minőségű, szövegfelismerésre (OCR) alkalmatlan Nem biztosítható az elfogadható színvonalú keresés

19

20 — Felajánlás a közgyűjteményeknek —
— A jövő — Országos együttműködés lehetősége, közös publikálás Tudományos periodikumok: ADT (Arcanum Digitális Tudománytár) Helyi lapok Napilapok Lexikonok, könyvritkaságok Helytörténeti gyűjtemények — Felajánlás a közgyűjteményeknek — 2011 kötet térítés mentes digitalizálása 2011-ben Partnerintézményeket keresünk Helyszíni kitelepülés, mini digitalizálási konferenciák Tartalmak közös kiválasztása Digitális tartalmak átadása, igény esetén publikálása

21 Köszönöm a figyelmet! ——— ———


Letölteni ppt "10 millió publikált oldal az Interneten"

Hasonló előadás


Google Hirdetések