2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 1 Nagyvállalati dokumentumkezelés A tartalomkezelés kálváriája ECM/OCR „Játék” a betükkel dr. Haraszti Miklós DMSLabor
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 2 Bemutatkozás elhivatottság széles értelemben vett dokumentumkezelés teljes életciklusú értelmezés fizikai és logikai kezelés konverzió (papír/elektronikus) szakmai konferenciák, fórumok Nagyvállalati Dokumentumkezelés 1-5. ECM Filozófia 1-3. DMS Fórumok Az ügyviteli szoftverfejlesztés módszerei Hitelesség az üzleti életben Elektronikus számla a papírhegyen túl Itt a papírmentes közigazgatás? DMS Roadshow 2006 Úton az elektronikus irattár felé Elektronikus számlázás - MOST! szoros együttműködés, szakmai támogatás HTE Dokumentumtechnológiai Szakosztály DMS Labor
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 3 Történeti áttekintés számítási kapacitás fejlődése optikai bevitel fejlődése (sebesség, felbontás) felismerési logika (matematika, alkalmazott tudományok) hőskorszak (privilégium, „tudósok” játékszere) első áttörés (desktop megjelenés, kézi szkenner, ASCCII készletre) bináris/video váltás a szkennelésben (sebesség drasztikusan nő, felbontás 600dpi második áttörés (brutális számítási kapacitás, elérhető beviteli eszköz + digitális fotók!) 65%-ról 95-98%-ra felismerés pontossága javul több, diverz OCR engine alkalmazása letisztult OCR alaptermékek (FineReader, Recognita, stb.)
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 4 OCR forradalom küszöbén Google könyvtár (nyomtatott könyv) digitalizálás automatikus számlafeldolgozás (adatrögzítés gépi kiváltása) automatikus dokumentum kategorizálás (postabontóból) multiview (pl. PDF image és OCR szöveg egyetlen dokumentumban automatikus adatfeldolgozás (pl. teljes névjegyalbum adatbázisba FREE) publikus felhasználás (beadott irat alapján azonnali gépi beavatkozás) kézírásfelismerés (új-megújult pálya, számokra 100%!!!) FEL VAGYUNK RÁ KÉSZÜLVE???
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 5 ECM KATALIZÁTOR Minimum a szó kell, nem a karakter! Mondatok kellenek, szinonímák, „gondolat” vadászat Tartalomkezelés a papíron rögzített ismeretre is! Digitalizált tudás-robbanás (elérhető lesz a nyomtatott könyvtár) Vállalati dokumentumkapcsolatok - igény a rögzített adatokra Technológia és kutatás motorja a „nagyvállalat” (?!) Hogyan hat az ECM filozófia terjedése, érvényesülése az OCR alapú kezdeményezésekre?
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 6 Intelligencia már az OCR termék szintjén
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 7 OCR felismerés Egyszerűség, átláthatóság, használhatóság
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 8 Egy kis tudomány Forrás: Department of Computer Science and Engineering, University at Buffalo
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 9 Mit „lát” a gép a karakterböl? Forrás: Department of Computer Science and Engineering, University at Buffalo
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 10 ECM 2007… Forrás: Freescale Semiconductor
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 11 OCR folyamat… Forrás: Freescale Semiconductor
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 12 Köszönöm a figyelmet! Elérhetoségeim: 20/