Gyenese Tamás, Kovács Csaba, Lux Zoltán Az első OAIS szerinti digitális iratátvétel Magyarországon The first OAIS-compliant ingest of digital record Gyenese Tamás, Kovács Csaba, Lux Zoltán 2010.12.08
Áttekintés, overview Előzmény, BÜR (Büntető Ügyviteli Rendszer) I. projekt Preparation Digitálisan keletkezett iratok archiválása Preservation of born-digital records BÜR II. projekt Eredmények Outcomes
Előzmény, BÜR (Büntető Ügyviteli Rendszer) I. projekt Previous project DOS-os alkalmazás, dBASE IV. formátumban tárolt adatok, Clipper 5-ben írt felhasználói program, a Legfőbb Ügyészség fejlesztése. Hogyan lesz ebből hosszú távú archiválásra és használatra alkalmas digitális állomány? How to preserve the records? BÜR I. projekt eredménye (The outcomes of the BÜR I. project): A SIARD (Software Independent Archival of Relational Databases) formátum kiválasztása és a SIARD SUITE alkalmazásának tervbevétele (ekkor még nem volt elérhető). Ez relációs adatbázisokra alkalmazható. (MSSQL, Oracle, MS Access) Átadási specifikáció elkészítése (Specification of Submission) Az átadott állományokat be kell tölteni egy relációs adatbázisba és arra kell alkalmazni a SIARD SUITE-ot.
Digitálisan keletkezett iratok archiválása Long-term preservation of born-digital records Formátumok (dokumentumok, képek, emailek, adatbázisok, stb) „Egyszerű” és könnyen áttekinthető formában. Transparent. Értelmezéséhez ne legyen szükség nagyon speciális eszközökre. No need for special tools. Csak nyílt és a lehető legkevesebb szabványra épüljön (XML, ZIP, Unicode, SQL1999, tiff, pdf, stb.) Önmagában is megálljon, azaz minden lényeges információt tartalmazzon (metaadatok) Self-explanatory Csomagok, (Packages) Metadata Primer data
Digitálisan keletkezett iratok archiválása Long-term preservation of born-digital records Iratátvétel / Ingest: Submission Information Package (SIP) Hosszú távú megőrzés / Long Term Preservation: Archival Information Package (AIP) Használat / Access: Dissemination Information Package (DIP)
BÜR II. projekt The Scope of the BÜR II. Project Siard package + metaadatok - > SIP De a mi esetünkben (in our case): csv fájlok + metaadatok -> SIP SIP -> AIP AIP -> DIP, SIP -> DIP Tapasztalat, tudásbázis, knowhow 6
BÜR II. projekt, CSV fájlok + metaadatok - > SIP 7
BÜR II. projekt, CSV fájlok + metaadatok > SIP SIPka Segédprogram SIP és AIP készítésére Software tool for SIP and AIP creation 8
BÜR II. projekt, SIP -> AIP Adatbetöltés Oracle adatbázisba. Data loading into an Oracle database Adatbázis sémák kialakítása. Creation of database schemas. META, STAGE, DW, SIARD PL/SQL programok elkészítése(development) Adatbetöltések, betöltési naplók, statisztikák készítése. Load data into database, generating logs and statistics. BÜRke segédprogram (terven felül)
BÜR II. projekt, SIP -> AIP A SIARD formátum Nyilvános szabvány. Open standard Nyilvános szabványokra épül. Based on open standards: XML, Unicode (ISO), SQL1999 (ISO), Zip Package független (independent) Táblaadatok közötti összefüggések kezelve vannak. Stores information about the structure of the archived database. Characterset: Unicode, UTF-8, UTF-16 ARELDA projekt PLANETS projekt 10
BÜR II. projekt, SIP -> AIP SIARD package létrehozása (SIP és) AIP készítéséhez SIARD SUITE segítségével. Generating a SIARD Package by the SIARD SUITE 11
BÜR II. projekt, SIP -> AIP SIARD Package létrehozása SIPka segédprogrammal további metaadatok megadása (pl. keletkezési forma, évkör, fond referencia, stb.), továbbá a SIP eredeti metaadatainak megőrzése. Further archive-specific metadata. AIP package elkészítése. Generating the AIP
BÜR II. projekt, AIP -> DIP, SIP -> DIP BÜRke segédprogrammal adatbázisba töltés. Software tool for data load into database. Internetes felhasználói felület kialakítása ORACLE APEX-el. Web based user interface developed in APEX.
BÜR II. projekt, AIP -> DIP, SIP -> DIP
BÜR II. projekt, AIP -> DIP, SIP -> DIP
BÜR II. projekt. Summary OAIS modell szerint: SIP -> AIP -> DIP A gyakorlatban előfordul: (SIP -> DIP) A BÜR projektben: Digitális irat (SIPka) -> SIP (SIPka) ((BÜRke) /Database/ (SIARD SUITE)) (SIPka) -> AIP Digitális irat (SIPka) -> SIP (SIPka) (BÜRke) (Internetes alkalmazás) -> DIP 16
Eredmények. Outcomes. Átvett levéltári állományok. Ingest process. Kutatható adatok (DIP). Searchable digital records. A SIARD Suite tesztelése, javítása, magyarítása. Experiences with SIARD SUITE, Hungarian version, some corrections on the software. Segédprogramok további BÜR állományok átvételéhez, archiválásához (BÜRke, SIPka). Software tools for ingest and long term preservation of further BÜR records. A segédprogramok más állományokhoz is továbbfejleszthetőek. The software tools are applicable to other relational databases. Konkrét, gyakorlati tapasztalat a digitális állományok archiválásával kapcsolatban. Practices in preservation of digital records. Ha relációs adatbázist kell átvenni „Szabványos” szoftverek, ill. OAIS referenciamodell További teendők, problémák. Further tasks.
Köszönöm a figyelmet! Thank you for your attention!