Tájékoztató a webarchiválás iránt érdeklődő munkatársak részére

Slides:



Advertisements
Hasonló előadás
Drótos László Országos Széchényi Könyvtár Magyar Elektronikus Könyvtár Osztály.
Advertisements

A Szociális Ágazati Portál (SZÁP)
Szolgáltatásfejlesztés, adatbázisépítés együttműködéssel Networkshop 2005 Szeged Burmeister Erzsébet Miskolci Egyetem, Könyvtár, Levéltár, Múzeum
Mitől sikeres egy intézményi szakkönyvtár? Dr. Palotai Mária - ESKI Országos Egészségpolitikai Szakkönyvtár június 18. „Vállalati könyvtárak tegnap.
A lokális szint és a könyvtári hálózat összjátéka, kulturális találkozási lehetőségek Németh Márton MKE Baja 2010 július 16. Hálózati Könyvtári Szolgáltatások.
Kulturális értékek digitalizálása az Új Magyarország Fejlesztési Terv keretében Dippold Péter.
Elektronikus szolgáltatások mindenkinek Electronic services for everybody Moldován István OSZK Budapest, november 24.
Könyvtári digitális tartalmak az oktatási multimédiák számára
MÚZEUMI KÖNYVTÁRAK A STATISZTIKA TÜKRÉBEN - FEJLESZTÉSI LEHETŐSÉGEK, IRÁNYOK Tóth Máté OSZK - Könyvtári Intézet.
Magyar Szó Lapkiadó, Újvidék DÉLVIDÉKI KÖZÉLETI NAPILAP
ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR E-SZOLGÁLTATÁSI IGAZGATÓSÁG BIBLIOTHECA NATIONALIS HUNGARIAE A digitális megőrzés kérdései? Kik, mit és hogyan őrzik meg a.
„A finnugor örökség digitalizálása és automatizált feltárása” szeptember 14. Hungarológia és a Magyar Elektronikus Könyvtár Moldován István Országos.
A digitális dokumentumok hosszútávú megőrzésének problémái Moldován István OSZK MEK Osztály „Networkshop” Szeged, március 30.
A Magyar Elektronikus Könyvtárról Kaposvár, november 5. Moldován István MEK könyvtáros
Digitalizálás a könyvtárban Békés Megyei Könyvtár Szakmai nap február 7. Moldován István OSZK MEK osztály.
A Magyar Elektronikus Könyvtár új szolgáltatásai és működése Moldován István OSZK MEK osztály Somogyi Károly Városi és Megyei Könyvtár.
A MEK és az EPA mind a digitális megőrzés archívumai Az OAIS modell január 17.
A Magyar Elektronikus Könyvtár helye, szerepe a hazai digitális könyvtárak között XVIII. Budapesti Nemzetközi Könyvfesztivál Budapest,
Drótos László Országos Széchényi Könyvtár Magyar Elektronikus Könyvtár Osztály Javaslat egy Magyar Internet Archívum létrehozására.
Könyvtár egy kicsit másképp - a Magyar Elektronikus Könyvtárról és legújabb fejlesztéseiről Szombathely, Góczán Andrea OSZK, MEK osztály.
Az elektronikus könyvtárak jelene és jövője
Bánkeszi Katalin Egyházi Könyvtárak Egyesülése Országos Széchényi Könyvtár Digitalizálás Mit? Miért? Hogyan? Mivel? Továbbképzés Budapest,
Az elektronikus könyvtárak hálózata Moldován István OSZK MEK Osztály Hódmezővásárhely, július 5-7. Digitalizálási konferencia.
Műszaki szakfolyóiratok digitalizálása és archiválása a versenyképesség növelése érdekében ifj. Drótos László ifj. Drótos László OSZK MEK Osztály.
Berzsenyi Dániel Főiskola Szombathely, május 8. Könyvtári partnerség a felsőoktatásban XIII. Vas Megyei Könyvtári Nap.
LEKTOR/Lexelerator workshop – március 4. A LEKTOR projekt és a Lexelerator platform szolgáltatásainak és eszközeinek ismertetése.
A Neumann Kht. a kreatív iparágak szolgálatában Mátrai Julianna Pályázati szakértő Neumann János Digitális Könyvtár és Multimédia Központ Kht november.
A NEMZETI ADATVAGYON INTEGRÁCIÓJA DIGITALIZÁLÁSI KONFERENCIA MÁJUS 21 – 22. DEBRECEN UJVÁRI MÁRIA.
A szolgáltatás nemzetközi megvalósulási formáinak elemzése 1.A szolgáltatási „piac” várható változásai: tudományterületi térkép összeállítása, potenciális.
Egyetemi Könyvtárigazgatók Kollégiuma Budapest, december 11. Magyar Képzőművészeti Egyetem.
A WEB ARCHÍVUMOK KÉRDÉSKÖRE KÖNYVTÁRI ÉS TÁJÉKOZTATÁSI SZEMPONTBÓL.
World Wide Web Magyarországon Kovács László MTA SZTAKI Elosztott Rendszerek Osztály dsd.sztaki.hu.
EasyWay ITS Hungary workshop tervezett programja Házigazdai üdvözlés – Kovács Ákos MK vezérigazgató EasyWay áttekintés – dr. Lindenbach Ágnes ITS Hungary.
Dr. Sajó Andrea Országos Széchényi Könyvtár. DIGITÁLIS VILÁG Gyűjtés Megőrzés Megosztás ÚJ LEHETŐSÉGEK ÉS FELADATOK Offline és online világ.
Introduction to the BBS | 2009 | ‹#› Szolgáltatások kis- és középvállalkozásoknak.
Digitalizálás és elektronikus hozzáférés az infokommunikáció világában
Levéltárak kapcsolódása az elektronikus levéltárhoz A levéltári technológiai központok, a központi e-levéltári és e-irattári szolgáltatások Dr. Kenyeres.
A Magyar Elektronikus Könyvtár új szolgáltatásai és működése Moldován István OSZK MEK osztály Balassi Bálint Megyei Könyvtár Salgótarján,
2014. június 12. Lackó Péter Clarity
ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR E-SZOLGÁLTATÁSI IGAZGATÓSÁG BIBLIOTHECA NATIONALIS HUNGARIAE A Magyar Elektronikus Könyvtár Magyar Könyvtárosok VII. Világtalálkozója.
Tradíció és világháló Kérdések és lehetséges válaszok a könyvtári, levéltári digitalizációról.
Integrált Könyvtári Rendszer. Történeti áttekintés  ‘85-ben kezdődött el a fejlesztés  ‘94-ben már a felhasználók rendelkezésére állt  ‘95-től az OSZK-val.
ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR E-SZOLGÁLTATÁSI IGAZGATÓSÁG BIBLIOTHECA NATIONALIS HUNGARIAE Az Országos Széchényi Könyvtár digitális folyóirat archiválási.
Prof. Dr. Neményi Miklós tudományos és külügyi rektorhelyettes A doktori és publikációs adatbázis kialakításának elvei és megvalósítása Nyugat-magyarországi.
ELTE BTK Budapest, április 27. in4 konferencia Innováció – integráció – információszabadság – intelligens web.
Bemutatkozik a Magyar Elektronikus Könyvtár osztály november 26.
A könyvtár, mint az információs társadalom stratégiai tényezője Dr. Tóvári Judit
Digitalizált információk rendszerezése. A publikus hozzáférés biztosítása az Internet segítségével. Dokumentumkezelés, információ digitalizálás OMA konferencia.
Programzáró szakmai nap Szolnok, november 12. Jász-Nagykun-Szolnok Megyei Verseghy Ferenc Könyvtár és Művelődési Intézet.
N E M Z E T I A U D I O V I Z U Á L I S A R C H Í V U M NAVA project BudapestI Műszaki Egyetem Informatikai és Hírközlési Minisztérium NAVA 2005.
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
Adatbázisok használata a tájékoztatási gyakorlatban Dr. Nagy Enikő Csomád,
Könyvtártípusok és funkcióik. Könyvtár dokumentumtár információtár.
A JaDoX, mint repozitórium szoftver a közgyűjteményi informatikában JaDoX 3 Monguz Portál24 Monguz Kft. Mazula Zoltán.
A könyvtári dokumentumok digitális átállása
Kísérleti magyar webarchiválási program A könyvtárak szerepe
Lente Tamás Méliusz Juhász Péter Könyvtár
30 éves a Nemzeti Információs Infrastruktúra Fejlesztési Program
Az NIIF Program helye a kutatóhálózati világban
Információtechnológiák és tudásbázis az Agrof-MM Leonardo+ projektben M=Mountain; M=Mediterranean
Elérhető magyar irodalom – olvasás? digitalizálás?
Webes tartalmak digitális megőrzése
"404 Not Found – Ki őrzi meg az internetet?"
Drótos László – Németh Márton (Országos Széchényi Könyvtár)
A digitálisan született tartalmak megőrzése
Elektronikus számlázás Kiút a paradicsomból
A MÚZEUMI HÁLÓZAT TARTALOM- ÉS TÁJÉKOZTATÓ SZOLGÁLTATÁSAI
A webarchívum és a KDS kapcsolata
A webarchiválás jogi feltételrendszerének biztosítása
Drótos László OSZK E-könyvtári Szolgáltatások Osztály Az internet archiválása, mint könyvtári feladat „A jövő könyvtára felé...” webinárium-sorozat II. Rákóczi.
Előadás másolata:

Tájékoztató a webarchiválás iránt érdeklődő munkatársak részére Drótos László - Németh Márton OSZK E-könyvtári Szolgáltatások Osztály Webarchiválás Külföldi példák és az OSZK tervei Tájékoztató a webarchiválás iránt érdeklődő munkatársak részére

Miről lesz szó? Az eltűnt idő nyomában - Miért kell a webet archiválnunk? Webarchiválás külföldi nemzeti könyvtárakban Webaratás teszt az OSZK-ban Hová kellene eljutni és hogyan lehet bekapcsolódni?

A Nagy Könyv - milliárdos projekt honlapja volt...

Internetto - már csak az emléke él…

IWIW - amikor egy teljes magyar közösségi háló eltűnik a webről...

Általános elvek Közgyűjtemények feladata: a saját gyűjtőkörükbe tartozó digitálisan születő kultúra megőrzése az utókor számára és kutathatóvá tétele már a jelenben is (nemzeti, köz- és szakkönyvtárak, levéltárak, múzeumok, audiovizuális archívumok) Válogatva (pl. intézménytípus, műfaj, téma, esemény, híres ember szerint). Válogatás nélkül (pl. aldomén, országdomén, nemzeti webtér, globális webtér mentése). Szabályozottan (pl. kötelespéldány törvény, szerzői jogi törvény, személyes és üzleti adatok védelme). Szervezetten (pl. munkamegosztás a közgyűjtemények között, együttműködés a tartalomszolgáltatókkal, szabványos megoldások, összekapcsolt archívumok). Fenntarthatóan (pl. állami és EU-s költségvetés, tudományos kutatási alap, pályázatok, szponzorálás, fizetős szolgáltatások).

A webarchiválás helyzete a világban Korán indult projekteknél többszöri teljes generációváltás (hardver, szoftver, metodológia) Az IIPC konzorcium tömöríti a nemzeti webarchiválást végző könyvtárakat és egyéb partnereket: http://www.netpreserve.org A legnagyobb az Internet Archive: http://web.archive.org (1996 óta 286 milliárd weboldal). Kb. 40 nemzeti szintű webarchívum több mint 30 országban (általában már második generációsak). Sok kisebb-nagyobb projekt külföldi könyvtárakban, levéltárakban, állami hivataloknál, tudományos intézetekben, egyetemeken, vállalatoknál.

Ausztrália Az Ausztrál Nemzeti Könyvtár: 1996-tól PANDORA: Ausztrál Webarchívum (http://pandora.nla.gov.au) Kötelespéldány szabályozásba foglalva http://pandora.nla.gov.au/selectionguidelines.html Intézményi konzorcium keretei között zajlik Nemzeti elosztott rendszerbe tölti be mindegyik intézmény a saját maga szelektív módon learatott tartalmait Gyűjtőkör - tagállami intézményi szint (hivatalos dokumentumok + szelektív válogatás) Egységes webarchiválási szabványkörnyezet, a rendszer infrastruktúrája, az együttműködési keretek biztosítása - nemzeti szinten koordinálva Teljes domain aratás az Internet Archive segítségével

A Pandora kezdőlapja

Nagy-Britannia 2004 - A British Library irányításával szerveződő konzorcium Honlap: http://webarchive.org.uk 2013-tól a teljes .uk webtér aratása (félévente) A kötelespéldány szabályozás része a webarchiválás Szelektív aratások, eseményekhez kötődő archiválás A gyűjtőkör intézményenként kerül megállapításra egységes szempontrendszer szerint: a brit élet minél teljesebb körű bemutatása Dedikált zárt hálózaton keresztüli hozzáférés (szűkített nyilvános minta) Technikai ajánlások honlapüzemeltetők részére A robots.txt elfogadása, és a jelszóval védett tartalmat sem aratják Felhasználói javaslatok begyűjtésre Nem gyűjtenek audio- és videoanyagokat (külön archívum van rá)

A UK Web Archive kezdőlapja

Dánia A két nemzeti könyvtár által vezetett konzorcium (Koppenhága, Aarhus) A webarchiválás kezdete: 2005 Honlap: http://netarkivet.dk és szabályzat: http://netarkivet.dk/wp- content/uploads/2015/10/Politik_for_indsamling_af_materiale_til_Netarkivet.pdf Szigorú kötelespéldány szabályozás: A dán webtérben honlapot üzemeltető kötelessége az arathatóság biztosítása Dán domain név regisztrátorok: kötelező adatszolgáltatás Éves, tematikus, eseményekhez kötődő aratások A 80 legfontosabb honlapot akár naponta aratják Teljes aratás korlátozás nélkül (robot.txt figyelmen kívül) Jelszavas tartalomnál üzemeltetői felelősség Hozzáférés: dedikált hálózat oktatási, tudományos céllal egyedi engedélyezés

A dán webarchívum információs oldala

Észtország Az Észt Nemzeti Könyvtár által vezetett konzorcium (egyetemi könyvtárak, jelentős közkönyvtárak, médiaarchívumok) Honlap: http://veebiarhiiv.digar.ee A kötelespéldány szabályozás része a webarchiválás Gyűjtőkör a kötelespéldány törvényben rögzítve: https://www.riigiteataja.ee/en/eli/514092016001/consolide Teljes, szelektív, eseményekhez kötődő aratási fajták 2015: első teljes aratás a .ee domainről, 300 MB korlát webhelyenként A nem aratható tartalom beszolgáltatásának költségeit a webhely tulajdonos állja! 3 munkatárs a nemzeti könyvtárban + szakmai munkacsoport (több intézmény) Hozzáférés dedikált hálózaton keresztül + a szerzői jogilag tisztázott anyag nyilvánosan is

Az észt webarchívum kezdőlapja

Csehország A Cseh Nemzeti Könyvtár által vezetett konzorcium (regionális könyvtárak, tudományos könyvtárak) Honlap: http://www.webarchiv.cz Ismertető: https://www.slideshare.net/webarchivCZ Webaratás 2001 óta Teljes, szelektív, eseményekhez kötődő gyűjtés (a teljes aratás a CZ NIIC céggel együttműködésben) Nem tartják be a robot.txt korlátozásait A cseh Nemzeti Könyvtár már 5143 partnerrel kötött megállapodást tartalmaik archiválásáról Dedikált hálózaton keresztüli elérés, mintagyűjtemények nyilvánosak Nincs benne a kötelespéldány szabályozásban a webarchiválás - súlyos jogi problémák

A cseh webarchívum angol nyelvű oldala

Szlovákia Projekt DIP (DIgitálne Pramene): digitálisan született tartalmak gyűjtése A webarchívum honlapja: https://www.webdepozit.sk A pozsonyi egyetemi könyvtár (egy 2006-os teszt után) 2015-től építi a nemzeti webarchívumot (a nemzeti könyvtárban nincs meg ehhez a szükséges infrastruktúra) Tematikus, esemény-alapú és .sk domain szintű aratásokat egyaránt csinálnak Utóbbit 2016 októberében kezdték, és 2017 februárjában futtatták le a másodikat egy hétig. Ekkor a 352 ezer bejegyzett szlovák domainból 279 ezret learattak Az archivált verzió többnyire csak a könyvtáron belül nézhető meg, kivéve, ahol engedélyt kaptak a nyilvános szolgáltatásra Szlovákiai magyar tartalmak is szerepelnek benne! A szelektív archiválás keretében az 550 megkeresett intézmény közül 2017 júniusáig 111-gyel kötöttek szerződést

A szlovák webarchívum angol honlapja

Szoftver háttér Nagy méretű automatizált webarchívumoknál ma már többnyire az IIPC (International Internet Preservation Consortium) által támogatott megoldásokat használják (pl. egy vagy több összekapcsolt Linux szerveren): Heritrix aratószoftver (crawler, spider, web robot) OpenWayback megjelenítő NutchWAX kereső Web Curator Tool vagy NetarchiveSuite keretrendszer WARC tárolási formátum

Hol tartunk itthon? Magyarországon még nincs komolyabb webarchívum. 2006-ban volt az első javaslat: Mi a MIA? : Javaslat egy Magyar Internet Archívum létrehozására A 2010-es évek első felében az ELTE Tudománytörténet és Tudományfilozófia Tanszékén volt egy webaratási kísérlet: kb. 400 tudományos és oktatási intézet honlapját, valamint hírportálok anyagát mentették. A NAVA néhány éve az MTVA számára gyűjt online sajtóhíreket (jelenleg kb. 2 millió rekord).

Az OSZK és a webarchiválás Az OSZK az Országos Könyvtári Rendszer fejlesztése keretében 2017 márciusától 2018 végéig egy kísérleti fázisú webarchiválási projektet indított, azzal a céllal, hogy megalapozza egy leendő, üzemszerűen működő magyar internet archívum feltételeit. Egyelőre a technológia tesztelése, a külföldi jó példák megismerése, a szükséges elméleti és gyakorlati ismeretek megszerzése folyik. A számítógépes hátteret (szerver+tárhely) a KIFÜ-NIIF biztosítja. A projektbe bekapcsolódott már néhány közgyűjtemény és várjuk más érdeklődők jelentkezését is. A gyűjtőkör rövid megfogalmazása elkészült.

Ideiglenes honlap: http://mekosztaly.oszk.hu/mia/

Wiki: http://mekosztaly.oszk.hu/mia/MIA_wiki.html

Lista: http://mekosztaly.oszk.hu/cgi-bin/mailman/listinfo/mia-l

Az Állatkert honlapjának néhány próbamentése

Az archivált honlap a Wayback megjelenítőben

Hová kellene eljutni? Legyen egy közgyűjtemények, intézmények és cégek közötti munkamegosztással működő, nagy teljesítményű, fenntartható nemzeti internet archívum, amely képes: rendszeresen menteni sok ezer fontos magyar webhelyet; alkalomszerűen menteni egyes hírforrásokat kiemelt eseményekhez kapcsolódva; évente kétszer egy reprezentatívnak tekinthető mentést csinálni a magyar webtérről; kötelespéldányként és önkéntesen beadott webes és más internetes tartalmakat befogadni; mindezeket hosszú távon megőrizni és megtekinthető állapotban tartani; szolgáltatásokat nyújtani az internetezők, a tartalomgazdák, a tudományos, oktatási, kormányzati és üzleti szféra számára.

Hová kellene eljutni? Legyenek nálunk is a webhelyek és az egyéb online források megőrzéséhez értő könyvtárosok, informatikusok és egyéb szakemberek, akik képesek akár magánszemélyek, akár más intézmények, akár a saját könyvtáruk, levéltáruk vagy múzeumuk számára kisebb-nagyobb archívumokat létrehozni. Legyen egy olyan jogi környezet, amely a magyar közgyűjtemények számára is lehetővé teszi, hogy a nyilvános internetről archiváljanak tartalmakat, valamint azokat – a szerzői és személyiségi jogi korlátozások figyelembevételével – nyilvánosan vagy helyben szolgáltassák.

Ki és hogyan tudna részt venni ebben? Népszerűsítés, ismeretterjesztés, oktatás Kapcsolatfelvétel lehetséges partnerintézményekkel Archiválandó webhelyek válogatása Engedélykérések Metaadatolás Minőségellenőrzés Szoftverek tesztelése, informatikai feladatok Egyéb