Drótos László OSZK E-könyvtári Szolgáltatások Osztály Az internet archiválása, mint könyvtári feladat „A jövő könyvtára felé...” webinárium-sorozat II. Rákóczi.

Slides:



Advertisements
Hasonló előadás
Üdvözlünk!. Az internetezők 90% - a vásárlás előtt a neten gyűjt információt 1998-ban 70 millió internetező volt a világon, ma kb. 2 milliárd.
Advertisements

WEB 2 eszközök, közösségi portálok az oktatásban
Drótos László Országos Széchényi Könyvtár Magyar Elektronikus Könyvtár Osztály.
Központi és közösségi szolgáltatások olvasóknak, könyvtáraknak.
Szolgáltatásfejlesztés, adatbázisépítés együttműködéssel Networkshop 2005 Szeged Burmeister Erzsébet Miskolci Egyetem, Könyvtár, Levéltár, Múzeum
Emeltszintű Etanácsadó Otthoni internetes ügyintézés Készítette: Horányiné Horváth Viktória Csilla.
Kulturális értékek digitalizálása az Új Magyarország Fejlesztési Terv keretében Dippold Péter.
Elektronikus szolgáltatások mindenkinek Electronic services for everybody Moldován István OSZK Budapest, november 24.
Böngészők Internet Explorer Mozilla Firefox
MATARKA szakmai nap Miskolci Egyetem Könyvtár, Levéltár, Múzeum március 24. KÖSZÖNTJÜK A RÉSZTVEVŐKET!
MeetOFF.eu Képadatbázisok az OSZK-ban avagy képek archiválása és szolgáltatása a XXI. században. Moldován István Országos Széchényi Könyvtár.
ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR E-SZOLGÁLTATÁSI IGAZGATÓSÁG BIBLIOTHECA NATIONALIS HUNGARIAE A digitális megőrzés kérdései? Kik, mit és hogyan őrzik meg a.
„A finnugor örökség digitalizálása és automatizált feltárása” szeptember 14. Hungarológia és a Magyar Elektronikus Könyvtár Moldován István Országos.
A digitális dokumentumok hosszútávú megőrzésének problémái Moldován István OSZK MEK Osztály „Networkshop” Szeged, március 30.
A Magyar Elektronikus Könyvtárról Kaposvár, november 5. Moldován István MEK könyvtáros
A Magyar Elektronikus Könyvtár új szolgáltatásai és működése Moldován István OSZK MEK osztály Somogyi Károly Városi és Megyei Könyvtár.
Magyar Digitális Képkönyvtár az OSZK-ban Dunaújváros, Networkshop március 17.
Drótos László Országos Széchényi Könyvtár Magyar Elektronikus Könyvtár Osztály Javaslat egy Magyar Internet Archívum létrehozására.
Az elektronikus könyvtárak jelene és jövője
Bánkeszi Katalin Egyházi Könyvtárak Egyesülése Országos Széchényi Könyvtár Digitalizálás Mit? Miért? Hogyan? Mivel? Továbbképzés Budapest,
Műszaki szakfolyóiratok digitalizálása és archiválása a versenyképesség növelése érdekében ifj. Drótos László ifj. Drótos László OSZK MEK Osztály.
Berzsenyi Dániel Főiskola Szombathely, május 8. Könyvtári partnerség a felsőoktatásban XIII. Vas Megyei Könyvtári Nap.
A WEB ARCHÍVUMOK KÉRDÉSKÖRE KÖNYVTÁRI ÉS TÁJÉKOZTATÁSI SZEMPONTBÓL.
WEB 2.0. Amiről szó lesz… Web átalakulóban, a WEB 2.0 –Újszerű weboldalak… –Első a tartalom! –A felhasználók hatalomátvétele?! –A Web mint platform –
Dr. Sajó Andrea Országos Széchényi Könyvtár. DIGITÁLIS VILÁG Gyűjtés Megőrzés Megosztás ÚJ LEHETŐSÉGEK ÉS FELADATOK Offline és online világ.
A Magyar ClusterGRID projekt Stefán Péter tudományos munkatárs NIIF Iroda
Digitalizálás és elektronikus hozzáférés az infokommunikáció világában
Wordforce e-learning szerkesztő lehetőségei és korlátai
Magyar Internet Archívum pilot és elemzés Gulyás László ELTE április 14.
ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR E-SZOLGÁLTATÁSI IGAZGATÓSÁG BIBLIOTHECA NATIONALIS HUNGARIAE Az Országos Széchényi Könyvtár digitális folyóirat archiválási.
A Nemzeti Könyvtár internetes szolgáltatásai benne a Magyar Elektronikus Könyvtárról bővebben Góczán Andrea augusztus 2.
ELTE BTK Budapest, április 27. in4 konferencia Innováció – integráció – információszabadság – intelligens web.
Bemutatkozik a Magyar Elektronikus Könyvtár osztály november 26.
A könyvtár, mint az információs társadalom stratégiai tényezője Dr. Tóvári Judit
ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR E-SZOLGÁLTATÁSI IGAZGATÓSÁG BIBLIOTHECA NATIONALIS HUNGARIAE Együttműködés az online közösségekkel a közgyűjteményekben Networkshop.
Digitalizált információk rendszerezése. A publikus hozzáférés biztosítása az Internet segítségével. Dokumentumkezelés, információ digitalizálás OMA konferencia.
Programzáró szakmai nap Szolnok, november 12. Jász-Nagykun-Szolnok Megyei Verseghy Ferenc Könyvtár és Művelődési Intézet.
Adatkeresés az interneten
Assoc. Prof. Ján Gunčaga, PhD. Faculty of Education Catholic University in Ružomberok Nyílt forráskódú szoftverek és IKT az oktatásban.
N E M Z E T I A U D I O V I Z U Á L I S A R C H Í V U M NAVA project BudapestI Műszaki Egyetem Informatikai és Hírközlési Minisztérium NAVA 2005.
Hajós Katalin Budapest, június 5.
Digitalizálás a könyvtárban …mit, mivel, hogyan, mikor, miért, mennyire…
Jogi informatika1 INFORMATIKA III. alkalom szeptember ELŐADÓ.
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
Könyvtár- és informatikai alapismeretek kurzus október 7.
FELHASZNÁLÓI TRÉNINGEK Bevezetés a könyvtári katalógusok használatába.
Internet tudományos használata Skultéti Attila 2015.
ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR E-SZOLGÁLTATÁSI IGAZGATÓSÁG BIBLIOTHECA NATIONALIS HUNGARIAE Tömegek a közgyűjtemények szolgálatában Jó példák és tanulságok.
Adatbázisok használata a tájékoztatási gyakorlatban Dr. Nagy Enikő Csomád,
Internet tudományos használata Skultéti Attila 2015.
A JaDoX, mint repozitórium szoftver a közgyűjteményi informatikában JaDoX 3 Monguz Portál24 Monguz Kft. Mazula Zoltán.
A könyvtári dokumentumok digitális átállása
Információ és kommunikáció
Kísérleti magyar webarchiválási program A könyvtárak szerepe
A HTML alapjai Az internet és a web.
Lente Tamás Méliusz Juhász Péter Könyvtár
Szemelvények a MEK történetéből
ADESPRESSO – A KEDVENCED LESZ
Információtechnológiák és tudásbázis az Agrof-MM Leonardo+ projektben M=Mountain; M=Mediterranean
Elérhető magyar irodalom – olvasás? digitalizálás?
Internet és kommunikáció
Webes tartalmak digitális megőrzése
DRUPAL Előadja: Nagy Nikoletta :05.
"404 Not Found – Ki őrzi meg az internetet?"
Drótos László – Németh Márton (Országos Széchényi Könyvtár)
Tájékoztató a webarchiválás iránt érdeklődő munkatársak részére
A digitálisan született tartalmak megőrzése
A MÚZEUMI HÁLÓZAT TARTALOM- ÉS TÁJÉKOZTATÓ SZOLGÁLTATÁSAI
Networkshop 2019 Győr, április 26.
A webarchívum és a KDS kapcsolata
Előadás másolata:

Drótos László OSZK E-könyvtári Szolgáltatások Osztály Az internet archiválása, mint könyvtári feladat „A jövő könyvtára felé...” webinárium-sorozat II. Rákóczi Ferenc Megyei és Városi Könyvtár Miskolc, 2017. június 1.

A legnézettebb tartalom az interneten? 404 PAGE NOT FOUND! Egyben önálló kortárs művészeti ág is:

Ha elég kreatív a 404-es hibaoldal, akkor a felhasználó talán elfelejti, hogy miért is jött, vagy legalábbis nem bosszankodik annyira - de biztos, hogy nincs ennél jobb megoldás?

Lássunk egy példát: http://libinfo.oszk.hu A Find Mementos gombbal megnézhetők a weboldal korábbi állapotai...

amennyiben azokat valahol megőrizték ... amennyiben azokat valahol megőrizték. A Libinfo honlapról 195 mentés van az Internet Archive-ban. Ezek a Snapshot Table feliratra kattintva listázhatók ki.

A webarchive.org.uk/mementos oldalon a „Find Mementos” linket az egérrel megfogva húzzuk rá a könyvjelző eszköztárunkra, és megjelenik a gomb.

Miről lesz szó? Ki? Mit? Hogyan? Mivel? Miért? Hol tartunk? Hová kellene eljutni?

Ki? Magánemberek: érdeklődési körhöz, kutatási témához anyaggyűjtés miatt, vagy a saját ill. családtagjaik virtuális élete megőrzésének érdekében (könyvtárosi segítséggel, könyvtári oktatással, útmutatókkal) Vállalatok: saját online felületeik megőrzése cégtörténeti, ill. vitás esetekben bizonyítási célból, valamint a versenytársak és az adott piaci szegmens digitális információnak gyűjtése és kielemzése (adatbányászat) céljából (vállalati könyvtáros vagy infobróker bevonásával)

Ki? Intézmények: az intézmény vagy szervezet történetének dokumentálása céljából, jogszabályi előírás miatt (pl. kormányzati szerveknél), az intézmény szakterületével, feladatával kapcsolatos információforrások megőrzése érdekében (a helyi könyvtár és/vagy levéltár részvételével) Közgyűjtemények: a saját gyűjtőkörükbe tartozó digitálisan születő kultúra megőrzése az utókor számára és kutathatóvá tétele már a jelenben is (nemzeti, köz- és szakkönyvtárak, levéltárak, múzeumok, audiovizuális archívumok)

Mit? Legkönnyebben a web őrizhető meg, annak is a hagyományos formája, amely viszonylag jól begyűjthető és elraktározható automatikus vagy félautomatikus módszerekkel. De ez a „felszíni web” csak kis töredéke a teljes webnek. A „mély web” és a „sötét web” elérhetetlen a keresőgépek és az archiváló rendszerek robotjai számára. A dinamikusan generált oldalakból álló webkettes felületek (pl. Facebook, Twitter, Instagram, Flickr, Tumblr) csak emberi közreműködéssel, vagy emberi viselkedést szimuláló szoftverekkel menthetők.

Mit? Szintén nagy kihívás a hang és videó tartalmak (főként a sugárzott média) mentése és kereshetővé, szolgáltathatóvá tétele – már csak azok hatalmas tárhelyigénye miatt is (pl. YouTube, Vimeo, Twitch, Ustream, Facebook Live, SoundCloud, internetes rádiók és televíziók). A rengeteg mobil és asztali alkalmazás (pl. WhatsApp, Skype), amelyek gyakran saját „szabvány” szerint kommunikálnak a központi szerverrel, valamint a szerver nélküli (peer-to-peer) rendszerek tartalmának megőrzése pedig megint egy másfajta technikai problémát jelent.

Hogyan? Válogatva (pl. intézménytípus, műfaj, téma, esemény, híres ember szerint). Válogatás nélkül (pl. aldomén, országdomén, nemzeti webtér, globális webtér mentése). Szabályozottan (pl. kötelespéldány törvény, szerzői jogi törvény, személyes és üzleti adatok védelme). Szervezetten (pl. munkamegosztás a közgyűjtemények között, együttműködés a tartalomszolgáltatókkal, szabványos megoldások, összekapcsolt archívumok). Fenntarthatóan (pl. állami és EU-s költségvetés, tudományos kutatási alap, pályázatok, szponzorálás, fizetős szolgáltatások).

Mivel? Az internetezéshez használt szoftverek (pl. böngészők, levelezők, csevegőprogramok) saját mentési, exportálási, naplózási funkcióival. Kiegészítők (pl. böngészőbe beépülő modulok) telepítésével. Önálló archiváló szoftverek, alkalmazások, rendszerek segítségével (PC-n, mobilon, intézményi szerveren). Felhőszolgáltatások (pl. erre szakosodott cégek, szervezetek, könyvtárak és egyéb intézmények webarchiváló rendszereinek) igénybevételével.

Példák: ScrapBook X Ingyenes Firefox kiegészítő weboldalak letöltésére és a mentések kezelésére.

A letöltés különféle szempontok szerint szabályozható.

A mentési folyamat felügyelhető, menet közben is be lehet avatkozni.

A lementett oldalak kereshetők, szerkeszthetők, jegyzetelhetők, összefűzhetők.

Ingyenes szolgáltatás böngészések videómagnószerű rögzítésére. Példák: Webrecorder Ingyenes szolgáltatás böngészések videómagnószerű rögzítésére.

Ideális megoldás például a közösségi média archiválására.

A mentések a webrecorder.io tárhelyről WARC formátumban letölthetők...

... és a Webrecorder Player-rel visszanézhetők egy saját webszerverről.

Ingyenes webhely letöltő szoftver Windows-ra, magyar felülettel. Példák: HTTrack Ingyenes webhely letöltő szoftver Windows-ra, magyar felülettel.

A letöltés előtt – és részben közben is – rengeteg paraméter beállítható.

A letöltés állása folyamatosan látszik, a szükségtelen fájlok kihagyhatók.

Ingyenes, igény szerinti weboldal archiváló szolgáltatás. Példák: archive.is Ingyenes, igény szerinti weboldal archiváló szolgáltatás.

A megadott URL címen levő oldalról készít egy mentést és egy fotót.

Az archív példány stabil URL címe megosztható, sőt wiki-be is másolható.

Példák: Perma.cc Könyvtáraknak ingyenes, igény szerinti weboldal archiváló szolgáltatás.

Példák: WebCite Stabil hivatkozhatóságot biztosító ingyenes weboldal archiváló szolgáltatás.

Példák: Archive-It Az Internet Archive előfizetéses webarchiváló szolgáltatása pl. könyvtáraknak.

Mivel? Nagy méretű automatizált webarchívumoknál ma már többnyire az IIPC (International Internet Preservation Consortium) által támogatott megoldásokat használják (pl. egy vagy több összekapcsolt Linux szerveren): Heritrix aratószoftver (crawler, spider, web robot) OpenWayback megjelenítő NutchWAX kereső Web Curator Tool keretrendszer (ütemező, metaadatoló) * WARC tárolási formátum

Miért? hogy legyen múltja is az internetnek, ne csak jelene; hogy kutathassuk a virtuális világ történetét, valamint a valódi világ eseményeinek internetes lenyomatait; hogy megbízhatóan tudjunk hivatkozni tudományos publikációkban és tananyagokban online forrásokra; hogy helyreállíthatók legyenek elveszett webhelyek; hogy vitás esetekben bizonyítható legyen, hogy mi jelent meg egy weboldalon; hogy elemezni és ábrázolni lehessen a nagy tömegű digitális tartalmat; hogy a 404-es hibákra más megoldás is legyen, ne csak a vicces képek.

Példák: A National Library of Scotland honlapja

Példák: A tajvani nemzeti webarchívum idővonala

Példák: Trendelemzés a brit webarchívumban

Példák: Kanadai pártok webhelyeinek mérete

Hol tartunk? Internet Archive (1996 óta 286 milliárd weboldal). Kb. 40 nemzeti szintű webarchívum több mint 30 országban (általában már második generációsak). Sok kisebb-nagyobb projekt külföldi könyvtárakban, levéltárakban, állami hivataloknál, tudományos intézetekben, egyetemeken, vállalatoknál. Magyarországon még nincs komolyabb webarchívum. A 2010-es évek első felében az ELTE Tudománytörténet és Tudományfilozófia Tanszékén volt egy webaratási kísérlet: kb. 400 tudományos és oktatási intézet honlapját, valamint hírportálok anyagát mentették. A NAVA néhány éve az MTVA számára gyűjt online sajtóhíreket (jelenleg kb. 2 millió rekord).

Hol tartunk? Az OSZK az Országos Könyvtári Rendszer fejlesztése keretében 2017 márciusától 2018 végéig egy kísérleti fázisú webarchiválási projektet indított, azzal a céllal, hogy megalapozza egy leendő, üzemszerűen működő magyar internet archívum feltételeit. Egyelőre a technológia tesztelése, a külföldi jó példák megismerése, a szükséges elméleti és gyakorlati ismeretek megszerzése folyik. A számítógépes hátteret (szerver+tárhely) a KIFÜ-NIIF biztosítja. A projektbe bekapcsolódott már néhány közgyűjtemény és várjuk más érdeklődők jelentkezését is.

Honlap:http://mekosztaly.oszk.hu/mia/

Wiki:http://mekosztaly.oszk.hu/mia/MIA_wiki.html

Lista:http://mekosztaly.oszk.hu/cgi-bin/mailman/listinfo/mia-l

Az Állatkert honlapjának néhány próbamentése

Az archivált honlap a Wayback megjelenítőben

Hová kellene eljutni? Közgyűjtemények, intézmények és cégek közötti munkamegosztással működő, nagy teljesítményű, fenntartható nemzeti internet archívum, amely képes: rendszeresen menteni sok ezer fontos magyar webhelyet; alkalomszerűen menteni egyes hírforrásokat kiemelt eseményekhez kapcsolódva; évente kétszer egy reprezentatívnak tekinthető mentést csinálni a magyar webtérről; kötelespéldányként és önkéntesen beadott webes és más internetes tartalmakat befogadni; mindezeket hosszú távon megőrizni és megtekinthető állapotban tartani; szolgáltatásokat nyújtani az internetezők, a tartalomgazdák, a tudományos, oktatási, kormányzati és üzleti szféra számára.

Hová kellene eljutni? Legyenek nálunk is a webhelyek és az egyéb online források megőrzéséhez értő könyvtárosok, informatikusok és egyéb szakemberek, akik képesek akár magánszemélyek, akár más intézmények, akár a saját könyvtáruk, levéltáruk vagy múzeumuk számára kisebb-nagyobb archívumokat létrehozni. Legyen egy olyan jogi környezet, amely a magyar közgyűjtemények számára is lehetővé teszi, hogy a nyilvános internetről archiváljanak tartalmakat, valamint azokat – a szerzői és személyiségi jogi korlátozások figyelembevételével – nyilvánosan vagy helyben szolgáltassák.

Hová kellene eljutni? Inkább a 404-es hibák tűnjenek el, ne a weblapok... Köszönöm a figyelmet!