Rétegmentesítés megvalósítása XML segítségével Kovács Máté.

Slides:



Advertisements
Hasonló előadás
Táblázatkezelés Alapok.
Advertisements

Programozás III STRING-XML.
Belváros-Lipótváros Polgármesteri Hivatal egységes szerkezetű rendezési terveinek publikálása, karbantartása ASP szolgáltatás keretében Cselovszki Zoltán.
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
Hálózati architektúrák
Czeglédi László Integrált tartalomszolgáltatás megújult környezetben
Törökbálint város környezeti GIS alkalmazásainak megvalósítása
Kulturális értékek digitalizálása az Új Magyarország Fejlesztési Terv keretében Dippold Péter.
Elektronikus archiválórendszer fejlesztése PKI alapokon Készítette: Kollár Balázs november 11.
Számítástechnika Levelezőknek
Hernyák Zoltán XML validálás.
Szoftver bonyolultsági mértékek alkalmazási területei Király Roland 2011.
A Magyar Antikvakorpusz fejlesztése. A nyers korpusz főbb adatai A felölelt periódus: 1527–1576 A szövegek száma: 103 (több mint 43 szerzőtől, 9 műfajból,
WSDL alapismeretek A WSDL (Web Services Description Language – Web szolgáltatások leíró nyelv) egy XML-alapú nyelv a Web szolgáltatások leírására és azok.
WEB Technológiák WEB-DB és XML ME Általános Informatikai Tsz. dr. Kovács László.
XML támogatás adatbázis-kezelő rendszerekben
OAIS. Megőrzés feladatai Viability –Meg kell őrizni a bitfüzér változatlanságát és olvashatóságát a tároló eszközön Rendbebility –Meg kell őrizni a bitfüzér.
Könyvtár egy kicsit másképp - a Magyar Elektronikus Könyvtárról és legújabb fejlesztéseiről Szombathely, Góczán Andrea OSZK, MEK osztály.
Anyagadatbank c. tárgy gyakorlat Féléves tematika Adatbázis alapfogalmak, rendszerek Adatmodellek, adatbázis tervezés Adatbázis műveletek.
Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály XML-alapú komplex korpusz-lekérdezés.
Budapest, június 28. Ontológia kezelő modul tervezése szöveges információt kezelő informatikai rendszer számára Förhécz András BME Méréstechnika.
A NEMZETI ADATVAGYON INTEGRÁCIÓJA DIGITALIZÁLÁSI KONFERENCIA MÁJUS 21 – 22. DEBRECEN UJVÁRI MÁRIA.
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
2012. tavaszi félév Vitéz Gergely. A diasor ismerete nem helyettesíti a tankönyvet, és a példatárat. A diasor ismerete szükséges, de nem elégséges feltétele.
Műhelyvezetők, tanácsadók szakmai napja Csizmazia Sándorné Szakmai vezető Pécs, nov. 10.
Rendezések és szövegkezelő függvények
1/20 Kulturális örökség a Szemantikus Weben a Museum24 projekt Szász Barnabás Finnország, 2005.
A PLC programozási nyelvek bemutatása
Adatbázis kezelés.
WEB Technológiák WEB-DB és XML ME Általános Informatikai Tsz. dr. Kovács László.
10 dolog, amit EDIT-ről tudni kell
Adatbázis-kezelés Probléma: az excel kezelhetetlen túl sok adat esetén
XML fejlesztések TSQL fejlesztések Tábla paraméter SQLCLR fejlesztések 8k limit feloldása Több paraméteres UDA-ek Ordered UDF-ek Entity Framework ADO.NET.
XML adatkezelés 1. témakör Az XML szabvány.
Ma az un. Relációs adatmodelleket használjuk.
Turócziné Kiscsatári Nóra
Power Lutár Patrícia Pellek Krisztián.  -ltLess than  -leLess than or equal to  -gtGreater than  -geGreater than or equal to  -eqEqual to  -neNot.
HTML ÉS PHP (Nagyon) rövid áttekintés. ADATBÁZISRENDSZEREK MŰKÖDÉSI SÉMÁJA Felh. interakció DB Connector MySQL ? A gyakorlaton:
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
A digitális kötelespéldányok kezelése DIGITALIZÁLÁS LÉPÉSRŐL-LÉPÉSRE Budapest, november Horváth Ádám OSZK.
A web site minősítése Források: Bokor Péter szakdolgozata (2002) és a benne megadott hivatkozások: Dotkom Internet Consulting: Üzleti weboldalak elemzése,
A 2. géptermi beszámoló VBA anyagának összefoglalása
A projekt az Európai Unió társfinanszírozásával, az Európa terv keretében valósul meg. Számítógép- hálózatok dr. Herdon Miklós dr. Kovács György Magó Zsolt.
Automatikus fizikai tervezési javaslatok XML adatbázisokhoz Balogh Bernadett Kresz Marcell Cseh Tamás.
Gráfadatbázisok Rácz Gábor.
1 Függvények használata – az első függvénynél a formulát háromszor be kell írni, rendre az x, x+h, x-h argumentumokkal, – a második függvénynél az új (feltételes.
Az 5,6,7 laborok VBA anyagának összefoglalása
Adatbázisszintű adatmodellek
Bemutatkozik az Informatikai Műhely Lócsi Levente, Kovács Máté.
Az Office 2007 új fájlformátumai. DOCX, XLSX, PPTX, ACCDB: Új nyílt szabványú XML alapú fájlformátum (DOC nem nyílt szabványú) XPS: A dokumentum.
SIGNUM ….. Fejlesztési dokumentumokat kezelő rendszer Dr. Fenyő Róbert Ügyvezető igazgató.
Objektumok a Word-ben. OBJEKTUMOK Objektum fogalma Objektumok létrehozása Az objektumok tulajdonságai Az objektum elhelyezkedése Objektumok formázása.
Alapfogalmak Táblázatkezelés 1.. Tartalom Táblázatok készítése Cella, tartomány, munkalap, munkafüzetCella, tartomány, munkalap, munkafüzet Állományok,
A JaDoX, mint repozitórium szoftver a közgyűjteményi informatikában JaDoX 3 Monguz Portál24 Monguz Kft. Mazula Zoltán.
Banai Miklós Open Source 2012 – Az innováció motorja Az EuroOffice léphet az OpenOffice helyébe? Banai Miklós, MultiRáció Kft. 1/1/ Támogatott.
Webáruház rendszerek Reisz Péter G-3S
Lente Tamás Méliusz Juhász Péter Könyvtár
Digitális szakadék csökkentése Bálint Ákos projektvezető, KIFÜ
Önértékelési projektterv
BFák Kiegyensúlyozott keresőfák
Beépített függvények használata programozáskor
Hivatkozások beillesztése, animációk szerkesztése
Ubuntu – ismerkedés Fájlok és könyvtárak
Szervó motor helyzetének vezérlése potenciométer segítségével
Endnote Cite While You Write plugin 2013
Hálózati architektúrák
A JaDoX, mint repozitórium szoftver
Endnote Cite While You Write plugin 2015 Skultéti Attila
XML lekérdezőnyelvek XPath XQuery.
Annotációs eszközök Korpuszok a nyelvészeti kutatásban – szeptember 28.
Előadás másolata:

Rétegmentesítés megvalósítása XML segítségével Kovács Máté

Tartalom Motiváció: a HypereiDoc projekt A dokumentum kezelése: – Réteges szerkezetben – Rétegmentes szerkezetben A rétegmentesítés folyamata Megvalósítás XML segítségével Összegzés

A HypereiDoc projekt 2007 szeptemberétől, ELTE IK és Eötvös Collegium tagjainak részvételével Ókori szövegtöredékek megfejtése – Archimedes palimpsestus „Az én feladatom”: – rétegmentes szövegszerkesztő réteges adatbázis

Archimedes palimpsestus

A HypereiDoc projekt – folyt. Töredékesség => a szövegben „vitatható részek” Annotációk – vélemények a dokumentumhoz – fajtái : beszúró (pozícióra), jelölő (intervallumra) – átlapolások – Leiden konvenciók A szöveg megfejtése „több menetben” => rétegek A megfejtés folyamatát tároljuk

A réteges szerkezet Rétegek fajtái: – alapszöveg – annotációs réteg Célok: – tárolás az adatbázisban – (akár konkurens) bővíthetőség => konfliktuskezelés

A réteges szerkezet – példa

A rétegmentes szerkezet Egyetlen rétegben: – Alapszöveg – Annotációk a megfelelő pozíciónkon Célok: – az annotált szöveget „egyben” lássuk – szerkesztés – nyomtatás

A rétegmentes szerkezet - példa

A rétegmentesítés folyamata Az annotációs rétegek kiválasztása Konfliktusfeloldás (ha szükséges) A rétegek beszúrási sorrendjének meghatározása Az annotációinak beillesztése a felépülő rétegmentes dokumentumba

Rétegmentesítés - példa

Új réteg létrehozása Szerkesztés a rétegmentes szövegen Az újonnan beszúrt annotációk megjelölése A réteges szerkezetben új annotációs réteg Az adatbázisba csak az új réteg kerül

Új réteg létrehozása - példa

A felhasznált XML technológiák XPointer: – hivatkozás egy XML csomópontra (vagy részére) – léteznek kiterjesztései => követelményszintek (minimális / teljes) – pl.: #xpointer(doc("base")//pb[n=oldal] /following::lb[n=sor] /following::text()[1] /point()[pozíció])

A felhasznált XML technológiák - folyt. XPath: – egy „útvonal” az XML DOM-fában – XML csomópontok közötti tengelyek segítségével – pl.: preceding-sibling::node()[1]/self::element() XQuery – lekérdezés XML dokumentumon – hasonlít az SQL-re

XML adatbázisok Látszólag, mintha egy XML dokumentumba szervezve tárolnánk az adatokat. Dokumentumok gyűjteményekbe szervezhetők <= fájlrendszer könyvtárai Lekérdezés XQuery-vel Általunk használt adatbázis-kezelő: Sedna DB

Az XML adatbázis szerkezete a HypereiDoc projektben

TEI-P5 Digitális könyvtári szabvány XML alapú Referenciák a szövegen – pl.: annotációk hivatkozási pontjai – megvalósítás: XPointer segítségéve l – point() XPointer kiterjesztés

A réteges szerkezet XML szinten A TEI-P5 ajánlásai szerint Alapszöveg tagolása „mérföldkövekkel”: – oldal: – hasáb: – sor: Annotációk: – XML csomópontok – referenciák XPointer attribútumok segítségével

A réteges szerkezet XML szinten – folyt. Annotációk referenciái: – beszúró: target – jelölő: from és to Alapszövegbe mutató referencia: #xpointer(doc("base")//pb[n=oldal]/ following::lb[n=sor]/ following::text()[1]/point()[pozíció]) Annotációba mutató referencia: #xpointer(collection("annotations")// [xml:id="annotáció azonosítója"]/ text()[1]/point()[pozíció])

A rétegmentes szerkezet XML szinten XML dokumentumok és sémák részletes leírásai Ehelyett pár érdekesebb feladat: – Átlapolás problémája – Az XPointer-ek => szövegbeli pozíciók

Átlapolás a TEI-P5-ben A jól formáltság vagy a szemantikus tartalom sérül! városát hadi csellel elfoglalták

Az átlapolás megvalósítása a rétegmentes szerkezetben városát hadi csellel elfoglalták

Rétegmentesítés az XML szintjén Az annotációk beszúrása a felépülő XML dokumentumba A beszúró függvény – XQuery és XPath segítségével – tetszőleges szövegpozícióra – point() kiváltása – XPointer-ek => paramétert megadó pozíció

A beszúró függvény XQuery-ben részlet declare function local:insert_item($node, $offset as xs:decimal?, $item) { let $a:=0 return for $x in $node/child::node() let $prec := string-length(string-join( for $y in $x/preceding-sibling::text() return normalize-space($y),'')) let $seg_count := index-of($x/following-sibling::node(), $x/following-sibling::text()[1])[1] return...

A beszúró függvény XQuery-ben részlet – folyt.... return { if ($x/following-sibling::element()) then {$x, for $note in $x/following- sibling::element() [position() < $seg_count] return $note} else {$x}, {$item} }

Összegzés Réteges és rétegmentes szerkezet közötti átmenet: – absztrakt és implementációs szinten (XML) – oda-vissza – kollaboratív munka és szerkesztés – a TEI-P5 szabványnak megfelelően XPointer kiterjesztés megvalósítása – XPath és XQuery segítségével – nagyobb hordozhatóság