Automatikus fizikai tervezési javaslatok XML adatbázisokhoz Balogh Bernadett Kresz Marcell Cseh Tamás.

Slides:



Advertisements
Hasonló előadás
Készítette: Kosztyán Zsolt Tibor
Advertisements

GRIN: Gráf alapú RDF index
A Szállítási feladat megoldása
Készítette: Kosztyán Zsolt Tibor
10. gyakorlat SQL SELECT.
Adatbázis-kezelés Készítette: Asztalos Péter január 12.
Lekérdezések SQL-ben Relációs algebra A SELECT utasítás
ADATBÁZISOK.
Adatbázis-kezelés.
A tervezés mint menedzsment funkció
Oracle tuning server.101/b10752/toc.htm.
Az MVC tervezési minta 2. előadás.
Matematika II. 2. előadás Geodézia szakmérnöki szak 2012/2013. tanév Műszaki térinformatika ágazat őszi félév.
INFOÉRA Kombinatorikai algoritmusok (Horváth Gyula és Szlávi Péter előadásai felhasználásával) Juhász István-Zsakó László: Informatikai.
Hatékony gyorsítótár használata legrövidebb utak kereséséhez Bodnár István, Fodor Krisztián, Gyimesi Gábor Jeppe Rishede Thomsen, Man Lung Yiu, Christian.
KOVÁCS DÁVID. ALAPFOGALMAK Adatbázis: Olyan adatgyűjtemény, amely egy adott feladathoz kapcsolódó adatokat szervezett módon tárolja, és biztosítja az.
16. Tétel. Adatbázis: Olyan adatgyűjtemény, amely egy adott feladathoz kapcsolódó adatokat szervezett módon tárolja, és biztosítja az adatokhoz való hozzáférést,
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Adatbáziskezelés az MSAccess programmal Makány György 2. rész: Adattáblák létrehozása külső adatforrásból.
az MSAccess programmal
Papp Róbert, Blaskovics Viktor, Hantos Norbert
Adatbázis-kezelés ACCESS program:
OPERÁCIÓKUTATÁS Kalmár János, 2012 Tartalom A nulla-egy LP megoldása Hátizsák feladat.
2006. október 2.Markó Tamás, PTE TTK1 Az Oracle SQL 5. Nézettáblák létrehozása, módosítása és törlése.
SQL Server 2005 relációs adattárház technológiák
Oktassunk adatbázis-kezelést! Micskei Zoltán Microsoft Referencia Iskola.
Az adatfeldolgozás forrásai
Access alapok Táblák, kapcsolatok, űrlapok.
Dijkstra algoritmusa Egy csúcsból a többibe vezető legkisebb költségű út megkeresése Az algoritmus működésének leírása és bemutatása LL.
WEB Technológiák ISAPI ME Általános Informatikai Tsz. dr. Kovács László.
XML támogatás adatbázis-kezelő rendszerekben
Készítette: Kosztyán Zsolt Tibor
Microsoft Access Űrlapok.
Statisztika, kutatásmódszertan I.
1 Informatikai Szakképzési Portál Adatbázis kezelés Alapfogalmak.
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
Problémás függvények : lokális optimalizáció nem használható Globális optimalizáció.
SZTIR Projekt Szaktanácsadási Tartalomszolgáltató Információs Rendszer Névjegyzék december 20. Nagy Attila, GAK TSzK.
Készítette: Tóth Ervin
11. tétel Adatbázis táblái közti kapcsolatok optimalizálása
Adatbázis kezelés.
Adatbázis-kezelés Probléma: az excel kezelhetetlen túl sok adat esetén
Tömeggyarapodás hasonlóságelemzése Melyik tápanyag összeállítás lenne a legmegfelelőbb sertések számára, minél nagyobb tömeggyarapodás elérése céljából.
Előadó: Nagy Sára Mesterséges intelligencia Kereső rendszerek.
Adatbázis fejlesztés állapota Jelenlegi állapot: Elkészültek a legfontosabb kulcslisták, és a hozzájuk tartozó feltöltési módosítási nézetek.
Algoritmizálás, adatmodellezés tanítása 8. előadás.
Többtáblás lekérdezések, hierarchikus lekérdezések, allekérdezések
Adatbázis-kezelés. Alapfogalmak Adat: –észlelhető, felfogható ismeret –jelsorozat –valakinek, vagy valaminek a jellemz ő je –tény, közlés Információ:
Adatbázis-kezelés 3-4. Adatok lekérdezése utasítás általános formája SELECT [ALL/DISTINCT] {*/, …, } FROM [ ], …, [ ] [WHERE GROUP BY, …, HAVING ORDER.
Útkeresések.
Menetrend optimalizálása genetikus algoritmussal
Diszjunkt halmazok adatszerkezete A diszjunkt halmaz adatszerkezet diszjunkt dinamikus halmazok S={S 1,…,S n } halmaza. Egy halmazt egy képviselője azonosít.
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Fájlszervezés Adatbázisok tervezése, megvalósítása és menedzselése.
Lekérdezések feldolgozása és optimalizálása. Haladó adatbázisokLekérdezések feldolgozása és optimalizálása2 Definíciók Lekérdezés feldolgozása –lekérdezés.
Adatbázisszintű adatmodellek
ACCESS ALAPOK Alapfogalmak
SQL aggregálás, csoportosítás és összekapcsolás Adatbázisok 1.
Az adatbázis az adatok és a köztük lévő összefüggések rendszere, amelyet egymás mellett tárolunk. Nagyon fontos, hogy az adatbázisunk szerkezetét jól megtervezzük,
Operációkutatás I. 1. előadás
Alapfogalmak Adat: rögzített ismeret
Nevezetes algoritmusok
Adatbázis alapismeretek
Adatbáziskezelés.
Relációs algebra lekérdezések optimalizációja
Mesterséges intelligencia
Adatbázis-kezelés 2. Relációs adatbázisok.
Relációs algebra lekérdezések optimalizációja
Algoritmusok és Adatszerkezetek I.
Előadás másolata:

Automatikus fizikai tervezési javaslatok XML adatbázisokhoz Balogh Bernadett Kresz Marcell Cseh Tamás

Előadás témája XML adatbázisok tervezésének automatizálása Legmegfelelőbb teljesítményjavító struktúrák kiválasztása Három tanácsadó bemutatása XML indexekhez XMLTable materializált nézetekhez Az előző kettőt egybe integrálóhoz

XML adatbázisok Háromféle megközelítés Natív XML adatbázis XML adat relációs adatbázisban (XMLType típusú tábla) XML oszloptípus Nálunk Relációs adatbázis egy táblájában, natívan, XML típusú oszlopban tárolt XML adat A legtöbb kereskedelmi adatbázis-kezelő rendszer támogatja

Lekérdezések végrehajtásának optimalizálása Közvetlen elérés biztosítása (indexek) Adatok egy részének csoportosítása (nézetek, partícionálás) Lekérdezés átírása kisebb adathalmazra

Fizikai tervezés általánosan Hogyan állapítsuk meg a lehetséges struktúrákat, melyek hasznosak a lekérdezés halmazon? Hogyan terjesszük ki a jelölteket általánosabb javaslatokra? Hogyan számítsuk ki a becsült költségét a fizikai tervnek? Hogyan válasszuk ki a lehetséges konfigurációk közül a legjobbat?

Alapfogalmak XPath XML csomópontok kiválasztása XQuery Lekérdezés XML dokumentumokban SQL/XML SQL kiterjesztése XML lekérdezésére

Alapfogalmak XML index Elemek kinyerésének gyorsítása Materializált nézet Hasonlít a táblákhoz: saját adatszegmenssel rendelkezik Valamint a nézetekhez: lekérdezés eredményét tárolja

Alapfogalmak XMLTable nézet XMLTable az SQL/XML egyik legfontosabb függvénye Kiértékeli az XQuery kifejezést, majd visszatér egy táblával A táblából nézetet készítünk Parciális index Az adathalmaz egy részén értelmezett index

Alapfogalmak Virtuális index Nincs külön szegmense Végrehajtási tervek készítésénél hasznos Hátizsák probléma Ismerjük a kapacitását, illetve az elemek méretét és értékét Melyikből mennyit kell belerakni, hogy maximális legyen az érték, de elférjenek Speciális esete: 0/1 hátizsák probléma (minden elem maximum egyszer szerepel)

XML indexek ajánlása A cél egy olyan tervezési tanácsadó létrehozása, amely a legjobb parciális indexeket ajánlja, figyelembe véve a költségeket Két új lekérdezés optimalizáló mód Index felsoroló Index kiértékelő

XML indexek ajánlásának lépései 1. Index jelöltek felsorolása Implementáció függő 2. Ezek általánosítása Lekérdezés specifikus indexek általánosítása

XML indexek ajánlásának lépései 3. Költségek becslése Előnyök és többlet költségek 4. Optimális konfiguráció megkeresése 0/1 hátizsák problémával ekvivalens Tudjuk minden index-jelöltre a költséget (mérete) és a hasznot Heurisztikus mohó algoritmussal oldjuk meg A lekérdezések, XML minták és általánosított jelöltek kapcsolatát irányított, körmentes gráffal (DAG) reprezentáljuk

XMLTable nézetek ajánlása Célunk egy olyan tanácsadó készítése, amely XQuery lekérdezésekhez XMLTable materializált nézeteket ajánl

XMLTable nézetek ajánlásának lépései 1. XQuery részekre bontása FOR, LET, WHERE, RETURN részekre 2. Lehetséges XMLTable nézetek felsorolása 3. SQL/XML lekérdezés generálása A már létrehozott nézeteket használja fel

XMLTable nézetek ajánlásának lépései 4. A lekérdezésre legjobban illeszkedő nézetek kiválasztása Költség alapján 5. Az eredeti lekérdezés átírása A javasolt nézetek használatával

Optimalizálási tanácsok A materializált nézetek mérete túl nagyra nőhet Elveszíti előnyét Parciális indexek mérete kisebb Nem minden esetben segít

Optimalizálási tanácsok 1. Előre navigálás Előre megnézzük az XML adat lekérdezésben használt elemeit Könnyen elérhető formában tároljuk 2. Táblák összekapcsolása XQuery lekérdezés gyorsítása Előre navigálunk a szükséges adatokhoz Relációs táblában eltároljuk Ezeket összekapcsoljuk

Optimalizálási tanácsok 3. Összesítés Előre csoportosítjuk és/vagy összesítjük a nézet adatait Mindhárom megközelítés jelentősen csökkenti a végrehajtási időt

Indexek és nézetek ajánlása egyszerre Célunk olyan tanácsadó létrehozása, amely figyelembe véve az indexeket és nézeteket, a legjobb konfigurációt ajánlja Háromféle jelöltet kapunk XML index XMLTable materializált nézet XMLTable materializált nézet indexekkel

Indexek és nézetek ajánlásának lépései 1. Jelöltek haszon/méret arány szerinti rendezése 2. Minden iterációban megnézzük, új lefedést ad-e a jelölt Ha igen és van elég tárhely, hozzáadjuk az ajánlottakhoz Különben, ha átfedés van a már lefedett lekérdezések és a jelölt lefedése között, heurisztikus szabályok alapján eldöntjük hozzáadjuk vagy ne

Hatékonyság Indexek keresése Heurisztikus mohó algoritmussal a leggyorsabb Indexek általánosítása Fentről lefelé keresés hatékonyabb a heurisztikus mohó algoritmusnál

Hatékonyság Összefésült (általános) XMLTable nézet ajánlása Összefésüléssel 16%-os méret csökkenés, de jelentősen csökkent a sebesség is Előny/méret arányban jobban megéri XMLTable nézet ajánlása relációs indexekkel 1,5 – 32,5 százalékos gyorsulás az index nélküli nézetekhez képest

Hatékonyság Index és nézet ajánlása Változó eredményeket kaphatunk Néha a csak Index Tanácsadót és néha a csak Nézet Tanácsadót használók teljesítménye jobb Az Integrált Tanácsadó teljesítménye kiegyensúlyozott, ezért javasolt

Implementált algoritmus Legelőnyösebb indexjelöltek részhalmazának keresése Heurisztikus A lekérdezésekre megadott indexjelöltek halmazából indul ki

Algoritmus lépései 1. Jelöltek haszon/méret arány szerinti rendezése 2. Minden iterációban vesszük a legnagyobb értékűt és eldöntjük, hozzáadjuk-e az ajánlott konfigurációhoz Ha van még rendelkezésre álló tárhely

Algoritmus megjegyzései

Köszönjük a figyelmet!