R++-tree: an efficient spatial access method for highly redundant point data Kalmár Dániel (előadás), Németh Boldizsár (feldolgozás), Hollenczer Péter.

Slides:



Advertisements
Hasonló előadás
ÉRDEKES PONTOK KINYERÉSE DIGITÁLIS KÉPEKEN. BEVEZETÉS  ALAPPROBLÉMA  Jellemzőpontok detektálása mindkét képen  Kinyert pontok megfeleltetése  Megfeleltetések.
Advertisements

Készítette: Kosztyán Zsolt Tibor
Fejmozgás alapú gesztusok felismerése
4. Előadás: A mohó algoritmus
Függvények Egyenlőre csak valós-valós függvényekkel foglalkozunk.
Többfelhasználós és internetes térkép kezelés, megjelenítés.
Illés Tibor – Hálózati folyamok
Térinformatikai elemzések. Megválaszolható kérdések Pozíció - mi van egy adott helyen Feltétel - hol vannak …? Trendek - mi változott meg? Minta - milyen.
Minimális költségű feszítőfák
Hatékony gyorsítótár használata legrövidebb utak kereséséhez Bodnár István, Fodor Krisztián, Gyimesi Gábor Jeppe Rishede Thomsen, Man Lung Yiu, Christian.
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
FRAKTÁLOK.
Papp Róbert, Blaskovics Viktor, Hantos Norbert
Térinformatika (GIS) Házi feladat Keressen hibát a Google Earth vagy Maps adataiban, pl. az objektum jelölése nem esik egybe a műholdképen látható hellyel,
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
AVL fák.
Delaunay háromszögelés
MATEMATIKA ÉS INFORMATIKA I.
2D képszintézis és textúrák
Készítette: Kosztyán Zsolt Tibor
Access XP Kifejezés-szerkesztő Összehasonlító operátorok:
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Implementált képfeldolgozó algoritmusok
Dijkstra-algoritmus ismertetése
Készítette: Gergó Márton Konzulens: Engedy István 2009/2010 tavasz.
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
Problémás függvények : lokális optimalizáció nem használható Globális optimalizáció.
Optimalizáció modell kalibrációja Adott az M modell, és p a paraméter vektora. Hogyan állítsuk be p -t hogy a modell kimenete az x bemenő adatokon a legjobban.
Adatbázis-kezelés JAG,
Adatbányászati módszerek a térinformatikában
A Dijkstra algoritmus.
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1.
Gráfok 1. Szlávi Péter ELTE IK Média- és Oktatásinformatika Tanszék
A feladat : Építsünk AVL-fát a következő adatokból:100,170,74,81,136,185,150,122,52,190,144 (Az AVL-fa olyan bináris keresőfa, amelynek minden csúcsára.
A Van der Waals-gáz molekuláris dinamikai modellezése Készítette: Kómár Péter Témavezető: Dr. Tichy Géza TDK konferencia
Lineáris algebra.
Algoritmizálás, adatmodellezés tanítása 8. előadás.
INNOCSEKK 156/2006 Szent István Egyetem Gazdaság- és Társadalomtudományi Kar Egyetemi Tudományos Diákköri Konferencia november 24. Készítette: Vrabély.
Bellmann-Ford Algoritmus
Newton gravitációs törvényének és Coulomb törvényének az összehasonlítása. Sípos Dániel 11.C 2009.
Minuet: A Scalable Distributed Multiversion B-Tree Írta: Benjamin Sowell, Wojciech Golab, Mehul A. Shah Feldolgozta: Fokin Miklós, Hodosy Gábor, Tóth Tamás.
Gráfok ábrázolása teljesen láncoltan
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Korlátkielégítési problémák Autonóm és hibatűrő információs.
Útkeresések.
előadások, konzultációk
Bináris kereső fák Itterátorok.
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1. Egyetemi konzulens: dr. Dobrowiecki Tadeusz (BME MIT)
1.  Szerzői:  Panagiotis Bouros (University of Hong Kong),  Shen Ge (University of Hong Kong),  Nikos Mamoulis (University of Hong Kong)  Esemény:
Algoritmusok és adatszerkezetek
PhD beszámoló 2003/2004 I. félév Készítette: Iváncsy Renáta Konzulens: Dr. Vajk István.
Védelmi technikák: fizikai védelem UPS RAID
HÁLÓZAT Maximális folyam, minimális vágás
A Dijkstra algoritmus.
Vizualizáció és képszintézis
BFák Kiegyensúlyozott keresőfák
Mesterséges intelligencia
Algoritmusok és Adatszerkezetek I.
Mesterséges intelligencia
Nem módosítható keresések
Bevezetés Tematika Számonkérés Irodalom
Egy topologikus térbeli adatstruktúra a topo-logix modell
Depth First Search Backtracking
Algoritmusok és Adatszerkezetek I.
Dijkstra algoritmusa: legrövidebb utak
Dijkstra algoritmusa: legrövidebb utak
Gráfok - 1 Definíció: Irányított gráf (digráf) G=(V,E) rendezett pár.
Dijkstra algoritmusa: legrövidebb utak
2-3-fák A 2-3-fa egy gyökeres fa az alábbi tulajdonságokkal:
Előadás másolata:

R++-tree: an efficient spatial access method for highly redundant point data Kalmár Dániel (előadás), Németh Boldizsár (feldolgozás), Hollenczer Péter (implementáció)

A dolgozatról Szerzők: Martin Šumák, Peter Gurský kassai P. J. Šafárik Egyetem ADBIS 2013 konferencián mutatták be

“spatial access method” általános probléma: pontok vagy geometriai alakzatok elhelyezése N-dimenziós térben, ezeken keresési műveletek végrehajtása alkalmazás sokrétű: adatbázisok, térinformatika, 3D modellezés és renderelés, fizikai szimulációk, stb…

Gyakori térbeli keresési problémák range search: adott geometriai forma által befoglalt pontok keresése kNN (k nearest neighbor): adott pont k db. legközelebbi szomszédjának keresése top-k search: fuzzy értékek között, súlyozással számított összegekben legjobb találatok keresése Ezek a keresések idő hiányában nem lesznek részletesebben bemutatva - minden adatstruktúrán hasonlóan működnek és meglepően egyszerűek. A kihívás az adatstruktúra megfelelő felépítése, hogy a keresés minél hatékonyabban fusson.

Létező térpartícionálási megoldások BSP-tree (~1969, 1980) R-tree (1984) k-d tree (1975)Quadtree / Octree (1974) R-tree továbbfejlesztései: ●R* ●R+ ●R++ ●stb. (R# ?) “quad” = 4 (részre osztás 2 dimenzióban) k-d = k- dimensional BSP = binary space partitioning R = rectangle

“point data” minden pontokat tartalmazó térpartícionáló megoldás kiterjeszthető geometriai alakzatokra - de nem feltétlen hatékonyan az R++ fa nem nagyon alkalmas erre, így csak pontokkal érdemes foglalkozni hivatalos magyarázat: a kutatás célja (aminek keretében feltalálták) pontszerű adatok feldolgozása volt

“highly redundant” a redundancia itt a pontok közelségére, tömörülésére utal minél nagyobb dimenzióban dolgozunk, annál ritkábbak lesznek a pontok (Curse of Dimensionality) az R++ fa tapasztalat alapján általános esetben csak alacsony dimenziókban működik hatékonyan, de bizonyos esetekben ez nem feltétlen igaz (mérések jönnek)

“efficient”? Hatékonyabb a “legjobb” R* fánál… bizonyos esetekben. Pár mérési eredmény a szerzőktől, generált adatokra:

Pszeudo-valós adatok A szerzők kutatása alapjául szolgáló konkrét probléma adatain vett mérések (6 dimenzióban, de kevesebb attribútumra keresve) :

Mérési eredmények értelmezése a dimenziók számával egyenesen arányosan romlik a hatékonysága az R*-hoz képest alacsony dimenziókban általában fel tudja venni a versenyt az R*-gal, de nem feltétlen jobb bárhol viszont bizonyos speciális esetekben jóval gyorsabb (valós adatok, top-k search) megjegyzés: beszúrási hatékonysága sokkal jobb az R*-nál R+-fa: “nehezen” implementálható és lassú

De mi az az R++ fa? az R* és R+ fák továbbfejlesztése (amik az R-fa továbbfejlesztései) megértéséhez ezek megértése szükséges az R-fák általános tulajdonságai: o a szülő a gyerekeit magába ölelő AABB-t (axis aligned bounding box) tárol o csak a levelek tárolnak pontokat o egy node több gyereket is magába foglalhat (nem bináris) o kiegyensúlyozott

Az R-család fái közti különbségek a bounding box konkrét tulajdonságai (minimális? átfedés van?) beszúrásnál a pont helyét megtaláló heurisztika (átfedésnél vagy üres területen) telített node-ok szétvágásának módszere implementációs kérdések

A minimális bounding box probléma Feladat: szúrjuk be a megjelölt pontot egy levélbe (minimális bounding box) Probléma: bármelyik levélbe szúrjuk be, annak a bounding box-át bővíteni kell, és átfedés keletkezik

A maximális bounding box probléma Feladat: szúrjuk be a megjelölt pontot egy levélbe (maximális bounding box) Probléma: mivel a téglalapok maximálisak, a keresés kevésbé lesz hatékony ezen a fán

Eddigi megvalósítások R: minimális bounding box, lehet átfedés, beszúrás: ahol a legkevésbé kell növelni a boxot R*: bounding boxban lehet átfedés, beszúrás levél szinten: ahol a legkisebb az átfedés, magasabb szinten: mint R-fa R+: átfedés elkerülése, de egy objektum több levélbe is be lehet szúrva, lassabb felépítés, implementációs problémák split algoritmusok: sokféle, különböző szempontok alapján: átfedés csökkentése, sebesség, keresést lassító helyzetek elkerülése

Az R++ fa titka Hogyan oldjuk meg a min és max bounding box problémákat? Mindkettőt nyilvántartjuk. A maximálisat (br) beszúrásnál használjuk, a minimálisat (mbr) keresésnél. Átfedést nem engedünk meg.

Beszúrási heurisztika beszúrásnál br alapján bejárjuk a fát, mbr-t bővítve (ha szükséges) a heurisztika triviális, mivel br maximális (lefedik az egész teret) és átfedésmentes, így minden (a térbe eső) pontra egyértelműen meg tudjuk határozni a haladás irányát

Szétvágó algoritmus (levélre) minden dimenzióra o minden pontra a levélben  szétvágjuk a levelet a pont mentén  kiszámoljuk a különbséget a szétvágás két oldalán a minimális különbséget adó szétvágás lesz a levélen a vágás

Levél szétvágása valós példán

Szétvágó algoritmus (belső node-ra) (belső node = nem levél node) minden dimenzióra o minden gyerek node-ra  az mbr felső és alsó határára az adott dimenzióban vágjuk szét e mentén, az aktuális dimenzió tengelyére merőlegesen a node-ot o m1 := az ezzel szétvágott bounding boxok száma o m2 := a nem szétvágott bounding boxok számának különbsége a vágás két oldalán a végleges vágás az m1-ek minimumát adó vágás lesz o ha több ilyen van, az m2 alapján döntünk (minimalizálva a különbséget)

Belső node szétvágása valós példán

Vége… Köszönöm a figyelmet! Kérdések?