Multidimenzionális Adatbázisok Alapjai Nyírcsák Zoltán – F4CSMV alien@sch.bme.hu www.sch.bme.hu/~alien/olap
Mi a multidimenzionális adatbázis ? A multidimenzionális adatbázis egy számítógépes szoftverrendszer, mely lehetővé teszi nagy mennyiségű adat hatékony és egyszerű tárolását. az adatok egymással valamilyen módon összefüggenek különböző nézetek – perspektívák, dimenziók - alapján tároljuk és vizsgáljuk őket
Az információ felhasználása A kapott információkból a menedzserek: Stratégiákat állítanak fel Trendeket ismernek fel Üzleti döntéseket hoznak
Az alapvető cél Vezetők által feltett kérdések, amik az üzleti életre vonatkoznak Adatainkat különféle perspektívákból szemléljük Nagy mennyiségű adatot érint Gyors válaszidő szükséges Átlátható formátumú eredményt akarunk
Relációs Adatbázis (miért nem jó ?) Komplex lekérdezések Több táblás join-ok Indexelések Lassú válaszidő Nehezen átlátható eredmény
ELADOTT MENNYISÉG – GLEASON KERESKEDÉS Egy relációs tábla ELADOTT MENNYISÉG – GLEASON KERESKEDÉS MODELL SZÍN ELADOTT MENNYISÉG MIKROBUSZ SPORT KUPÉ SEDAN KÉK PIROS FEHÉR 6 5 4 3 2
“Cross-Tab” nézetek - Tömbök ELADOTT MENNYISÉG – GLEASON KERESKEDÉS 6 5 4 MIKROBUSZ MODELL 3 5 5 KUPÉ 4 3 2 SEDAN KÉK PIROS FEHÉR SZÍN 2 dimenzió (perspektíva) : szín, modell – 3-3 elemmel Egyszerűbb kinézet Több információ nyerhető belőle ránézésre
Egy nagyobb tábla Nézzük az előbbi táblát, kiegészítve még egy dimenzióval! Dimenzió : KERESKEDÉS 3 db értékkel Táblaméret : 3x3x3 = 27 Probléma : áttekinthetetlen
Megjelenítés többdimenzióban ELADOTT MENNYISÉG – GLEASON KERESKEDÉS MODELL MIKROBUSZ 6 5 4 KUPÉ 3 5 5 SEDAN 4 3 2 CLYDE GLEASON CARR KÉK PIROS FEHÉR KERESKEDÉS SZÍN
Teljesítménybeli előnyök Relációs esetben az egy rekord kikeresésének átlagos költsége 1000 rekord esetén : 500 Multidimenzionális esetben 3 dimenziót feltételezve ez 5+5+5=15 Költségcsökkenés 3300 %-os
Mikor használjuk, mikor ne ? IGEN Az mezők értéke ismétlődést mutat Eredendően összefüggő adatok, amikből fontos üzleti információt nyerhetünk NEM Különféle, nem ismétlődő értékek Tipikus relációs táblák, korrelálatlan adatok, kevés (rejtett) összefüggés
Műveletek multidimenzionális adathalmazon Forgatás – új nézet egyszerű műveletel Szűkítés (átméretezés) – a fontos elemekre fókuszálunk (redukált tömb) Multidimenzionális lekérdezések Hierarchikus felépítésnél – roll-up, drill-down
Szervezeti hierarchia SZERVEZETI DIMENZIÓ RÉGIÓ MIDWEST KERÜLET CHICAGO ST.LOUIS GARY KERESKEDÉS CLYDE GLEASON CARR LEVI
Multidimenzionális lekérdezések Egyszerűbb nyelvezet Átlátható eredmény Gyors válaszidő MDX (MultiDimensional eXpression)
Architektúra Kliens-szerver Multi user OLTP és OLAP rendszerek külön Miért ? OLTP – egyenletes terhelés, folyamatos, kis intenzitású query-k OLAP – ritka, nagy intenzitású kérések, nagy adatmennyiséget érint Szétválasztás nélkül a tranzakciós rendszer teljesítménye romlik
További jellemzők Idő dimenzió – legtöbb rendszerben beépített támogatás van rá Ritka adatok (sparse data) kezelése Hierarchikus dimenziók Partíciók Kockák, virtuális kockák Aggregátumok
Kereskedelmi szoftverek TM1 Oracle Express MS OLAP Services (Analysis Services)