Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
SQL – OLAP 3. óra
2
MD szemantikai séma modell
hónap termék forgalom dátum kategória bolt munkahét Hogyan modellezzük egzaktabb módon? nincs egységes modell
3
Cabibbo- Torlone szemantikai modell
A modell elemei: - Dimenzió-sémák - Fogalom-sémák - Adatkocka-sémák - Adatbázis-sémák Grafikus jelölésrendszert is alkalmaz Egyszerűsített megközelítés ER-jellegű leírás
4
Cabibbo-Torlone modell
Grafikus ábrázolás mező dimenzió tulajdonság dimenzió-szint dimenzió hierarchia tény-dimenzió kapcsolat változó többértékű dimenzió kocka nem OO alapú
5
Cabibbo-Torlone modell
létszám munkaügy betegállomány selejt db db forgalom érték nap név termék dátum termék negyedév kategória gyártó telep név
6
Cabibbo-Torlone modell
univerzum : U fogalom-nevek halmaza: C = {c} U típusok halmaza : T U dimenzió-sémák halmaza: D = {d,R} dimenzió-séma: d = (L,<,P) L dimenzió szintek (L C) < : szint hierarchia (< L L) P: tulajdonság (P : L 2(C T) ) dimenzió-bázisok : R r(d) = {h L(d) | h’ : h < h’} R = {r(d)}
7
Cabibbo-Torlone modell
ténytábla-sémák halmaza: F = {f} ténytábla-séma: f = {(A1:I1,..,An:In) , I0} f C Ai C Ii r(R) I0 2(C T) adatbázis-séma: DB = (C, T, D{d(L,<,P),R}, F{f(A:I):I0})
8
C = {alapfiz, beosztas, ear, ertekesites, ev, cím, osszdb, selejtdb,
Minta séma felírása C = {alapfiz, beosztas, ear, ertekesites, ev, cím, osszdb, selejtdb, telephely, termek, …} T = {int, char} OSSZDB SELEJTDB ERTEKESITES TELEPHELY cim nev VEZETO BEOSZTAS megn alapfiz TERMEK ear KATEGORIA DATUM nap HO ho EV ev VAROS MEGYE D = {dtermek, ddatum,dtelep, R} dtermek = { {termek, kategoria}, {kategoria < termek}, {termek (ear,int), termek (nev,char), kategori (nev,char)} } …
9
R = {termek, datum, telephely} F = {ertekesites} ertekesites = {
Minta séma felírása R = {termek, datum, telephely} F = {ertekesites} ertekesites = { (termelte:telephely, termek:termek, datum:datum), {(osszdb,int) (selejtdb,int)} } OSSZDB SELEJTDB ERTEKESITES TELEPHELY cim nev VEZETO BEOSZTAS megn alapfiz TERMEK ear KATEGORIA DATUM nap HO ho EV ev VAROS MEGYE DB = {C,T,D,F}
10
Cabibbo-Torlone modell
Formális felírás előnyei: - egyértelműbb jelentés - könnyebben feldolgozható - tömörebb leírás - könnyebben konvertálható - alapot adhat további egyértelmű bővítésekre néhány további modell: - Li-Wang(1996) - Agrawal-Gupta-Sarawagi(1997) ADAPT …
11
Itt sincs egységes modell
MD műveletek Itt sincs egységes modell telep termek dátum gyakorlatban elterjedt műveletek: - szűrés - aggregálás - szintváltás - összekapcsolás - kibontás … mintaként a relációs algebra jöhet szóba adatkockán értelmezett, adatkockát előállító operátorok
12
MD műveletek Szelekcio (slice and dice) - változó szelekció f(v)(F) A feltételnek eleget tévő cellák maradnak meg, a többi cella NULL értékű lesz - attributum szelekció f(D.a)(F) A feltételnek eleget tévő dimenzió értékek maradnak meg, a többi kikerül a kockából selejtdb > osszdb*0.2 (ertekesites)
13
MD műveletek Projekció (slice and dice) - változó projekció v(F) A kijelölt változók maradnak meg a cellában - attributum projekció D.a (F) A kijelölt attributumok maradnak meg a dimenziónál selejtdb (ertekesites) selejtdb ( selejtdb > osszdb*0.2 (ertekesites))
14
MD műveletek Dimenzió összevonás (roll up) - attributum szintű D1.D2(F) A megadott dimenzióból a megadott dimenzióba való áttérés a dimenzió hierarchia mentén aggregáltabb adatokra való áttérés megváltozik a szint a megadott dimenziónál durvább felbontást kapunk termek.kategoria (ertekesites)
15
MD műveletek Dimenzió kibontás (drill down) - attributum szintű D(F) A megadott attributum részletező dimenziójára való áttérés a dimenzió hierarchia mentén részletezőbb adatokra való áttérés megváltozik a szint az aktuális dimenziónál finomabb felbontást kapunk varos (ertekesites)
16
MD műveletek Aggregáció (fold) - dimenzió szintű D, aggr(F) A megadott dimenziók maradnak meg, az összevont cellák tartalmából az aggr aggregáció alapján képződik az eredő cella összesítőbb adatokra való áttérés szűkül a dimenzió készlet, csökken a dimenziószám durvább felbontást kapunk termek, termelte, sum() (ertekesites)
17
MD műveletek Kiterítés (unfold) - dimenzió szintű D(F) Behozza a kockába a megadott dimenziót (ha lehet) részletezőbb adatokra való áttérés bővül a dimenzió készlet, növekszik a dimenziószám finomabb felbontást kapunk termek (ertekesites)
18
MD műveletek Szorzás (join) - adatkocka szintű F1 F2 A megadott adatkockákból olyan eredő adatkocka készítése, melyre - dimenzióhalmaza a F1 és F2 dimenzió halmazának uniója - váltózólistája a két lista összevonása, párosa - változó értékei a megfelelő koordinátájú értékek párosa ertekesites rendeles
19
MD műveletek F1 F2 d24 2 d26 a d23 1 2 d24 a D2 d22 3 D2 d23 b d21 5 d21 c d11 d12 d31 d32 D1 D3 F1 F2 (d11, d23,d31) = (1,null) (d11, d24,d31) = (2,a) (d11, d26,d31) = (null,null) …
20
MD műveletek Kiterjesztés (extension) - változó szintű v(F) Új változó hozzáadása, melynek értéke a meglévő változókból származtatható Pivotálás - adatkocka szintű D1,D2,aggr (F) Áttérés aggregációk sorozatával kétdimenziós adatkockára selejtdb / osszdb (ertekesites) termek,datum (ertekesites)
21
MD műveletek Forgatás (rotation) - dimenzió szintű d1,d2(F) A megadott dimenziók helyet cserélnek egymással részletezés szintje változatlan dimenziószám nem változik más elrendezést biztosít ábrázoláshoz fontos termek,bolt (ertekesites)
22
MD műveletek Rendezés (ordering) - dimenzió szintű od,kif(F) A megadott dimenzió előfordulásainak rendezése részletezés szintje változatlan dimenziószám nem változik más elrendezést biztosít ábrázoláshoz fontos o termek, nev (ertekesites)
23
MD műveletek Mintapéldák - Az x-nél olcsóbb termékekre vonatkozó adatok TERMEK.ear > x (ERTEKESITES) - Az x-nél rosszabb selejtarányú eladásra vonatkozó adatok: selejtdb/osszdb > x (ERTEKESITES) Adatkocka a selejtarányok nélkül osszdb (ERTEKESITES) Az x-nél nagyobb eladások ahol a terméknek csak a neve szerepel TERMEK.nev (osszdb > x (ERTEKESITES))
24
MD műveletek Mintapéldák - Értékesítési adatok város szerinti bontásban TELEPHELY.varos (ERTEKESITES) Az x-nél rosszabb selejtarányú eladásra vonatkozó adatok megye bontásban: VAROS.megye (TELEPHELY.varos (selejtdb/osszdb > x (ERTEKESITES))) Áttérés hónap bontásról napi bontásra HO (C) ahol C = DATUM.ho (ERTEKESITES) Értékesítési adatok termék és idő dimenzióban TERMEK, DATUM, Sum (ERTEKESITES)
25
MD műveletek Mintapéldák Az x-nél rosszabb selejtarányú eladásra vonatkozó adatok megye és hónap bontásban: MEGYE, HONAP, Sum (DATUM.ho (VAROS.megye (TELEPHELY.varos (selejtdb/osszdb > x (ERTEKESITES)))) Az értékesítési adatok összevonása egy KOLTSEG (ertek, TELEPHELY,HO) adatkockával: TELEPHELY, HONAP, Sum (DATUM.ho (ERTEKESITES)) KOLTSEG - Havi költségadatok megjelenítése dollárban TELEPHELY, Sum (ertek/ 225 dollar (KOLTSEG))
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.