Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

SQL – OLAP 3. óra. MD szemantikai séma modell forgalom termék kategória bolt dátum hónap munkahét Hogyan modellezzük egzaktabb módon? nincs egységes modell.

Hasonló előadás


Az előadások a következő témára: "SQL – OLAP 3. óra. MD szemantikai séma modell forgalom termék kategória bolt dátum hónap munkahét Hogyan modellezzük egzaktabb módon? nincs egységes modell."— Előadás másolata:

1 SQL – OLAP 3. óra

2 MD szemantikai séma modell forgalom termék kategória bolt dátum hónap munkahét Hogyan modellezzük egzaktabb módon? nincs egységes modell

3 Cabibbo- Torlone szemantikai modell A modell elemei: - Dimenzió-sémák - Fogalom-sémák - Adatkocka-sémák - Adatbázis-sémák Grafikus jelölésrendszert is alkalmaz Egyszerűsített megközelítés ER-jellegű leírás

4 Cabibbo-Torlone modell Grafikus ábrázolás dimenzió-szint változó tulajdonság dimenzió hierarchia tény-dimenzió kapcsolat többértékű dimenzió mező dimenzió nem OO alapú kocka

5 forgalom nap negyedév termék gyártó kategória db érték név telep név dátum termék munkaügy létszám betegállomány Cabibbo-Torlone modell selejt db

6 univerzum : U fogalom-nevek halmaza: C = {c}  U típusok halmaza : T  U dimenzió-sémák halmaza: D= {d,R} dimenzió-séma: d = (L,<,P) L dimenzió szintek (L  C) < : szint hierarchia (<  L  L) P: tulajdonság (P : L  2 (C  T) ) dimenzió-bázisok : R r(d) = {h  L(d) |  h’ : h < h’} R = {r(d)} Cabibbo-Torlone modell

7 ténytábla-sémák halmaza: F = {f} ténytábla-séma: f = {(A 1 :I 1,..,A n :I n ), I 0 } f  C A i  C I i  r(R) I 0  2 (C  T) adatbázis-séma: DB = (C, T, D{d(L,<,P),R}, F{f(A:I):I 0 })

8 OSSZDB SELEJTDB ERTEKESITES TELEPHELY cim nev VEZETO nev BEOSZTAS megn alapfiz TERMEK ear nev KATEGORIA nev DATUM nap HO ho EV ev VAROS megn MEGYE megn Minta séma felírása C = {alapfiz, beosztas, ear, ertekesites, ev, cím, osszdb, selejtdb, telephely, termek, …} T = {int, char} D = {d termek, d datum,d telep, R} d termek = { {termek, kategoria}, {kategoria < termek}, {termek  (ear,int), termek  (nev,char), kategori  (nev,char)} } …

9 OSSZDB SELEJTDB ERTEKESITES TELEPHELY cim nev VEZETO nev BEOSZTAS megn alapfiz TERMEK ear nev KATEGORIA nev DATUM nap HO ho EV ev VAROS megn MEGYE megn Minta séma felírása R = {termek, datum, telephely} F = {ertekesites} ertekesites = { (termelte:telephely, termek:termek, datum:datum), {(osszdb,int) (selejtdb,int)} } DB = {C,T,D,F}

10 Cabibbo-Torlone modell Formális felírás előnyei: - egyértelműbb jelentés - könnyebben feldolgozható - tömörebb leírás - könnyebben konvertálható - alapot adhat további egyértelmű bővítésekre néhány további modell: - Li-Wang(1996) - Agrawal-Gupta-Sarawagi(1997) -ADAPT -…

11 MD műveletek Itt sincs egységes modell gyakorlatban elterjedt műveletek: - szűrés - aggregálás - szintváltás - összekapcsolás - kibontás … mintaként a relációs algebra jöhet szóba telep termek dátum adatkockán értelmezett, adatkockát előállító operátorok

12 MD műveletek Szelekcio (slice and dice) - változó szelekció  f(v) (F) A feltételnek eleget tévő cellák maradnak meg, a többi cella NULL értékű lesz - attributum szelekció  f(D.a) (F) A feltételnek eleget tévő dimenzió értékek maradnak meg, a többi kikerül a kockából  selejtdb > osszdb*0.2 (ertekesites)

13 MD műveletek Projekció (slice and dice) - változó projekció  v (F) A kijelölt változók maradnak meg a cellában - attributum projekció  D.a (F) A kijelölt attributumok maradnak meg a dimenziónál  selejtdb (ertekesites)  selejtdb (  selejtdb > osszdb*0.2 (ertekesites))

14 Dimenzió összevonás (roll up) - attributum szintű D1.D2 (F) A megadott dimenzióból a megadott dimenzióba való áttérés a dimenzió hierarchia mentén MD műveletek termek.kategoria (ertekesites) aggregáltabb adatokra való áttérés megváltozik a szint a megadott dimenziónál durvább felbontást kapunk

15 Dimenzió kibontás (drill down) - attributum szintű  D (F) A megadott attributum részletező dimenziójára való áttérés a dimenzió hierarchia mentén MD műveletek  varos (ertekesites) részletezőbb adatokra való áttérés megváltozik a szint az aktuális dimenziónál finomabb felbontást kapunk

16 MD műveletek Aggregáció (fold) - dimenzió szintű  D, aggr (F) A megadott dimenziók maradnak meg, az összevont cellák tartalmából az aggr aggregáció alapján képződik az eredő cella  termek, termelte, sum() (ertekesites) összesítőbb adatokra való áttérés szűkül a dimenzió készlet, csökken a dimenziószám durvább felbontást kapunk

17 MD műveletek Kiterítés (unfold) - dimenzió szintű  D (F) Behozza a kockába a megadott dimenziót (ha lehet)  termek (ertekesites) részletezőbb adatokra való áttérés bővül a dimenzió készlet, növekszik a dimenziószám finomabb felbontást kapunk

18 Szorzás (join) - adatkocka szintűF 1  F 2 A megadott adatkockákból olyan eredő adatkocka készítése, melyre - dimenzióhalmaza a F 1 és F 2 dimenzió halmazának uniója - váltózólistája a két lista összevonása, párosa - változó értékei a megfelelő koordinátájú értékek párosa MD műveletek ertekesites  rendeles

19 D1 D2 1 d11d12 d21 d22 d23 d24 F1F1 D3 D2 a d31d32 d21 d23 d24 d26 F2F2 MD műveletek b c a2 F 1  F 2 (d11, d23,d31) = (1,null) (d11, d24,d31) = (2,a) (d11, d26,d31) = (null,null) …

20 Kiterjesztés (extension) - változó szintű  v (F) Új változó hozzáadása, melynek értéke a meglévő változókból származtatható Pivotálás - adatkocka szintű  D1,D2,aggr (F) Áttérés aggregációk sorozatával kétdimenziós adatkockára MD műveletek  selejtdb / osszdb (ertekesites)  termek,datum (ertekesites)

21 MD műveletek Forgatás (rotation) - dimenzió szintű  d1,d2 (F) A megadott dimenziók helyet cserélnek egymással  termek,bolt (ertekesites) részletezés szintje változatlan dimenziószám nem változik más elrendezést biztosít ábrázoláshoz fontos

22 MD műveletek Rendezés (ordering) - dimenzió szintűo d,kif (F) A megadott dimenzió előfordulásainak rendezése o termek, nev (ertekesites) részletezés szintje változatlan dimenziószám nem változik más elrendezést biztosít ábrázoláshoz fontos

23 MD műveletek Mintapéldák - Az x-nél olcsóbb termékekre vonatkozó adatok  TERMEK.ear > x (ERTEKESITES) - Az x-nél rosszabb selejtarányú eladásra vonatkozó adatok:  selejtdb/osszdb > x (ERTEKESITES) - Adatkocka a selejtarányok nélkül  osszdb (ERTEKESITES) - Az x-nél nagyobb eladások ahol a terméknek csak a neve szerepel  TERMEK.nev (  osszdb > x (ERTEKESITES))

24 MD műveletek Mintapéldák - Értékesítési adatok város szerinti bontásban TELEPHELY.varos (ERTEKESITES) -Az x-nél rosszabb selejtarányú eladásra vonatkozó adatok megye bontásban: VAROS.megye ( TELEPHELY.varos (  selejtdb/osszdb > x (ERTEKESITES))) - Áttérés hónap bontásról napi bontásra  HO (C) ahol C = DATUM.ho (ERTEKESITES) - Értékesítési adatok termék és idő dimenzióban  TERMEK, DATUM, Sum (ERTEKESITES)

25 MD műveletek Mintapéldák - Az x-nél rosszabb selejtarányú eladásra vonatkozó adatok megye és hónap bontásban:  MEGYE, HONAP, Sum ( DATUM.ho ( VAROS.megye ( TELEPHELY.varos (  selejtdb/osszdb > x (ERTEKESITES)))) - Az értékesítési adatok összevonása egy KOLTSEG (ertek, TELEPHELY,HO) adatkockával:  TELEPHELY, HONAP, Sum ( DATUM.ho (ERTEKESITES))  KOLTSEG - Havi költségadatok megjelenítése dollárban  TELEPHELY, Sum (  ertek/ 225 dollar (KOLTSEG))


Letölteni ppt "SQL – OLAP 3. óra. MD szemantikai séma modell forgalom termék kategória bolt dátum hónap munkahét Hogyan modellezzük egzaktabb módon? nincs egységes modell."

Hasonló előadás


Google Hirdetések