Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

SQL – OLAP 2. óra. Multi-dimenzionális adatmodell A normalizált relációs modell bonyolult a felhasználók számára TELEP(tkod, nev, kozpont, regio,...)

Hasonló előadás


Az előadások a következő témára: "SQL – OLAP 2. óra. Multi-dimenzionális adatmodell A normalizált relációs modell bonyolult a felhasználók számára TELEP(tkod, nev, kozpont, regio,...)"— Előadás másolata:

1 SQL – OLAP 2. óra

2 Multi-dimenzionális adatmodell A normalizált relációs modell bonyolult a felhasználók számára TELEP(tkod, nev, kozpont, regio,...) TERMÉK(kod, megnevezes, egysegar,...) TERMELES(termek, telep, datum, db, kategoria,...) ‘termelés alakulása a keleti régióra vonatkozóan az elmúlt három hónapra vonatkoztatva..’ CREATE VIEW v1 AS SELECT termek, datum, sum(db) as odb FROM termeles WHERE datum BETWEEN sysdate() AND sysdate() – 90 GROUP BY termek, datum; SELECT b.megnevezes, c.odb, b.egysegar*c.odb as ertek, c.datum FROM Telep a, termek b, v1 c WHERE a.tkod = c.telep AND c.termek = b.kod AND a.regio = “Kelet” ORDER BY megnevezes, datum ;

3 Multi-dimenzionális adatmodell ‘ugyanez keresztreferencia táblázat formában.. grafikonon…’ CREATE VIEW v2 AS SELECT b.megnevezes, c.odb, b.egysegar*c.odb as ertek, c.datum FROM Telep a, termek b, v1 c WHERE a.tkod = c.telep AND c.termek = b.kod AND a.regio = “Kelet” ORDER BY megnevezes, datum ; SELECT SUM(CASE megnevezes WHEN ‘cipo’ THEN ertek ELSE 0) CIPO, SUM(CASE megnevezes WHEN ‘kalap’ THEN ertek ELSE 0) KALAP, SUM(CASE megnevezes WHEN ‘ing’ THEN ertek ELSE 0) ING, … FROM v2 GROUP BY datum termékek dátumok

4 Multi-dimenzionális adatmodell telep termek dátum Adatkocka felépítése A relációs táblák egydimenziós (egy kulcs) struktúrák Lehetővé kell tenni, hogy több kulcs is rendelhető legyen az adatokhoz

5 Adatkocka és relációs tábla összevetése telep termek dátum terméktermeléstelep Kétirányú átalakítás, ekvivalens struktúrák

6 Adatkocka alkotó elemek Tény (fact) Tag (member) Dimenzió(dimension) Dimenzió érték Tulajdonság (attribute) Adatcella Dimenzió hierarchia telep termek dátum Változó (measure) Adatkocka (cube)

7 MD séma modell Vásárlás - érték - tömeg Dátum - év - hó -- nap Vevő - név - kód Bolt - név - cím - vevő Cella -érték - darab - tömeg bolt Csillag (star) modell

8 Minta csillag modell nehéz a különböző aggregációs szintek, ismétlődő dimenziók kezelése

9 MD séma modell forgalom termék bolt dátum hónap Galaxis (fact constellation) modell reklamáció napi forgalom napi forgalom

10 Minta a galaxis modellre Nehéz a kapcsolódó dimenziók kezelése

11 forgalom régióbolt Csillag modell A forgalmat bolt és régió bontásban is szeretnénk látni a: két külön dimenzió(érték függőség, ritka kocka) forgalom - régió bolt b: egy dimenzió (eltérő szint, nem egyenrangú, korlátozott) külön dimenzió kellene, úgy hogy a kapcsolat megmaradjon

12 Dimenzió hierarchia Ország AOrszág B régió AArégió AB megye AB1megye AB2 Járás AB11Járás AB12 Település AB12ATelepülés AB122B ország régió megye járás település sémaelőfordulás bázisszint

13 Összetett dimenzió hierarchia

14 MD séma modell forgalom termék kategória bolt dátum hónap munkahét Hópehely (snowflake) modell

15 Minta a hópehely modellre osztott dimenziók kezelése

16 MD séma modell forgalom termék bolt dátum(nap) Hópehely-háló modell reklamáció hónap negyedév régió gyártó

17 Befoglalt adatkocka Egy adatkocka (cube) adatait a dimenzióhierarchia mentén haladva és a dimenziók bevonásával eltérő részletezettségi szinten szemlélhetjük. Ezek a cuboid-ok

18 Tervezési irányelvek konzisztens dimenziók Teljességet adó dimenziók Degenerált dimenziók Többértékű dimenziók Date Product Country sum TV VCR PC 1Qtr 2Qtr 3Qtr 4Qtr U.S.A Canada Mexico sum Aggregációs függvények lehetnek: - disztributív (min(), max(), sum()) - algebrai (avg(), stddev()) - holistic (median(), rank())

19 Relációs modell konverziója - tényadatok feltárása - kapcsolatok feltárása - ténytáblák, tagok meghatározása - dimenziók kijelölése - idő dimenzió behozatala - egyéb dimenzió bővítés - attribútumok meghatározása - dimenzió hierarchia meghatározása közben ügyelni a következőkre: - dimenzió konzisztencia - dimenzió teljesség - osztott dimenziók - időbeliség (változik-e)

20 Konverziós mintapélda CREATE TABLE TEL(CIM C(30), VEZ REF(DOLG), NEV C(20), HELY REF (VAROS), FUVAROZO REF(FUV), PK(NEV)) CREATE TABLE TERTEKESIT(ARU REF(TERM), DATUM D, TELEP REF(TEL), OSSZ N(6), SELEJT N(6), PK(ARU,DATUM,TELEP)) CREATE TABLE DOLG(KOD N(3), NEV C(20), BEOSZT REF(BEO), FIZ N(5), PK(KOD)) CREATE TABLE RENDELES(RKOD N(6), IDO D, DARAB N(5), ARU REF(TERM), VEVO REF(VEVO), PK(RKOD)) CREATE TABLE TERM (KOD N(4), NEV C(20), KATEG C(20), PK(KOD)) CREATE TABLE VEVO (KOD N(4), NEV C(20), VAROS REF VAROS, UCIM C(20), PK KOD) CREATE TABLE VAROS (NEV C(20), MEGYE C(20) CREATE TABLE FUV (FKOD N(3), NEV C(20),CÍM C(50), PK(FKOD))

21 Konverziós mintapélda TEL TERTEKESIT DOLG RENDELES TERM VEVO VAROS FUV TELEPHELY ERTEKESITES FUVAROZO RENDELES TERMEK VEVO VAROS

22 TELEPHELY ERTEKESITES FUVAROZO RENDELES TERMEK VEVO VAROS MEGYE KATEGORIA DATUM HO EV Konverziós mintapélda

23 OSSZDB SELEJTDB ERTEKESITES TELEPHELY cim nev FUVAROZO nev, cim TERMEK cim nev KATEGORIA nev DATUM nap HO ho EV ev VAROS megn MEGYE megn

24 MD séma rekordszinten tény tábla név típus dimenzió tábla név típus dimenzió tábla név típus dimenzió tábla név típus

25 Fizikai megvalósítás TELEPHELY cim nev TERMEK cim nev KATEGORIA nev OSSZDB SELEJTDB Logikai struktúra Dorog Miskolc Baja AudiOpelFiatLada

26 Dorog Miskolc Baja AudiOpelFiatLada Fizikai megvalósítás 7,26,17,03,2 9,17,4 7,24,2 K GP LAFO ritkán kitöltött kocka

27 Tervezési irányelvek- minőségbiztosítás

28 A DW több mint aggregált adattáblák rendszere

29 Időbeli változás követése A struktúra jelentős változáson mehet át - dimenzió változás - dimenzió hierarchia változás - tényváltozó változása Változó dimenziók átiródik teljes verzió tulajdonság verzió Változások konzisztens követése?

30 Időbeli változás követése

31 Kocka megalkotása A problémakör több fogalmat fog egybe, ezek rendezhetők - hybercube sémába vagy - multicubes sémába -Hypercube egyszerűség ritka kitöltésű nagy eltérés a fizikai szinttől -Multicube: - block mode több változó egységben - series mode egy kocka csak egy változó

32 Projekt feladat Minta MD modell kidolgozása PE-re Katica csavargyár modulok: 1. raktár 2. gyártás 3. rendelés/vevői és saját 4. számlázás 5. munkaügy 6. szerviz 7. bérügy


Letölteni ppt "SQL – OLAP 2. óra. Multi-dimenzionális adatmodell A normalizált relációs modell bonyolult a felhasználók számára TELEP(tkod, nev, kozpont, regio,...)"

Hasonló előadás


Google Hirdetések