Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Az adattárház tervezése. Kétféle módszer:  Inkrementális: egy-egy adatpiacot hozunk létre egymás után  „Big bang”: az összes releváns adat tárolására.

Hasonló előadás


Az előadások a következő témára: "Az adattárház tervezése. Kétféle módszer:  Inkrementális: egy-egy adatpiacot hozunk létre egymás után  „Big bang”: az összes releváns adat tárolására."— Előadás másolata:

1 Az adattárház tervezése

2 Kétféle módszer:  Inkrementális: egy-egy adatpiacot hozunk létre egymás után  „Big bang”: az összes releváns adat tárolására hozzuk létre az adattárházat DWH DM DS DWH DM DS

3 Mindkét módszer az alábbi alapvető lépésekből áll: 1. Üzleti igények feltérképezése  Üzleti specifikáció 2. Logikai és fizikai rendszerterv elkészítése  Funkcionális specifikáció 3. Fizikai megvalósítás  Rendelkezésre álló adatpiac(ok) Az adattárház tervezése

4 Az inkrementális módszer előnyei:  gyorsabb és olcsóbb a tervezés  gyorsabb és olcsóbb a megvalósítás  az esetleges alapvető, koncepcionális hibák már korán megjelennek, javításuk egyszerűbb A „Big bang” módszer előnyei:  a további adatpiacok kiépítése jelentősen kisebb ráfordítást igényelnek  a különböző üzleti területek számára már rendelkezésre áll az adatmodell, aminek az alapján eldönthetik, hogy igénybe veszik-e, és ha igen, milyen mértékben a rendelkezésre álló adatokat  az adattárház kezdeti hibái (gyerekbetegségei) mát megoldottak a továbbfejlesztés kezdetekor  a további ősfeltöltések nem jelentenek többletráfordítást Az adattárház tervezése

5 1. Üzleti igények feltérképezése: A tudásmunkásoknak meg kell adniuk, hogy milyen mérőszámokat, és azokat milyen dimenziókra értelmezve szeretnék látni (pl.: üzleti terület: termék értékesítés; mérőszámok: értékesítések darabszáma, értékesítések összege; dimenziók: időszak, régió, hiteltípus) Az adattárház tervezése

6 Ezzel egyidejűleg specifikálni kell a dimenziók hierarchiáit illetve az egyes hierarchiák szintjeit (pl.: időszak: év – negyedév – hónap terület: régió – megye – város – fiók hiteltípus: felhasználás jellege: szabad, lakásvásárlási futamidő: éven belüli, éven túli – féléves, egyéves; stb. hónapos) Az adattárház tervezése

7 A leendő felhasználóknak a fejlesztőkkel együttműködve meg kell határozniuk, hogy melyik és milyen adatforrásokból szeretnék az információkat kinyerni, illetve hogy milyen eszközzel szeretnék megjeleníttetni az információkat (pl.: adatforrás: Oracle, MS Access megjelenítés: Cognos, Excel) Az adattárház tervezése

8 2. Logikai és fizikai rendszerterv elkészítése A rendszerterv része a logikai adatmodell és a fejlesztés átadásnál mellékelni kell a Felhasználói kézikönyvet. A felhasználók munkáját és a továbbfejlesztést azonban nagyban segítheti valamilyen metaadat-kezelő alkalmazás használata. Ez egy olyan eszköz, amelynek a segítségével könnyen feltérképezhető az egyes adatok pontos jelentése (azaz a forrásrendszerben mit reprezentálnak) illetve, hogy milyen logika mentén történik az adatok transzformálása és/vagy szűrése. Az adattárház tervezése

9 A modellezés során az adattárház struktúráján kívül részletesen ki kell térni (többek között) az alábbiakra:  Az adatok kinyerésének módja (pl.: DB-linkek, ODBC, Excel táblázat mentése szöveges állományként)  Az adatok betöltésének módja (pl.: DB-linkek, ODBC, csatolt forrásállományok)  Az adatok tisztításának mikéntje (pl.: null értékek helyettesítése 0-val, szélső értékek helyettesítése átlagértékekkel)  Az adatok szűrésének mikéntje (milyen attribútumokra van szükség illetve valamely attribútum mely értékeinek a fennállása esetén van szükség egy rekordra)  Az adatok integritásának biztosítása (keresztellenőrzések, egyediség ellenőrzése) Az adattárház tervezése

10 Az adattárház egy lehetséges felépítése vázlatosan: Az adattárház tervezése Forrásrend- szerek Információs rendszerek Szűkebb értelemben vett adattárház Metaadat-kezelő rendszer … DS 1 DS 2 DS 3 DS 4 DS n IS 1 IS 2 IS 3 IS 4 IS n … Forrásrendszerek adott napi lenyomata (OLTP struktúrában) Integrált adott napi adatok (ROLAP struktúrában) Historikus adatok (ROLAP struktúrában) Szűrés, közös platformra hozás Struktúra váltás, tisztítás, transzfor- málás Delta képzés (histori- zálás) Információ kinyerése, kocka generálás, adatpia- cosítás

11 A tervezés egyes lépései (a nyilak mentén): 1.  Az adatok kinyerésének meghatározása (pl.: DB-linkek, ODBC,Excel táblázat mentése szöveges állományként)  Az adatok betöltésének meghatározása (pl.: DB-linkek, ODBC,csatolt forrásállományok)  A közös platform kiválasztása (adatbázis típusa: pl.: Oracle, Microsoft; szerver operációs rendszere: Windows, Unix)  Az adatok szűrésének mikéntje (milyen attribútumokra van szükség illetve valamely attribútum mely értékeinek a fennállása esetén van szükség egy rekordra) Az adattárház tervezése

12 A tervezés egyes lépései (a nyilak mentén): 2.  Struktúra váltás OLTP-ről ROLAP-ra: elemzésre optimalizált témakörökre alapított adathalmazok objektumainak definiálása  Az adatok tisztításának mikéntjének meghatározása (pl.: null értékek helyettesítése 0-val, szélső értékek helyettesítése átlagértékekkel)  Adatok transzformálása (pl.: beépített szabályok szerint a program kódjában, változtatható szabályok szerint mapping táblával) Az adattárház tervezése

13 A tervezés egyes lépései (a nyilak mentén): 3.  Historikus adatok képzése:  Állományi adatoknál csak változás esetén kerül be új rekord  Tranzakciós adatoknál minden tranzakcióra bekerül egy rekord Az adattárház tervezése RUN_DATECUST_IDCUST_NAME … ADDR_POSTAL_CODE C012105KOVÁCS TAMÁS … C012105KOVÁCS TAMÁS … 2000

14 A tervezés egyes lépései (a nyilak mentén): 4.  Célrendszerek (Döntéstámogató Rendszerek, Vezetői Információs Rendszerek, Adatbányászati alkalmazások, Jelentéskészítő rendszerek, stb.)  Célrendszerek típusa:  multidimenzionális  relációs  irodai alkalmazás (pl.: Excel)  Információ kinyerésének módja (pl.: adatbázis-linkek, felhasználói szerepkörök az adattárházban, ODBC kapcsolat) Az adattárház tervezése

15 Metaadat-kezelés: A felhasználók, a fejlesztők és az üzemeltetők munkáját támogatandó nyilvántartásba veszik a forrásadatok és a kinyert információk közötti összefüggéseket:  Üzleti metaadatok (az adatok szemantikája)  Technikai metaadatok (az adatok szintaktikája) Az adattárház tervezése DWH DS IS szűréstranszf.

16 Köszönöm a figyelmet!


Letölteni ppt "Az adattárház tervezése. Kétféle módszer:  Inkrementális: egy-egy adatpiacot hozunk létre egymás után  „Big bang”: az összes releváns adat tárolására."

Hasonló előadás


Google Hirdetések