Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Adattárházak 2011.11.26. Láng András. Üzleti Intelligencia Cél: Jó minőségű adat Helyesen felhasznált információ + tudás + profit Üzleti Intelligencia.

Hasonló előadás


Az előadások a következő témára: "Adattárházak 2011.11.26. Láng András. Üzleti Intelligencia Cél: Jó minőségű adat Helyesen felhasznált információ + tudás + profit Üzleti Intelligencia."— Előadás másolata:

1 Adattárházak Láng András

2 Üzleti Intelligencia Cél: Jó minőségű adat Helyesen felhasznált információ + tudás + profit Üzleti Intelligencia Business Intelligence (BI)

3 Üzleti Intelligencia • Adatvagyon menedzsment Adatminőség  konszolidáció, adattisztítás Adatleltár  adatkatalógusok, metaadat-kezelés Törzsadatok  MDM,egyéb törzsadat nyilvántartások • Központi riportfejlesztés és riportmenedzsment Adattárházból  integrált, historikus forrásból Más rendszerekből  forrásrendszerből, adatbázis linken keresztül Törzsadat mulplikátumok felderítése, számuk csökkentése Adatpótlás, helyesbítés érvényes adatokkal Zajok kiszűrése Technikai és üzleti metaadatok nyilvántartása Off-line, on-line metaadat karbantartás Törzsadat-kezelés (Master Data Management) Pl. Központ Ügyféltörzs Pl. címadatszótárak, cégnyilvántartások

4 Adattárházak létjogosultsága • Egymástól elszigetelt rendszerek Lekérdezés csak az adott rendszer adataira készíthető • Operatív rendszerek Általában csak aktuális adatok Normalizált struktúrák • Adattárház Integrált Historikus Denormalizált adatszerkezet

5 Sokrétű felhasználás Adatbányászat Rejtett összefüggések algoritmus segítségével vagy manuálisan történő feltérképezése, számszerűsítése. Mutatószámok képzése Kulcsfontosságú (KPI) mutatószámok előállítása és prezentálása közérthető, esztétikus formában. Elemzések készítése Nagy mennyiségű információ megjelenítése úgy, hogy az szükség szerint szűrhető, kategorizálható legyen. Riportok, jelentések készítése Táblázatos vagy azzá alakítható formátumú, rögzített adattartalommal rendelkező lekérdezések eredménytáblái. Operatív/front-end rendszerek ellátása adatokkal Jellemzően tételes, könnyen származtatható adatok előállítása és továbbítása. Általában kiemelt fontosságú a rendelkezésre állás. Komplexitás, erőforrás igény

6 Az adattárházak felhasználási területei (példák) A kinyert információ felhasználásaVégfelhasználó Rövid- és hosszútávú stratégiai döntések meghozatalához szükséges jelentések Felső- és középvezetők, a menedzsment Jelentésszolgálat a felügyeleti szervek felé A jelentéseket szolgáltató területek dolgozói (illetve később természetesen az érintett felügyeleti szerv dolgozói) Multinacionális vállalatok esetén adatszolgáltatás az anyavállalat felé Az anyavállalatnál dolgozó elemzők illetve a csoportszintű menedzsment tagjai A szervezet normális működéséhez szükséges elemzések például egy bankban a hitelkockázat-elemzési területen dolgozók

7 Az adattárház helye DWH PS (SS) IS (TS) ED (SS) PS ED (TS) PS (SS) PS (SS) PS (SS) IS (TS) PS (TS,SS) PS: Operatív rendszer (Production System) SS: Forrásrendszer (Source System) TS: Célrendszer (Target System) IS: Információs rendszer (Information System) ED: Elektronikus dokumentum (Electronic Document) PS (SS)

8 Az adattárház típusai Adattárház adattisztítás, historizálás, struktúraváltás, kalkulációk, szűrés Célrendszerek információs rendszerek Forrásrendszerek operatív és egyéb rendszerek staging réteg transzformációs réteg adatpiac réteg staging réteg adatpiac réteg háromrétegű kétrétegű

9 Az adattárház egy lehetséges felépítése Forrásrend- szerek Információs rendszerek Adattárház Metaadat-kezelő rendszer … PS 1 PS 2 PS 3 PS 4 PS n IS 1 IS 2 IS 3 IS 4 IS n … Forrásrendszerek előző napi lenyomata (OLTP struktúrában) Integrált előző napi adatok (ROLAP struktúrában) Historikus adatok (ROLAP struktúrában) Szűrés, közös platformra hozás Struktúraváltás, tisztítás, transzformálás Delta-képzés (historizálás) Információ kinyerése Adatpiacok (ROLAP vagy MOLAP struktúrában) Kocka- generálás, Adatpiacosítás

10 Az adattárházak fejlesztése Kétféle fejlesztési metódus: • Big Bang A Big Bang fejlesztés során felmérik a szervezek különböző egységeiben az aktuális és lehetséges (releváns) igényeket, majd felépítik az adattárházat, beleértve az adatpiacokat is. • Inkrementális Az inkrementális fejlesztés alkalmazásánál egy igény jelentkezése során felépítenek egy (esetleg több) adatpiacot. Az igénynek nyilvánvalóan olyannak, kell lennie, amely kielégítése adattárház igénybe vételével lenne célszerű. Az előbbi értelemszerűen hosszabb átfutási idejű ás költségesebb fejlesztést igényel, mint az utóbbi. (Természetesen a változáskövetéssel elkészülő újabb adatpiac verziók is fejlesztés révén valósulnak meg.)

11 Az adattárházak fejlesztése Az inkrementális fejlesztés ábráján az egy nem egy adatforrást jelez, hanem a fejlesztéshez felhasznált forrásrendszerek halmazát. DWH PS DWH DM PS 1. inkremens2. inkremens3. inkremens Inkrementális Big Bang DM PS DM PS

12 Az adattárházak fejlesztése Előny (+)/Hátrány (-)Big BangInkrementális Igények felmérése - Az egyes szervezeti egységek nem biztos, hogy szükségét érzik a fejlesztésnek, ezért az együttműködés csorbát szenvedhet. + Mivel az érintett terület nyújtotta be az igényt, bizonyosan teljes mértékben együttműködik. Többletmunka újabb igények felmerülése esetén + Általában már tartalmazza az adattárház a szükséges adatokat. - Gyakran nem tartalmazza még az adattárház a szükséges adatokat. Fejlesztési, üzemeltetési költségek Fejlesztés időigénye - Sokszorosa az inkrementálisnak. + Töredéke a Big Bang-nek. Tárhely igény - Már a kezdetekkor nagy. + Eleinte kevesebb, az egyes inkrementumok beépülésével nő.

13 Az adattárházak fejlesztése A fejlesztés menete (mindkét esetben): 1.Igények felmérése, követelmények meghatározása 2.Logikai adatmodell elkészítése (az igények lefordítása) 3.Forrásadatok megkeresése, forrásrendszerek feltérképezése 4.Fizikai adatmodell elkészítése (platformfüggően valamennyi objektumra) 5.Megvalósítás 6.Tesztelés (felhasználói – adattartalmi, performanciális, regressziós) 7.Ősfeltöltés (az adattárház feltöltése a régebbi adatokkal pl. archív adatbázisokból) 8.Élesítés A két legalapvetőbb különbség a hagyományos és az adattárház fejlesztés között a fenti 3. és 7. pont. A 3. pont a forrásrendszerek integrálásából, a 7. pont az adatok historikus mivoltából adódik.


Letölteni ppt "Adattárházak 2011.11.26. Láng András. Üzleti Intelligencia Cél: Jó minőségű adat Helyesen felhasznált információ + tudás + profit Üzleti Intelligencia."

Hasonló előadás


Google Hirdetések