Az adattárház tervezése

Slides:



Advertisements
Hasonló előadás
Multidimenzionális Adatbázisok Alapjai
Advertisements

Számalk-MIS Tanácsadó Kft. Tel:
ADATBÁZISOK.
Adatbázis gyakorlat 1. Szerző: Varga Zsuzsanna ELTE-IK (2004) Budapest
Informatika I. 6. Adattábla függvények, érzékenységi vizsgálatok.
Hatékonyságvizsgálat, dokumentálás
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR AUTO- SZŰRŐ FEJLESZTÉSE TÁBLÁZAT ALAPÚ JELENTÉSEK UTÓLAGOS, BÖNGÉSZŐN BELÜLI TOVÁBB- FELDOLGOZÁSÁRA.
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR KUTATÓK ÉJSZAKÁJA SZEPTEMBER 24. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS, OFFLINE.
Adattárházak Láng András.
Szűcs Imre CRM elemző GE Consumer Finance Budapest Bank Rt.
SeaLog digitális nyom-elemző rendszer Digitális nyom elemzése az informatikai eseménytérben.
Vezetékjogi nyilvántartás
Fekvőbeteg adatbázis szervezés GyógyinfokPirisa Levente.
Az egészségügy finanszírozásának informatikája
A DBMS fő feladatai: - adatstruktúra (adatbázisséma) definiálása,
Microsoft Access V. Készítette: Rummel Szabolcs Elérhetőség:
Adattárházak kialakulása, építése és elemzése (Rövid áttekintés)
Programozás alapjai A programozás azt a folyamatot jelenti, melynek során a feladatot a számítógép számára érthető formában írjuk le. C++, Delphi, Java,
KOVÁCS DÁVID. ALAPFOGALMAK Adatbázis: Olyan adatgyűjtemény, amely egy adott feladathoz kapcsolódó adatokat szervezett módon tárolja, és biztosítja az.
16. Tétel. Adatbázis: Olyan adatgyűjtemény, amely egy adott feladathoz kapcsolódó adatokat szervezett módon tárolja, és biztosítja az adatokhoz való hozzáférést,
Logisztika 6.előadás.
Adatbányászat. Miért kell menedzselni a tudást és az adatokat? Az adatok mennyisége folyamatosan nő Az elektronikus dokumentáltság növeli az átláthatatlan.
SQL - OLAP 1. óra.
Az adatfeldolgozás forrásai
Gazdasági informatika II.félév
WEB Technológiák ISAPI ME Általános Informatikai Tsz. dr. Kovács László.
Nemzeti Fejlesztési Terv (NFT) = Európa Terv Humánerőforrás-fejlesztési Operatív Program (HEFOP) 4.4 intézkedés: Egészségügyi információ- technológiai.
AVIR – intézményi adatmodell K+F+I szekció február 2.
Vezetői Információs Rendszer Kialakítása a Szegedi Tudományegyetemen Eredmények - Tapasztalatok Vilmányi Márton.
Önkiszolgáló üzleti intelligencia az SQL Server 2012-ben
Első lépések Hogyan kezdjünk hozzá
Microsoft BI technológiák az eszközmenedzsment szolgálatában
Szaktanácsadás SQL Server UpgradeTeljesítményoptimalizálás Replikáció kialakítás Disaster Recovery tervezés.NET Framework alapú fejlesztések.
Anyagadatbank c. tárgy gyakorlat Féléves tematika Adatbázis alapfogalmak, rendszerek Adatmodellek, adatbázis tervezés Adatbázis műveletek.
Önálló labor bemutató 8. szemeszter 5. oktatási hét Sümeghy Tamás Pál GFHSRE március 13.
Térkép. Mi az adat? Minden információ, amit tárolni kell. Minden információ, amit tárolni kell.  szám  szöveg  dátum  hang  kép, stb.
Statisztika, kutatásmódszertan I.
Adatbázisrendszerek világa
Zrínyi Miklós Nemzetvédelmi Egyetem
1 Informatikai Szakképzési Portál Adatbázis kezelés Alapfogalmak.
Közlekedésmodellezés Készítette: Láng Péter Konzulens: Mészáros Tamás.
Önálló labor munka Csillag Kristóf 2005/2006. őszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
Nézzük, mit tudunk…. Mire gondoltam? Megjeleníti az adott adatbázishoz kapcsolódó összes objektumot : adatbázis ablak.
Magas szintű Ipari Automatizálás Kérdések és válaszok Funkcióblokkon belüli indirekt címzés (CX-Programmer)
Adatbányászat és üzleti intelligencia SPSS – MicroStrategy integráció
Adatbázis kezelés. Az adatbázis tágabb értelemben egy olyan adathalmaz, amelynek elemei – egy meghatározott tulajdonságuk alapján – összetartozónak tekinthetők.
Alkalmazói programok Integrált felhasználói rendszerek Számítómunkahelyen szükséges felhasználói programokat egy csomagban, modulokban tartalmazza; az.
KÖZÖS MÓDSZERTANI KERETEK KIALAKÍTÁSA A MAGYARORSZÁG-SZERBIA IPA HATÁRON ÁTNYÚLÓ EGYÜTTMŰKÖDÉSI PROGRAM HÁTRÁNYOS HELYZETŰ TÉRSÉGEINEK KOMPLEX ÉS INTEGRÁLT.
1 Verseny 2000 gyakorlat ODBC Adatforrás létrehozása.
Adatbázis kezelés.
Adatbázis rendszerek I Relációs adatmodell strukturális része Általános Informatikai Tsz. Dr. Kovács László.
Az üzleti rendszer komplex döntési modelljei (Modellekkel, számítógéppel támogatott üzleti tervezés) II. Hanyecz Lajos.
A Microsoft Üzleti Intelligencia megoldása és platformja
Készítette:Képes Edina 10/d
Adatbázis alapfogalmak
Elektronikus tanulási forráskezelő keretrendszer, kompetencia-fejlesztő program adatbázis létrehozása Calderoni program.
Adamkó Attila UML2 Adamkó Attila
Adatbázis-kezelés. Alapfogalmak Adat: –észlelhető, felfogható ismeret –jelsorozat –valakinek, vagy valaminek a jellemz ő je –tény, közlés Információ:
Adattár alapú Vezetői Információs Rendszer fejlesztése a Miskolci Egyetemen Bordás Katalin Miskolci Egyetem Számítóközpont.
Adatbáziskezelés. Adat és információ Információ –Új ismeret Adat –Az információ formai oldala –Jelsorozat.
KONFIGURÁCIÓKEZELÉS è A projektirányítás a költségekkel, erőforrásokkal és a felhasznált idővel foglalkozik. è A konfigurációkezelés pedig magukkal a termékekkel.
Microsoft alapú VIR megoldás az egyetemeken Lénárt Marcell.
Miért van szükség loggyűjtésre és logelemzésre? Vámos Balázs Információvédelem menedzselése XXIX. Szakmai fórum Január 16.
Készítette: Kiss András
Kimutatás-pivot tábla, Excel 2010
A könyvtári integrált rendszerek statisztikai moduljának használata
Az ORACLE JDE EnterpriseOne ERP rendszer bevezetésének tapasztalatai
Kovács Gergely Péter Bevezetés
Adatbázis-kezelés.
Barcsák Marianna KPSZTI
Előadás másolata:

Az adattárház tervezése

Az adattárház tervezése Kétféle módszer: Inkrementális: egy-egy adatpiacot hozunk létre egymás után „Big bang”: az összes releváns adat tárolására hozzuk létre az adattárházat 2. DM DM DM DM DM DM 3. DWH DWH 1. 1. 2. 3. DS DS DS DS DS DS

Az adattárház tervezése Mindkét módszer az alábbi alapvető lépésekből áll: Üzleti igények feltérképezése  Üzleti specifikáció Logikai és fizikai rendszerterv elkészítése  Funkcionális specifikáció Fizikai megvalósítás  Rendelkezésre álló adatpiac(ok)

Az inkrementális módszer előnyei: gyorsabb és olcsóbb a tervezés Az adattárház tervezése Az inkrementális módszer előnyei: gyorsabb és olcsóbb a tervezés gyorsabb és olcsóbb a megvalósítás az esetleges alapvető, koncepcionális hibák már korán megjelennek, javításuk egyszerűbb A „Big bang” módszer előnyei: a további adatpiacok kiépítése jelentősen kisebb ráfordítást igényelnek a különböző üzleti területek számára már rendelkezésre áll az adatmodell, aminek az alapján eldönthetik, hogy igénybe veszik-e, és ha igen, milyen mértékben a rendelkezésre álló adatokat az adattárház kezdeti hibái (gyerekbetegségei) mát megoldottak a továbbfejlesztés kezdetekor a további ősfeltöltések nem jelentenek többletráfordítást

Az adattárház tervezése Üzleti igények feltérképezése: A tudásmunkásoknak meg kell adniuk, hogy milyen mérőszámokat, és azokat milyen dimenziókra értelmezve szeretnék látni (pl.: üzleti terület: termék értékesítés; mérőszámok: értékesítések darabszáma, értékesítések összege; dimenziók: időszak, régió, hiteltípus)

Az adattárház tervezése Ezzel egyidejűleg specifikálni kell a dimenziók hierarchiáit illetve az egyes hierarchiák szintjeit (pl.: időszak: év – negyedév – hónap terület: régió – megye – város – fiók hiteltípus: felhasználás jellege: szabad, lakásvásárlási futamidő: éven belüli, éven túli – féléves, egyéves; 18-24-36-48-60-stb. hónapos)

Az adattárház tervezése A leendő felhasználóknak a fejlesztőkkel együttműködve meg kell határozniuk, hogy melyik és milyen adatforrásokból szeretnék az információkat kinyerni, illetve hogy milyen eszközzel szeretnék megjeleníttetni az információkat (pl.: adatforrás: Oracle, MS Access megjelenítés: Cognos, Excel)

Az adattárház tervezése Logikai és fizikai rendszerterv elkészítése A rendszerterv része a logikai adatmodell és a fejlesztés átadásnál mellékelni kell a Felhasználói kézikönyvet. A felhasználók munkáját és a továbbfejlesztést azonban nagyban segítheti valamilyen metaadat-kezelő alkalmazás használata. Ez egy olyan eszköz, amelynek a segítségével könnyen feltérképezhető az egyes adatok pontos jelentése (azaz a forrásrendszerben mit reprezentálnak) illetve, hogy milyen logika mentén történik az adatok transzformálása és/vagy szűrése.

Az adattárház tervezése A modellezés során az adattárház struktúráján kívül részletesen ki kell térni (többek között) az alábbiakra: Az adatok kinyerésének módja (pl.: DB-linkek, ODBC, Excel táblázat mentése szöveges állományként) Az adatok betöltésének módja (pl.: DB-linkek, ODBC, csatolt forrásállományok) Az adatok tisztításának mikéntje (pl.: null értékek helyettesítése 0-val, szélső értékek helyettesítése átlagértékekkel) Az adatok szűrésének mikéntje (milyen attribútumokra van szükség illetve valamely attribútum mely értékeinek a fennállása esetén van szükség egy rekordra) Az adatok integritásának biztosítása (keresztellenőrzések, egyediség ellenőrzése)

Az adattárház egy lehetséges felépítése vázlatosan: Az adattárház tervezése Az adattárház egy lehetséges felépítése vázlatosan: Információ kinyerése, kocka generálás, adatpia-cosítás Információs rendszerek … IS1 IS2 IS3 IS4 ISn Historikus adatok (ROLAP struktúrában) Delta képzés (histori-zálás) Szűkebb értelemben vett adattárház Metaadat-kezelő rendszer Integrált adott napi adatok (ROLAP struktúrában) Struktúra váltás, tisztítás, transzfor-málás Forrásrendszerek adott napi lenyomata (OLTP struktúrában) Szűrés, közös platformra hozás Forrásrend-szerek … DS1 DS2 DS3 DS4 DSn

Az adattárház tervezése A tervezés egyes lépései (a nyilak mentén): 1. Az adatok kinyerésének meghatározása (pl.: DB-linkek, ODBC, Excel táblázat mentése szöveges állományként) Az adatok betöltésének meghatározása (pl.: DB-linkek, ODBC, csatolt forrásállományok) A közös platform kiválasztása (adatbázis típusa: pl.: Oracle, Microsoft; szerver operációs rendszere: Windows, Unix) Az adatok szűrésének mikéntje (milyen attribútumokra van szükség illetve valamely attribútum mely értékeinek a fennállása esetén van szükség egy rekordra)

Az adattárház tervezése A tervezés egyes lépései (a nyilak mentén): 2. Struktúra váltás OLTP-ről ROLAP-ra: elemzésre optimalizált témakörökre alapított adathalmazok objektumainak definiálása Az adatok tisztításának mikéntjének meghatározása (pl.: null értékek helyettesítése 0-val, szélső értékek helyettesítése átlagértékekkel) Adatok transzformálása (pl.: beépített szabályok szerint a program kódjában, változtatható szabályok szerint mapping táblával)

Az adattárház tervezése A tervezés egyes lépései (a nyilak mentén): 3. Historikus adatok képzése: Állományi adatoknál csak változás esetén kerül be új rekord Tranzakciós adatoknál minden tranzakcióra bekerül egy rekord RUN_DATE CUST_ID CUST_NAME … ADDR_POSTAL_CODE 2009.07.08. C012105 KOVÁCS TAMÁS 1072 2009.09.25. 2000

Az adattárház tervezése A tervezés egyes lépései (a nyilak mentén): 4. Célrendszerek (Döntéstámogató Rendszerek, Vezetői Információs Rendszerek, Adatbányászati alkalmazások, Jelentéskészítő rendszerek, stb.) Célrendszerek típusa: multidimenzionális relációs irodai alkalmazás (pl.: Excel) Információ kinyerésének módja (pl.: adatbázis-linkek, felhasználói szerepkörök az adattárházban, ODBC kapcsolat)

Az adattárház tervezése Metaadat-kezelés: A felhasználók, a fejlesztők és az üzemeltetők munkáját támogatandó nyilvántartásba veszik a forrásadatok és a kinyert információk közötti összefüggéseket: Üzleti metaadatok (az adatok szemantikája) Technikai metaadatok (az adatok szintaktikája) szűrés transzf. transzf. DS IS DWH

Az adattárház tervezése Köszönöm a figyelmet!