Üzleti igények kielégítése az SQL Server Analysis (OLAP) Services segítségével Kővári Attila OLAP csoport vezető NOVOSYS kft. This session will cover the features of Analysis Services, formerly known as OLAP Services, and their relationships to real world business scenarios. This session will show how Analysis Services provides a flexible end-user tool that offers excellent query performance, powerful analytics and calculations without sacrificing data consistency or the ability to handle large data volumes. In the process, it will demonstrate many of the new dimension features, such as parent-child dimensions, custom rollups and formulas in a dimension, changing dimensions, and parent-child dimensions. It will also demonstrate the security enhancements, advanced analytics features, and scalability enhancements.
Tartalom Alapfogalmak Az Analysis (OLAP) Server felépítése
Mi az OLAP? Az OLAP-pal szemben támasztott követelmények OLAP és DW, Adatbázis építés (elmélet) Az Analysis (OLAP) Server felépítése Tárolás Felösszegzés Adatbázis építés Eladások elemzése Pénzügyi modellezés Nagy mennyiségű adatok kezelése Elemzés az Interneten keresztül
… 10 évvel ezelőtt Valamit ki kell találni
Túl sok adat - túl kevés információ Do while van türelmem Kérdés Riport End A vezetőség a válaszokat tegnapra kéri
A megoldás: A cél: Egy olyan technológia, vagy adatmodell kialakítása amely eleget tesz a következő követelményeknek Gyorsaság Felhasználó barátság Elemzés/Döntés központúság Új fogalom született: OLAP
Mi az OLAP? 2. A szó jelentése
Betűszó: On-Line Analytical Processing Az "On Line" kifejezés jelentése az OLAP szóban: OLAP ≠ On Line adathozzáférés a tranzakciós rendszerekhez: OLAP = Egy tetszőleges döntés meghozatalához szükséges információ lekérdezése nem lehet több, mint néhány másodperc
A gyorsaság megvalósítása
Ahhoz, hogy a gyorsaság megvalósuljon szakítanunk kell a meglévő adatmodellekkel, az elemzéshez szükséges információkat egy új helyen vagy modellben kell tárolni
A gyorsaság megvalósítása három lehetőség
I. Új adatmodellek kialakítása relációs alapokon (Csillag és hópihe sémák) II. Új tárolási struktúra kialakítása. Kialakult a többdimenziós adatbázis III. A kettő előnyeit ötvöző új technológia kialakítása ROLAP, MOLAP(OLAP), HOLAP
A gyorsaság megvalósítása Szeparált adatbázisok
Működtető rendszerek Döntés támogató (OLAP) Rendszerek Az elemzéshez Szükséges információ átemelése Egyirányú, periódikusan ismétlődő, ellenőrzött folyamat Elemi és aggregált adatok Elemi tranzakciók
Az elemzés központúság megvalósítása 1. Technikai követelmények
Csak és kizárólag a döntéshozáshoz és elemzéshez szükséges információk tárolása Aggregáltság idősor
Az elemzés központúság megvalósítása 1. Funkcionális követelmények
Többdimenziós nézet Szeletelés Lefúrás Rotálás Beágyazás Külföld Belföld Össz. Vevő Összes cikk Almaíz Narancsíz Barackíz Q1 Q2 Q3 Q4
Az elemzés központúság megvalósítása 2. Adatbázis Objektumok
Külföld Belföld Adatbázis Adatkocka Dimenziók Hierarchiák Mértékek Össz. Vevő Összes cikk Almaíz Narancsíz Barackíz Q1 Q2 Q3 Q4
Összefoglalás 1. Az OLAP egy technológia: Lehet relációs és többdimenziós és mindkettő A Kulcs: Sebesség (lekérdezés sebessége): Függ Tárolás típusa, Dimenzió elemeinek számától Adatbázis méretétől dimenziók számától NEM Elemzési képesség Függ: Adattartalom Kliens
Stratégiai döntéshozatalt Támogató többdimenziós
Összefoglalás 2. OLAP Stratégiai döntéshozatalt Támogató többdimenziós rendszerek Lassú adatbeolvasás Könnyen és gyorsan Elkészíthető Komlex lekérdezések Működtető rendszerek (OLTP) Napi működést támogató tranzakciós rendszerek (Mission Critical) Gyors adatbeolvasás és hatékony tárolás Nehezen, lassan elkészíthető komplex lekérdezések Táblázatkezelők Kevés adat hatékony elemzése Inkonzisztencia (hiányzó kódrendszer)
Összefoglalás 3. OLAP technológiát használhatnak a következő rendszerek Vezetői Információs Rendszerek (Management Information System), (VIR, MIS) Döntéstámogató Rendszerek (Desision Support System, DSS) üzleti intelligencia (Business intelligence, BI) EIS (Executive Information System)
Tartalom Alapfogalmak Az Analysis (OLAP) Server felépítése
Mi az OLAP? Az OLAP-pal szemben támasztott követelmények OLAP és DW, Adatbázis építés (elmélet) Az Analysis (OLAP) Server felépítése Tárolás Felösszegzés Adatbázis építés Eladások elemzése Pénzügyi modellezés Nagy mennyiségű adatok kezelése Elemzés az interneten keresztül
OLAP és Data Warehousing A folyamat
Adattárház, adatraktár OLAP OLTP adatok Transzformáció Specifikáció Igényfelmérés Nyers specifikáció (célja a szükséges adatok meghatározása) A szükséges adatok felkutatása Végleges specifikáció Megvalósítása Külső adatok Felhasz- nálók Az OLAP a felhasználók eszköze
Adatbázis építés (elmélet) Relációs elemek
Többdimenziós adatbázis építéséhez szükségesek a következő elemek* Dimenzió táblák Tény táblák Ezek kapcsolatát leíró csillag séma vagy hópihe séma * Nem szükséges SQL srv, de célszerű Tfh meg van a végleges logikai spec
Adatbázis építés (elmélet) Dimenzió tábla
VevoCode VevoDesc RegioCode OrszCode key1met Metro Regio1 H key1int Interfruct key2pro Profi Regio2 Nemzbul Shifer NULL D A dimenzió táblák tartalmazzák az egyes dimenzióértékek azonosítóit, megnevezéseit, tulajdonságait, és szülő-gyerek kapcsolatukat A dimenzió táblák denormalizáltak
Adatbázis építés (elmélet) Dimenzió tábla
A dimenziót leíró információkat elhelyezhetjük egy vagy több táblában Ha egy dimenzión több különböző szintszámú hierarchia helyezkedik el akkor célszerű külön táblában tárolni.
Adatbázis építés (Elmélet) Tény táblák
Dátum Cikk Vevő Liter Forint Dimenziók Mértékek A tény tábla az adatkocka relációs megfelelői
Adatbázis építés (elmélet) Tény tábla
Datum Cikk Vevo Liter Forint 99/1/1 ALMA10 Key1int 250 3 295 Key1met 92 1 422 Kajszi10 105 1 750 81 1 090 99/1/2 125 2 105 302 3 988 144 2 675 171 3 009 If we were to browse this table, it might look like the following. In the date column we see each day – this is the lowest level of granularity, for product we see each SKU, and customer we see each individual customer. The numeric values are associated with each dimension and are categorized by each measure: units and dollars. WE see 250 units and $3,295 dollars for January 2 for SKU 101 for Customer Jones.
Adatbázis építés (elmélet) A csillag séma
A csillag séma tartalma Egy központi tény tábla dimenzió táblák csillag formát alkotva
Adatbázis építés (elmélet) Csillag séma
Tény tábla Dimenzió tábla
Adatbázis építés (elmélet) Hópehely séma
A dimenzió hierarchiáját több dimenzió tábla írja le Normalizáltabb, mint a csillag séma Gyengébb teljesítmény Nehezebben átlátható
Adatbázis építés (elmélet) Hópehely séma
Dimenzió táblák Tény tábla
OLAP és Data Warehousing Adatbetöltés
OLTP adatok DTS DW tároló OLAP Server Ügyfél alkal- mazás Külső adatok
OLAP és Data Warehousing A költségek kocka feltöltése
Az előadás végén árbevétel arányos nyereséget fogunk számítani Költségek kocka Értékesítés kocka Költségek kocka felépítése Dimenziók: Cikkek, Időszakok, mutatószámok(fix és vált ktg.) Mértékek: Ft
Összefoglalás OLAP helye a DW terminológiában Csillag és hópihe sémák
Hogyan tölthetjük fel a relációs adatbázist és a kockákat
Tartalom Alapfogalmak Az Analysis (OLAP) Server felépítése
Mi az OLAP? Az OLAP-pal szemben támasztott követelmények OLAP és DW, Adatbázis építés (elmélet) Az Analysis (OLAP) Server felépítése Tárolás Felösszegzés Adatbázis építés Eladások elemzése Pénzügyi modellezés Nagy mennyiségű adatok kezelése Elemzés az Interneten keresztül
Analysis Services felépítés
Analysis Manager OLEDB for OLAP OLE DB for DM SQL Server Data Warehouse Egyéb OLE DB adatforrás DSO PivotTable Service TCP/IP HTTP Alkalmazás Analysis Server ADO MD OLAP tároló OLAP motor Data Mining motor Feldolgozás Lekérdezés
Analysis Services felépítés Rugalmas OLAP tároló
A felhasználók és az alkalmazások csak a kockát, mint struktúrát látják
Analysis Services felépítés Client/Server gyorsítótár
A kliens is számol Lekérdezés 1: Jan98, Feb98, és Mar98 eladások Kliens Lekérdezés 2: Q1 98 eladások 1) Jan98, Feb98, és Mar98 eladások 2) Q1 98 eladások Lekérdezés 3: Q1 98 & Q1 97 eladások 3) Q1 97 eladások Csak a Q1 97 kell Szerver 1) Jan98, Feb98, és Mar98 eladások 3) Q1 97 eladások
Analysis Services felépítés Adattárolás - nincs adatrobbanás
Más OLAP rendszerek régi problémája Üres cellák tárolása Összegzések tárolása 100% sűrű tárolás Az üres cellákat nem tároljuk Intelligens összegzések Csak a lehetséges összegzések egy (kis) részét számítjuk ki előre Adattömörítő algoritmusok
Analysis Services felépítés Részleges aggregálás 1.
Analysis Services felépítés Részleges aggregálás 2.
Kérem az összes eladást, az összes termékre, az összes . . . Az összegzés legmagasabb szintje Legrészletesebb összegzések Tény tábla
Tartalom Alapfogalmak Az Analysis (OLAP) Server felépítése
Mi az OLAP? Az OLAP-pal szemben támasztott követelmények OLAP és DW, Adatbázis építés (elmélet) Az Analysis (OLAP) Server felépítése Tárolás Felösszegzés Adatbázis építés Eladások elemzése Pénzügyi modellezés Nagy mennyiségű adatok kezelése Elemzés az interneten keresztül
Értékesítés elemzése Üdítő italok értékesítésével foglalkozó vállalat
Dimenziók Cikk (Kiegyensúlyozott) Időszak (Kiegyensúlyozott) Vevő (NEM kiegyensúlyozott) Mértékek Ft, Liter
Értékesítés elemzése Kiegyensúlyozott hierarchiák
ország Mo Régió Reg1 Reg2 Reg3 város Győr Zeg Miskolc Pécs Komló Paks Egyforma dimenzió szintek Azonos mélység Nincsenek rések Adott szinten minden tagnak ugyanannyi őse van
Értékesítés elemzése Szakadozott hierarchiák
All ország Magyaro. Lengyelo. Nincs vagy Nem szükséges Régió Régió1 Régió2 Győr Zeg Miskolc Krakkó Varsó város [New in 2000] Eltérő mélység Demo…
Értékesítés elemzése TovábbFúrás (Drill-through)
Régió 1 2000. Január Cikk Liter Ft Alma 66 300 Ananász 10 Birsalma 100 Dátum SzlaSzám Ft 1-Jan 1234 6.5 5-Jan 1235 20 9-Jan 1236 7.25 10-Jan 1237 6.75 17-Jan 1238 5.75 24-Jan 1239
Értékesítés elemzése Actions
Linkek Office dokumentumhoz Internet/Intranet oldalakhoz Futtatható állományokhoz… stb… Kapcsolódhatnak Cellákhoz Dimenzió értékhez Dimenzióhoz Kockához Pl.: Szerződések
Értékesítés elemzése Multi-Dimensional Expressions (MDX)
Lekérdező nyelv Számított mezők Biztonsági szabályok az MDX segítségével beállíthatók Actions Az OLE DB for OLAP spec. része TM1, SAS, Analysis Services, Whitelight, stb.
Értékesítés elemzése A kocka részei
A kocka cellákból áll Minden cellának van egy címe Egy-egy koordináta, minden dimenzió szerint Egy cellához az összes koordinátájának meghatározásával juthatunk el
Értékesítés elemzése (Cikk.barackital , Time.Q2, Vevo.[Vevők összesen]) (Cikk.Narancsital , Time.2000, Vevo.[Vevők összesen]) (Cikk.[Cikkek összesen] , Time.Q1, Vevo.külföld) Külföld Belföld Vevők összesen Cikkek összesen Almaital Narancsital Barackital Banánital Q1 Q2 Q3 Q4 2000
Értékesítés elemzése Rendezett n-esek (tuples)
(Cikk.Almaital, Time.Q2, Vevo.[Vevők összesen]) KÜLÖNBÖZŐ dimenziókból származó tagok vesszővel elválasztott listája
Értékesítés elemzése Halmazok
AZONOS dimenziókból származó tagok vesszővel elválasztott listája {Almaital, Barackital} [1999].Children Sum(Time.members)
Tartalom Alapfogalmak Az Analysis (OLAP) Server felépítése
Mi az OLAP? Az OLAP-pal szemben támasztott követelmények OLAP és DW, Adatbázis építés (elmélet) Az Analysis (OLAP) Server felépítése Tárolás Felösszegzés Adatbázis építés Eladások elemzése Pénzügyi modellezés Nagy mennyiségű adatok kezelése Elemzés az interneten keresztül
Pénzügyi modellezés Szülő-gyerek dimenziók
Árbevételarányos nyereség Dim érték Szülő Arbev Fedezet ValtKTG Nyereseg FixKtg ArbevNyer Arbev2 Nyere- ség Árbev : [New in 2000] Fede- zet Fix költség - Árbev Vált. Költség - Demo…
Pénzügyi modellezés Visszaírás (write-Back)
A kockán engedélyezni kell a visszaírást Az adatkocka tetszőleges cellájába írhatunk vissza Nem közvetlenül a kockába, vagy a tény táblába írunk Változás tábla a relációs adatbázisban Az Office 2000-ben nincs felhasználói felület a visszaírásra
Pénzügyi modellezés Biztonság
Cella adatára vonatkozó jogosultság Dimenzió értékre vonatkozó jogosultság 10 500 20 625 16 500 Terület N/A 35 Nyugat $7,600 75 Közép 50 Kelet Összes fizetés Alkalmazott Cella szint 10 500 20 625 16 500 Terület 35 Nyugat 75 Közép 50 Kelet Alkalmazott Dimenzió elem
Tartalom Alapfogalmak Az Analysis (OLAP) Server felépítése
Mi az OLAP? Az OLAP-pal szemben támasztott követelmények OLAP és DW, Adatbázis építés (elmélet) Az Analysis (OLAP) Server felépítése Tárolás Felösszegzés Adatbázis építés Eladások elemzése Pénzügyi modellezés Nagy mennyiségű adatok kezelése Elemzés az interneten keresztül
Nagy mennyiségű adatok Élő példa (még SQL 7-en)
Jellemzők Dimenziók száma Hierarchiák száma Cellák száma Felösszegzési idők … Válaszidők
Nagy mennyiségű adatok Particionálás
MOLAP 35% Agg Aktuális év HOLAP 20% Agg Előző év ROLAP 0% Agg Régi adatok Eltérő tárolási módok, aggregáltsági szintek Több kiszolgáló támogatása
Nagy mennyiségű adatok Nagyon nagy dimenziók támogatása
"Large" MOLAP dimenziók Nem memória rezidens (10 millió tagig) "Huge" ROLAP dimenziók Több 100 millió tag Új fajta virtuális dimenzió támogatás Nincs kihatással a tárolásra Nincs probléma a dimenzió tagjainak számával Több hierarchia szint támogatása Egy dimenzió tagnak >64K gyereke lehet Automatikus gyűjtő szint beiktatása Opcionálisan látható
Elemzés az Interneten Virtuális és kapcsolt kiszolgálók
Helyi és távoli kockák összekapcsolása Belső és külső kockák Firewall Sales East West 3rd-Party – External
Könyvek Microsoft OLAP Solutions by Eric Thomsen
OLAP Solutions – Building Multidimensional Information systems by Eric Thomsen Microsoft OLAP Unleashed by Tim Peterson
További információk WWW.OLAPINFO.HU
