Adatbázis-kezelés: nagy adatbázisok, big data, adatbányászat

Slides:



Advertisements
Hasonló előadás
Tervezési olimpia Integrált nagyvállalati tervezési rendszer a Vivendi Telecom Hungary-nél Nagy Sándor.
Advertisements

Az OH TÁMOP fejlesztései
Projekt vezetés és kontroll – Mi történik a gépházban?
Data Explorer Kft. Tóth Nándor Ügyvezető.
Szűcs Imre CRM elemző GE Consumer Finance Budapest Bank Rt.
Microsoft Üzleti Megoldások Konferencia Naprakész Microsoft technológiák banki környezetben Bessenyei László Magyar Külkereskedelmi Bank Rt.
SeaLog digitális nyom-elemző rendszer Digitális nyom elemzése az informatikai eseménytérben.
Törökbálint város környezeti GIS alkalmazásainak megvalósítása
2010. november Balatonfüred
BI-Tech Kft. – célkeresztben a BI
1950-es évek 1960-as évek 1970-es évek 1980-as évek 1990-es évek
A CAD/CAM modellezés alapjai
Üzleti intelligencia Kecskemét 2007 ősz. BI Business Intelligence Üzleti Intelligencia Bevételnövelő és költségcsökkentő lehetőségek feltárása, döntéstámogatás.
Nagyvállalati projektmenedzsment GTM szeminárium sorozat A Microsoft nagyvállalati projektmenedzsment megoldása Előadó:Kőnig Tibor
Üzleti Intelligencia – koncepciók és megoldások
Az SPSS technológiával háromszorosára nőtt az online eladásokból származó bevétel.
Pénzügyi intézmények kontrollingja
Vezetői Információs Rendszer felépítése
1 „Megbízható harmadik fél szolgáltatás, a digitális aláírás bevezetése az egészségügyi ágazatban” EP 1 részprojektjének eredményei.
Stratégiai kontrolling az egészségügyben
Adattár alapú Vezetői Információs Rendszer (AVIR)
VIR KK VIR Kompetencia Központ (BICC, Business Intelligence Competency Center) Hodász Attila – BDX Kft.
Vezetői Információs Rendszer Kialakítása a Szegedi Tudományegyetemen Eredmények - Tapasztalatok Vilmányi Márton.
Önkiszolgáló üzleti intelligencia az SQL Server 2012-ben
Költség hatékony és rugalmas infrastruktúra ami az ismert és meglevő termékeken alapul  Heterogén környezetek támogatása  Folyamat automatizálás  Önkiszolgáló.
Copyright © 2012, SAS Institute Inc. All rights reserved. STATISZTIKA ÉS VIZUALIZÁCIÓ - ÚJ LEHETŐSÉGEK A STATISZTIKAI ADATOK MEGJELENÍTÉSÉRE ÉS FELTÁRÁSÁRA.
Statisztika a szociológiában
Budapesti Műszaki Főiskola Neumann János Informatikai Főiskolai Kar A Műszaki Tervezés Rendszerei 2000/2001 tanév, I. félév 1. előadás Bevezető a számítógépen.
Adatbázisrendszerek jövője
Controlling a gyakorlatban
Csoportosítás (klaszterezés) A csoportosítás feladata a vizsgált objektumok jól elkülönülő csoportba történő besorolása. A klaszterezés sok szempontból.
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
EasyWay ITS Hungary workshop tervezett programja Házigazdai üdvözlés – Kovács Ákos MK vezérigazgató EasyWay áttekintés – dr. Lindenbach Ágnes ITS Hungary.
Eszterházy Károly Főiskola Élelmiszerbiztonsági nyomkövető rendszer 1 Az EGERFOOD élelmiszerbiztonsági tudásközpont projekt információs rendszerének kialakítása.
Üdvözöljük az IIR Konferencia résztvevőit! IIR Konferencia 2001.
Üdvözöljük az IIR Konferencia résztvevőit! IIR Konferencia 2000.
Adatbányászat és üzleti intelligencia SPSS – MicroStrategy integráció
Körmendi György SPSS Hungary 2007 november 6. Magyar nyelvű szöveganalitika.
Vállalati Informatikai Megoldások  VIM bemutató  Szolgáltatásaink  Projektjeink  Technológiánk  Kapcsolatok.
Rugalmas keretrendszer a minőségbiztosítási adatok kezeléséhez XII. abas Vevőfórum, Balatonlelle június 5-7.
A Microsoft Üzleti Intelligencia megoldása és platformja
IDMSYS projekt GOP Akkreditált innovációs klaszterek közös technológiai innovációjának támogatása, GOP pályázati ablak A.
OKOSTELEFON KÖZÉPRÉTEG, VALÓS IDEJŰ TELJESEN ELOSZTOTT ADATFELDOLGOZÁS
Telekommunikációs vállalat 100 százalékkal növelte a válaszarányokat az SPSS Clementine® segítségével.
Adattár alapú Vezetői Információs Rendszer fejlesztése a Miskolci Egyetemen Bordás Katalin Miskolci Egyetem Számítóközpont.
Meteorológiai adatokra épülő növényvédelmi előrejelző rendszer Zala megyei kísérleti projekt.
Cél – a biztonsági szempontokat is figyelembe vevő betekintés a vállalati adatokba a szervezet összes munkatársa számára, hogy optimális döntéseket hozhassanak,
Adattár alapú Vezetői Információs Rendszer (AVIR) Fejérvári Bence március 26.
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
.NET FRAMEWORK Röviden Krizsán Zoltán 1.0. Tulajdonságok I Rövidebb fejlesztés 20 támogatott nyelv (nyílt specifikáció) 20 támogatott nyelv (nyílt specifikáció)
1 VIIR Vállalatirányítási Integrált Információs rendszerek I. (Történeti áttekintés - TEI) Szent István Egyetem TATA Kiválósági Központ és Informatikai.
Cégnév Üzleti terv. Célkitűzések A cég hosszú távú céljainak egyértelmű bemutatása –Használjon a cég növekedését alátámasztó kifejezéseket, de legyen.
Bemutatkozunk Több évtizedes szakmai tapasztalat IBSystem - VIR fejlesztések VIR bevezetési projektek Egyedi webes és mobil fejlesztések Szolgáltatások.
Adatok a Cortana Analytics Suite-ben Adatokra építkezve hozzunk megalapozott döntéseket Business Scenarios Recommendations, customer churn, forecasting,
Microsoft alapú VIR megoldás az egyetemeken Lénárt Marcell.
Gazdasági informatika - bevezető …avagy miért emlegetünk szakdolgozat írást informatika címén???
Az állatorvos szerepe az élelmiszerlánc- biztonság megteremtésében Informatika (számítástudomány, elemzések) Dr. Tirián Attila
Szent István Egyetem Közgazdaságtudományi Jogi és Módszertani Intézet
Modellezési Kockázat Kereskedelmi Banki Kockázatmodellezés
Az ORACLE JDE EnterpriseOne ERP rendszer bevezetésének tapasztalatai
Sales Back Office Specialista Dolgozz velünk az Élet habos oldalán!
Országos Statisztikai Tanács
Üzleti terv bemutatása
SAS Base bevezetés Csicsman József
Statisztikai programcsomagok
Üzleti intelligencia megoldások, avagy vezetői döntéstámogatás (XXI.)
Business Intelligence (Üzleti Intelligencia)
Adatbázis-kezelés: nagy adatbázisok, Big Data, adatbányászat
This is the first level bullet for notes 12 point Arial Regular
Vállalatirányítási rendszerek alapjai
Előadás másolata:

Adatbázis-kezelés: nagy adatbázisok, big data, adatbányászat Csicsman József csicsman@calculus.hu Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Az előadás témái A Statisztikai szoftverek Adat előkészítő és adatelemző szoftverek a KSH-ban SAS az adófeldolgozásban Vállalati Információs Rendszerek döntések támogatására, a hagyományos elemzési módszertanoktól a mobilos Dashboard-ig Pénzintézeti és Telekommunikációs alkalmazások Adatelemzés és adattárház építés az egészségügyben A Big Data és a Hadoop technológiák A Magyarországon is megvalósult BD projektek Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Ki az a Data Scientist? Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A Data Scientist pozíciója Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Elvárások a DS-től Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Van ilyen ember? Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A DS hagyományos szoftvereszközei Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A DS napi munkájának eszközei Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A mátrix alakú adatszerkezet az adatelemzésben objektumok Var1 Var2 Vark O1 O2 On Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A statisztikai szoftverek történeti áttekintése P-STAT, SPSS, BMDP, OSIRIS,S-PLUS termékek, SAS,… Az 1970-s évek végen egyetemi környezetben induló termékek Nagy rendszereket kiegészítő szoftverek, pl. ORACLE Financial, Adatbáziskezelőkhöz, ügyviteli rendszerekhez tartozó lekérdező rendszerek MINITAB, SYSSTAT, MATLAB, STATA,,… Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Magyarországon elérhető lehetőségek SAS SAS Institute (magyarországi képviselet: SAS Institute Kft.) www.sas.com Statistica StatSoft Inc. (magyarországi képviselet: StatSoft Hungary) www.statsoft.com SPSS SPSS Inc. (magyarországi képviselet: IBM Hungary) www.spss.com Eviews IHS EViews Team (magyarországi képviselet: Új Calculus Bt.) www.eviews.com R Az S szoftver továbbfejlesztése, szabadon elérhető www.rstudio.com, www.r-project.org WEKA,… Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Adatbányászati szoftverek 1995-től Intelligent Miner DBMiner MineSet Clementine Enterprise Miner Statistica Data–mining Adatelemző-> Adatbányász-> Data Scientist Kapcsolat az adatelemző szoftverekkel programozó ( SAS BASE, SPSS syntax, Matlab, R, ...) alkalmazásfejlesztő (SAS App Dev Stúdió, Webes dashboardok,…) Felhasználó 1.(alkalmazások üzemeltetői, alkalmazásgazdák) Felhasználó 2. (Aktuáriusok, befektetés-, kockázatelemzők,...) Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Az adatbányászati szoftverek összehasonlítása Milyen számítógép architektúrákon fut? A szoftver biztosítja-e az összes adatbányászati módszertant? Ha nem, hogyan bővíthető? A bővíthető-e a saját programozási nyelvén?, Milyen adat-vizualizációs lehetőségekkel rendelkezik? Milyen outputformákkal rendelkezik és azok másolhatók-e szövegszerkesztőkbe? Jól kezeli-e a nagy adatállományokat? Elterjedt-e használata, könnyen megoszthatók-e az adatokat és programok? Megfizethető-e a termék a felhasználó számára? Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A Statisztikai szoftverek használata a tudományos célú felhasználásoknál Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Adat előkészítő és adatelemző szoftverek a KSH-ban Kérdőív szerkesztés (Word, Excel) Nyomtatás, megszemélyesítés (Openpage) Adateditáló rendszerek: BLAISE, Oracle és SAS Adattárolás eszköze az Oracle A nyomdakész „táblagyártás” a TPL-lel Az adatelemzés eszközei nagygépes környezetben (BMDP, SPSS, SAS) Napjaink adatelőkészítő és elemző rendszerei (ORACLE, SAS és az SPSS) Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Az SPSS-szel támogatott adatelemzések a KSH-ban Elsősorban a társadalomstatisztikai adatgyűjtések Egészségügyi felmérések teljeskörűsítése, hibaszámítása és publikálása Oktatásstatisztika Időmérleg Demográfiai elemzések Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

SAS alkalmazások a KSH-ban AKM modellek A migráció eszköze a SAS Fogyasztói árstatisztika Háztartásstatisztika,és a Munkaerőfelvétel A Mikrocenzus, a Próbanépszámlálás és a Népszámlálás Mikroszimulációs szolgáltató rendszer A HKF adatfelvétel korrekciója mikroszimulációs eszközökkel Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

2001. és 2011. évi Népszámlálás SAS környezetben OCR – ahogyan a papír adattá vált 2011 webes adateditálás Monitoring – az adatrögzítés szervezése és követése Meta rendszeren alapuló adattárház Dinamikus adatkezelés a web-en, SAS EG Publikáció SAS-WORD-Acces-TPL-WORD Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

SAS az adófeldolgozásban VIR Társasági adó becslése A Monitorozó rendszer 1996-ban A korrigált becslési algoritmus 1997-ben Az eredmények és a hibák, a jó becslés feltételrendszere Központi bevallásfeldolgozás META Futtatórendszer Lekérdező Adat és alkalmazásvédelem Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A Társasági adóbevallások beérkezésének üteme

A Monitorozó rendszer 1996-ban és korrigált 1997-ben A statikus model A dinamikus model A végfelhasználói alkalmazás funkciói Az eredmények összevetése a tényadatokkal A minta rétegei A kiemelt gazdálkodó egységek kezelése A becslési algoritmus hangolása Új funkciók a végfelhasználói alkalmazásban A hibaszámítás

Az eredmények és hibák, a jó becslés feltételrendszere A becslési eredmények összehasonlítása a tényadatokkal Szervezési követelmények a kiemelt gazdálkodók kezelésekor Az adatfelvételi hibák kezelése, a beérkezett adatok összevetése a korábbi évek adataival A gazdálkodó egységek számának pontos meghatározása Az üzemeltetés fegyelme

Az általánosított központi be-vallásfeldolgozó rendszer A Társasági Adó feldolgozásánál szerzett tapasztalatok alkalmazása a többi adóbevallásra is A központi bevallásfeldolgozó rendszerek migrálása A META információs rendszer A Futtató rendszer funkciói az aktuális időszakhoz tartozó feladatok az általánosított adatkezelés lehetőségei az általános párosító Adat és alkalmazásvédelem Demonstráció Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Többváltozós Statisztikai Modellezés Csicsman J Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Vállalati Információs Rendszerek döntések támogatására Technológia Munkatársak ADAT Üzleti célok Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés Üzleti információk

A vállalati információ- (tudás) kinyerés folyamata Á C Ó Tranzakciós Minőség A D T O K Kockázat RDBMS Fogyasztó “Régi” Here is the view of the PROCESS... Adatkezelés Szervezés Kiaknázás Termék SAS Piac Külső Jövő Információ-tárház Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Információ tárház (Data Warehouse) “Témaorientált, integrált, nem változó, idővariáns adatoknak olyan szervezett gyűjteménye, amely a vezetés igényeit támogatja” (William H. Inmon definíciója) tárgyorientált integrált időtengelye van csak bővíteni lehet Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A vállalati döntéshozók információ igénye Aktuális, pontos és teljes információk Az üzleti változásokat figyelembe vevő adatok Új üzleti lehetőségekbe betekintés lehetősége a vállalati stratégiákhoz történő alakíthatóság A vállalati információs rendszerek piramis ábrája Tranzakciós rendszerek VIR Adatbányászati eszközök Statisztikai szoftverek Metainformációs rendszerek, Adattárházak Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Vezetői Információs Rendszerek (VIR-MIS) Követelmények vállalati szintű adatelérés és kezelés alkalmazások sokfélesége különböző felhasználói igények hardver független architektúra alkalmazás fejlesztés a hagyományos GUI rendszerektől a webes alkalmazásokig Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

CalcQ Mobil Az ERP rendszerekben tárolt adatok elérése mobil eszközökkel A vállalati ügyviteli rendszerek zártak A döntés előkészítés rugalmas támogatása a Calculus Q&A rendszerével Előre definiált lekérdezések elérése és adatmódosítási lehetőségek mobil eszközökön Az adat és alkalmazás védelem problémája a mobilos operációs rendszereken (adatvédelmi alkalmazás a felhasználók azonosítására és a használható funkcióira) Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Az adatáramlás folyamata Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Kik használhatják a webes alkalmazásokat ? Döntéshozók, cégvezetők Adatelemzők Mozgó ügynökök Üzletkötők Kereskedők Műszaki ellenőrök Munkafelmérést végző személyek Külső helyszínen dolgozó szerelők Stb. Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Pénzintézeti megoldások specialitásai Hiányzó adatok pótlása Adattisztítási feladatok az elemzés előtt Alaprendszerekre épülő adattárház megoldások Felhasználó igényeit kiszolgáló adatpiacok Üzleti termékek eredményének előrejelzése A Credit Scoring elemzések és csalásfelderítés támogatása A stressz teszt vizsgálatok elkészítése (árfolyam-változás, munkanélküliség növekedés,…) Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Adatelemzési alkalmazások a telefóniában Ügyfélszegmentáció Ügyfélértékek kiszámítása Hiányzó demográfiai adatok pótlása statistical matchinggel Marketing felmérések adatainak korrigálása A lemorzsolódások elkerülésére kidolgozandó marketingstratégiák hatásának előrejelzése A csalók felderítésének támogatása Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Adatelemzés és adattárház építés az egészségügyben Fizioszenzoros mintaalkalmazás Viselhető szenzorok bluetooth kommunikációval Adatgyűjtő és továbbító egység (mobil) Központi feldolgozó, vezérlő szerver –háttérben adatbázis, megjelenítés terminálon HTTPS Vezeték nélküli kommunikáció TCP/IP Adatelemzést végző SAS szerver Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Biometrics Ltd. szenzorai Goniometer: ízületi elhajlás 2 tengely mentén (fok) Event Marker: Eseményt jelölő szenzor Accelerometer: 3 dimenziós gyorsulásmérő Myometer: izomerő mérése (N) Látható még EMG és Goniometer. EMG és földelő pánt: izomműködés mérése (mV) Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Bejelentkezés – szerepkör és projekt választás orvos szerepkörben Jogosult felhasználó belépése Szerepkör kiválasztása Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés Projekt megnyitása

Mérési adatok Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Adatfeldolgozás DB/2 és SAS között Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

SAS programmal generált mérési eredmény p.XML képernyőn Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Az eredmények prezentálása az orvosok számára graph_emg.sas graph_intergralt_amplitudo.sas graph_atlag_amplitudo.sas graph_integralt_amp_egysegenkent.sas Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A Big Data és a Hadoop technológiák Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Mi az a Big DATA ; Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Mikor is Big a Data? Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A nagy méretű adaok kezelésének problémái Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A világ digitalizált, mit tegyünk vele? Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A V-k a Big Data világából (a marketinges szemével) Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A technológia üzleti pozíciói Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A Big Data szoftver komponensei Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Kinek készülnek a Big Data alkalmazások? Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Big Data és a Data Sciense Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Mivel kezelhetőek a BD-k? Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Valós alkalmazás a dmlab-tól Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

A Magyarországon is megvalósult BD projektek A gazdálkodó szervek kiválasztása az adóellenőrzésre Biztosítási ajánlatok a roaming területre való belépéskor Hirdetési csalók felderítése Web használat elemzése az egér mozgásának elemzésével Sportanalitikai elemzések (mozgás, egészségügyi állapot,… Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Big Data, Hadoop, Data Science összefoglalás Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés

Köszönöm a figyelmet! Csicsman@calculus.hu Többváltozós Statisztikai Modellezés Csicsman J.: Adattárházak-adatelemzés