Big Data Sidló Csaba / Benczúr András

Slides:



Advertisements
Hasonló előadás
Budapest New Technology Meetup Group Tárkányi Ferenc.
Advertisements

Big Data analytics Benczúr András „Big Data – Lendület” kutatócsoport
Jövő Internet technológiák és alkalmazások kutatása Magyarországon A Magyar Tudomány Hónapja Jövő Internet technológiák és alkalmazások kutatása Magyarországon.
A Jövő Internet Nemzeti Kutatási Program bemutatása Dr. Bakonyi Péter és Dr. Sallai Gyula Jövő Internet Kutatáskoordinációs Központ Budapesti Műszaki és.
Copyright © 2012, Oracle and/or its affiliates. All rights reserved. 1.
DPR és webfejlesztés Aknai Péter Tartalommenedzser, PTE DPR Szakmai Nap, április 15.
Tanyanyagtárházak lépjünk túl egy LMS korlátain Networkshop 2010 Debrecen, április Vágvölgyi Csaba
WEB 2 eszközök, közösségi portálok az oktatásban
Statisztikák. Foursquare • 2014 Januári adatok forrás: foursquare.com/about • Több mint 45 millió felhasználó • Több mint 5 milliárd check-in • Több mint.
A szolgáltatásai Gödöny Péter ELTE IK Pataky István Inf. Szki.
Jövő hálózati megoldások – Future Internet
Nagy adatok – mindenkinek Benczúr András MTA SZTAKI Informatika Kutató Laboratórium IVSZ – Jövő Internet Workshop2011. November 4.
Facebook.com/KBCEquitas | twitter.com/KBCEquitas | Kihagyhatatlan lehetőségek a vagyongyarapításban László Zoltán Marketing Manager,
Közösségi média és a könyvtár Trendek Közösségi média és a könyvtárak Trendek
IT-DEV-CON – IT-DEV-CON Kollár László Fejlesztési platform üzletág igazgató - Microsoft.
„Grand Coalition” Hogy jutottunk idáig? Bőgel György CEU Business School november.
Kőnig Tibor főmérnök Microsoft Magyarország. Ma a vállalatok elsősorban olyan szoftvereket használnak, amelyeket maguk futtatnak ez a helyben telepített.
Web2. - KÖZÖSSÉGI MÉDIA MENNYIT ÉR EGY RAJONGÓ??.
Halászat a globális adatóceánban – de mit tehetünk vele?
2 Forrás: The Standish Group International, Extreme Chaos, The Standish Group International, Inc., 2000.
Szárnyas Gábor október 11.
Virtuális Obszervatórium Korszerű adatbázisok 2014.
Virtualizáció Korszerű Adatbázisok Ferenci László
Az ETR technológia DEXTER Informatikai kft..
GOOGLE 1998 szeptember Ma: az IN-es keresés 75%-a Webes keresés Képkeresés Usenet csoportokban Könyvtárban (hierarchikus katalógus) Egyéb szolgáltatások.
Üzleti intelligencia Kecskemét 2007 ősz. BI Business Intelligence Üzleti Intelligencia Bevételnövelő és költségcsökkentő lehetőségek feltárása, döntéstámogatás.
Kiss Attila: Korszerű adatbázisok Adatbázis kutatási eredmények a TÁMOP támogatásával Június 7. Visegrád.
Korszerű adatbázisok 1. előadás Bevezetés 1. előadás.
Kereső programok használata
| | Tananyagfejlesztések fejlesztői szemmel Wagner Balázs MTA SZTAKI.
SQL Server 2012 padlógázzal
Microsoft CRM online Strén András
IT-ÜZLET-INTELLIGENCIA Polner Tamás Szerver üzletág vezető Microsoft Magyarország
Copyright © 2012, SAS Institute Inc. All rights reserved. STATISZTIKA ÉS VIZUALIZÁCIÓ - ÚJ LEHETŐSÉGEK A STATISZTIKAI ADATOK MEGJELENÍTÉSÉRE ÉS FELTÁRÁSÁRA.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék ‚Big Data’ elemzési módszerek
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Bin-summarise-smooth: ‚bigvis’ „Big Data” elemzési módszerek.
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg Nemzetközi és határ menti együttműködések támogatása.
Pankász Balázs PTE FEEK Munkapszichológia és Ergonómia Tanszék
A Dublin-i Future Internet Assembly üzenetei Sallai Gyula, Vilmos András Jövő Internet Kutatáskoordinációs Központ Budapest, június 4.
A Jövő Internet alkalmazásai Sidló Csaba, Benczúr András {sidlo, MTA SZTAKI Informatika Kutató Laboratórium Adatbányászat és Webes.
Jövő Internet technológiák és alkalmazások kutatása Magyarországon Ács Sándor, OE-NIK Budapest,
ICR technológia és alkalmazási területei DoqSys Business Solutions
Visual Studio LightSwitch Adatvezérelt alkalmazások percek alatt
A Microsoft Üzleti Intelligencia megoldása és platformja
A tudomány tudománya Kampis György ELTE TTK Tudományfilozófia Tanszék 12/7/12"FuturICT" TÁMOP ick-off meeting, SZTE.
Miért jó nekünk kutatóknak a felhő?
4/7/2017 StorSimple: A felhő-integrált tároló Windows Server 2012 R2 konferencia © 2012 Microsoft Corporation. All rights reserved. Microsoft, Windows,
IT-DEV-CON – Orchard CMS technológiai áttekintése Turóczy Attila Livesoft Kft.
A tudomány tudománya alprojekt Kampis György egy.tan., ELTE Az infokommunikációs technológiák társadalmi hatásai november 13. Balatonfüred.
Élményszerű tanulás tabletekkel
Ez az én művem: Papercraft
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Stream Processing „Big Data” elemzési módszerek Kocsis Imre.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre
Haladó C++ Programozás SzJ/IV
‚Big Data’ elemzési módszerek
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
OSINT eszközök a gyakorlatban avagy hogyan gyűjtsünk és elemezzünk nyílt adatokat személyekhez kapcsolódóan Dr. Gorza Jenő PhD nyá. ezredes, c. egyetemi.
Informatika a gyógyszeriparban Informatikai Vállalkozások Szövetsége E-egészség munkacsoport Lukács Lajos Munkacsoport vezető
Ha(doop) akkor adatok... Hadoop és Node.JS adatfeltöltő (BME – NYME) Szalai László, Major Kálmán TÁMOP 4.1.1/C-12/1/KONV
Adatok a Cortana Analytics Suite-ben Adatokra építkezve hozzunk megalapozott döntéseket Business Scenarios Recommendations, customer churn, forecasting,
Készítette: Kiss András
Színe és fonákja Bőgel György CEU Business School
Tapasztalatok Openstack környezet éles üzemeltetésével
“Tudásmegosztás és szervezeti problémamegoldás a mesterséges intelligencia korában” Levente Szabados Technológiai Igazgató.
Felhő alapú vállalati rendszerek
Integrált ügyfél-kommunikáció a weben
Üzleti intelligencia megoldások, avagy vezetői döntéstámogatás (XXI.)
Microsoft SQL licenselés a gyakorlatban
Semmi szükség a biztonságra
Előadás másolata:

Big Data Sidló Csaba / Benczúr András MTA Számítástechnikai és Automatizálási Kutatóintézet Üzleti Intelligencia és Adattárházak Csoport / Adatbányászat és Keresés Csoport sidlo@sztaki.mta.hu http://dms.sztaki.hu 2013. június 4.

SZTAKI ILAB és Big Data http://dms.sztaki.hu Keresés és Adatbányászat, Üzleti Intelligencia és Adattárházak csoportok Benczúr András, 2012 „Big Data” MTA Lendület Fiatal Kutatói Díj kutatás – fejlesztés, teljes innovációs lánc kb. 30-40 tag, kutatók, fejlesztők, hallgatók 60+ gép, 170+ mag, 600+ TB tároló Big Data Üzleti Intelligencia Csoport partner: Mérnöki és Üzleti Intelligencia Laboratórium, Dr. Viharos Zsolt János projektek valódi „big data” feladatokkal logelemzés, webanalitika, webes keresés, spam detektálás, ajánlórendszerek, csalásfelderítés smart city, mobilitás, „internet of things” http://bigdatabi.sztaki.hu

„Big Data” adatok és kapcsolódó feladatok big data volume velocity variety big data adatok és kapcsolódó feladatok adatok 3 (vagy 4, 5) V-je: volume (mennyiség – sok), velocity (sebesség – gyorsan jön és megy), variety (változatosság – sokféle forrás, típus) + veracity (megbízhatóság – változó adatminőség), + value (érték – feldolgozással értéknövekedés), + variability (változékonyság – változó tartalom) “big data is when the size of the data itself becomes part of the problem” “big data is data that becomes large enough that it cannot be processed using conventional methods”

sok százezer PetaByte méretű adatbázis Wired magazin, 2013 május: 2012-ben 2.8 ZettaByte információ keletkezett (vagy duplikálódott) (giga  tera  peta  exa  zetta) sok százezer PetaByte méretű adatbázis business email each year Google index Youtube upload each year Facebook upload each year forrás: http://www.wired.com/magazine/2013/04/bigdata/

rétegek: adatelérés, analitika, alkalmazások nagy a tülekedés, sok szereplő SQL vs. NoSQL vs. NewSQL kötegelt vs. streaming (real time) feldolgozás … szolgáltatások, eszközök, eszköz-kombinációk, full stack-ek, SaS, open source stb.: minden megkapható, mindent megígérnek forrás, 2013.02: http://www.slideshare.net/mjft01/big-data-big-deal-a-big-data-101-presentation forrás, 2012.06: http://www.forbes.com/sites/davefeinleib/2012/06/19/the-big-data-landscape/

Néhány kiemelt kutatási téma új elméleti és számítási modellek: mi jön a bevált Hadoop / MapReduce után? egyszerűség, gyorsaság vs. komplex műveletek skálázható adat-management felhőkön storage rendszerek: adat lokalitás elrejtése pl. több adat center lokális számításokkal Amazon S3-on keresés és adatbányászat Internet of Things, mobilitás adatok

Néhány kiemelt kutatási téma 2. big data vizualizáció

Tranzakciós, log adat feldolgozás log, Internet of Things: sok helyen előforduló probléma biztonság / feladat optimalizáció gyűjteni: viszonylag könnyű feldolgozni: nehéz analitika: egyes területeken sok kiforrott megoldás (pl. webanalitika) de sok speciális igény, feladat adatintenzív feladatok kép: http://www.google.com/analytics/

Media stream, szociális hálók, azonosságok kép szegmentáció (képkereséshez) számításintenzív feladatok entity resolution - azonosságfeloldás

Mobilitás, telekom, szélerőmű szenzor telekom adatok: CDR, OSS (operational support system)  analitika: mozgás előrejelzés „smart city”: intelligens parkolás, forgalomirányítás stb. „internet of things” szélerőművek: szenzor adat adatfolyam számítás és adatintenzív feladatok http://www.d4d.orange.com

Virtual Web Observatory: FIRE testbed számítás és adatintenzív feladatok Hanzo Archives (UK): Amazon EC2 cloud + S3 Internet Memory Foundation: low-end szerverekkel PB-ok feldolgozása SZTAKI Web adat, pl. http://kopi.sztaki.hu plágiumkereső saját kódok – open source eszközök még nem elég kiforrottak 50 régi szerver (mostani desktopoknál gyengébbek): 1 hét 3TB tömörített adathoz hardware kb. $15,000; Amazon ár kb. $1000 lenne Web osztályozás: spam oldalak; verseny: ClueWeb, 25TB, 0.5 milliárd oldal – kis rész

Webes trendek kinyerése / „opinion mining” magyar blogok; gyorsan reagálnak igény: valósidejű; deep Web? előfordulási gyakoriságok (pl. Google Trends) témák  fontos kifejezések szófelhője 2011.12.30. 2012.02.28.

http://dms.sztaki.hu

Big data trendek – szubjektív válogatás innovációs görbe: early adopters / post-innovators: Web 2.0 (pl. Google, Facebook, Twitter, LinkedIn)  early majority (pl. pénzügyi szolgáltatók, gyógyszergyártók, kiskereskedelem stb.) real time, streaming (adatfolyam) feldolgozás: hatalmas igény flash memória, SSD vs. hagyományos tároló-tömbök in memory vs. batch processing pl. SAP Hana és Oracle Exadata X3 vs. Hadoop statisztika + informatika + üzlet  „data science” (“the sexiest job in the 21st century”, Harward Business Review) kép:http://en.wikipedia.org/wiki/Diffusion_of_innovations