Ha(doop) akkor adatok... Hadoop és Node.JS adatfeltöltő (BME – NYME) Szalai László, Major Kálmán TÁMOP 4.1.1/C-12/1/KONV-2012-001.

Slides:



Advertisements
Hasonló előadás
Windows Virtualizáció
Advertisements

Első tapasztalatok az NIIFI-nél üzemelő infrastruktúra cloud szolgáltatással kapcsolatban Stefán Péter NIIFI RICOMNET Miskolc.
VIRTUÁLIS IDŐKAPSZULA
Virtualizált Biztonságos BOINC Németh Dénes Deák Szabolcs Szeberényi Imre.
SZOFTVER MINT SZOLGÁLTATÁS: ÜZLETI HATÉKONYSÁG A FELHŐBEN Nagy Levente Üzletágvezető Microsoft Office.
Készítette:Darázsi LászlóXZ1J94 Muráti ÁkosJNC2FC Szeles JózsefVC4DV7.
Microsoft Access Felhasználói felület.
Felhasználói felületek és üzleti logika Bollobás Dávid ASP.NET
Backend: Gyors és olcsó(?) ÁRVAI ZOLTÁN KITCHEN BUDAPEST.
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR TUDOMÁNYOS DIÁKKÖRI KONFERENCIA NOVEMBER 25. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS,
Kőnig Tibor főmérnök Microsoft Magyarország. Ma a vállalatok elsősorban olyan szoftvereket használnak, amelyeket maguk futtatnak ez a helyben telepített.
Openstack Matics Zoltán
Czeglédi László Integrált tartalomszolgáltatás megújult környezetben
Virtualizáció Korszerű Adatbázisok Ferenci László
Networkshop, április Gál Gyula, Szegedi Tudományegyetem, Egyetemi Könyvtár Szerver-kliens alapú online intranetes.
SQL Server 2005 Reporting Services Kószó Károly rendszermérnök Microsoft Magyarország.
Adatbázis-kezelés Papp-Varga Zsuzsanna. Elérhetőségek    as.
Korszerű adatbázisok 1. előadás Bevezetés 1. előadás.
Elektronikus levelezés
Takács Péter – Tamás János – Lénárt Csaba DE-ATC-MTK Víz és Környezetgazdálkodási Tanszék E-agrárium & E-vidék Agrárinformatikai.
A KFKI AFS szolgáltatás Hernáth Szabolcs MTA KFKI RMKI
WEB MES (webes gyártásirányító rendszer)
XML támogatás adatbázis-kezelő rendszerekben
Hibrid felhő Privát-, publikus és hoster felhők összekapcsolása
Demo/teszt környezetek Szerver konszolidáció Adatközpontok alapja.
Microsoft BI technológiák az eszközmenedzsment szolgálatában
Ők kerestek meg minket Tentálen – Könyvelő iroda, 15 felhasználó SBS 2003, Outlook levelezés Nincs saját fix ip cím, exchange POP3-al töltötte le a leveleket,
Anyagadatbank c. tárgy gyakorlat Féléves tematika Adatbázis alapfogalmak, rendszerek Adatmodellek, adatbázis tervezés Adatbázis műveletek.
Web Application for Resource Planning
Az ASP.NET programozási modell Ez az előadó neve beosztása vállalata.
WEB 2.0. Amiről szó lesz… Web átalakulóban, a WEB 2.0 –Újszerű weboldalak… –Első a tartalom! –A felhasználók hatalomátvétele?! –A Web mint platform –
1 Hernyák Zoltán Programozási Nyelvek II. Eszterházy Károly Főiskola Számítástudományi tsz.
1 Hernyák Zoltán Web: Magasszintű Programozási Nyelvek I. Eszterházy.
Copyright 2007, SPSS Hungary. 1 SPSS 16 újdonságok.
Web Architecture. Development of Computing Architectures Monolithic mainframe programming Client Server Real Client Server Web Programming.
Az AliEn rendszer Novák Judit Vesztergombi György Predrag Buncic Pablo Saiz Jan-Erik Revsbench.
HTML5 alapú fejlesztő és futtató környezet megvalósítása
A szoftver, szoftvertípusok
Mobil kliens az integrációban Magic XPA mobil kliens a SAP és CRM alkalmazásokhoz.
Az Internet alkalmazásai
Varga Viktor – G36ECF 1/5 Vendéglátói szoftverek sajátosságai Varga Viktor.
Út a felhőbe - Azure IaaS Windows Server 2012 R2 konferencia
Web-alapú humán lekérdező rendszer
BIG DATA Kazi Sándor Bevezetés, HDFS
Eszköz és identitás kezelés Korlátlan fájl szerver kapacitás Másodlagos adatközpont Korlátlanul skálázódó infrastruktúra Biztonságos DMZ Hibrid adat-
OKOSTELEFON KÖZÉPRÉTEG, VALÓS IDEJŰ TELJESEN ELOSZTOTT ADATFELDOLGOZÁS
Térképes Alkalmazásfejlesztés Firefox OS rendszeren.
Felhő PC demonstráció Gergely Márk MTA SZTAKI Laboratory of Parallel and Distributed Systems
Audio Utastájékoztató Rendszer vasútállomások részére
NIIFI Networkshop március 31. – április 2.PTE Egyetemi Könyvtár Adatbázisba kerülnek a magyar szakfolyóiratok cikkeinek hivatkozásai Szalai László,
Webfejlesztés, Internet Explorer 10 Komjáthy Szabolcs
Java web programozás 5..
Iskolai számítógépes hálózat bővítése Készítette Tóth László Ferenc.
Gombos GergőKorszerű Adatbázis 2012/13 tavasz 2 Kik használják?
Desktop virtualizáció Microsoft VDI használatával Háló Gyula.
‚Big Data’ elemzési módszerek
Irány a felhő Előnyök, tapasztalatok Sárdy Tibor
Ingyenes, online technikai kurzusok Microsoft Virtual Academy.
Web alapú humán lekérdező rendszer
Adatok a Cortana Analytics Suite-ben Adatokra építkezve hozzunk megalapozott döntéseket Business Scenarios Recommendations, customer churn, forecasting,
AZURE RÉGIÓK Szoftver szolgáltatás SaaS Platform szolgáltatás PaaS Infrastruktúra szolgáltatás IaaS.
FELHŐ ALAPÚ INFORMATIKAI RENDSZEREK VS. LEXIKÁLIS ISMERETEK Networkshop 2016 Konferencia Debrecen Antal Péter, Eszterházy Károly Főiskola,
Pinczel Balázs, ELTE IK, április Emlékeztető: NoSQL Célok: Nagy teljesítmény Magas rendelkezésre állás Elosztott működés Következmények:
(Iskolai) Beléptető rendszer Raspberry Pi 2-vel.
Információtechnológiák és tudásbázis az Agrof-MM Leonardo+ projektben M=Mountain; M=Mediterranean
Szoftverváltás a Semmelweis Egyetem könyvtárában
Docker technológia és alkalmazások: gyártás és logisztika szimulátor
Adatmozgatás az MTA Cloudon Data Avenue segítségével MTA Cloud workshop november 21. Nagy Enikő MTA Cloud csapattag Szoftverfejlesztő.
„Big Data” elemzési módszerek
Web alapú humán lekérdező rendszer
Előadás másolata:

Ha(doop) akkor adatok... Hadoop és Node.JS adatfeltöltő (BME – NYME) Szalai László, Major Kálmán TÁMOP 4.1.1/C-12/1/KONV

Előzmények A BME-n kialakításra került egy technológia (SensorHUB), amely képes online gépjárműadatok tárolására, feldolgozására és adatok megjelenítésére. A rendszer kódbázisa jelenleg Javascript alapú, a kiszolgáló szerverek a BME hálózatában vannak. Hadoop az adattároló réteg alatta. Networkshop 2016, Debrecen

Cél A BME SensorHub infrastruktúra hardveres és szoftveres migrációja soproni szerverekre. – Hadoop „migráció” és telepítés (Opensource) – Adatbetöltő réteg migráció (BME kódbázis) Esetleges későbbi adatok soproni feltöltése és kezelése. Networkshop 2016, Debrecen

Big Data ? Sok adat (Tb és felette) – akár geolocated Nemstrukturált adatok (nem kötelező sor, oszlop ….metadata, posts, tweets, stb.) Multistrukturált adatok (ember-gép interakció eredményadatai, pl. web naplók) Bináris adatok (file, video, kép, stb.) Networkshop 2016, Debrecen

Adattárolás – Big Data Tradicionális RDBMS nem opció Elosztott adattároló és adatkezelő rendszerek – Egyik legismertebb szereplő a piacon: (ma már Apache license, Opensource) Networkshop 2016, Debrecen

Apache Hadoop Elosztott adatkezelő techológia (NEM adatbázis!) Facebook: 700 PB-os (2015, saccolt adat) Hadoop klaszter – (több 10 ezer node és CPU mag) Nagy felhasználók még: – Yahoo, Twitter, Netapp, SAP, Microsoft, IBM, eBay, Amazon, AOL, Ericsson, Linkedin Networkshop 2016, Debrecen

Hadoop alapok #1 HDFS (Hadoop Distributed File System) + Mapreduce (YARN – v2.0) Networkshop 2016, Debrecen

Hadoop alapok #2 Strukturális modell Networkshop 2016, Debrecen

Hadoop alapok #2 Működési modell (Namenode(s) + Datanodes) Networkshop 2016, Debrecen

Hadoop alapok #3 „Adatbázis”: Apache Hbase – Nem RDBMS – HDFS-re épül! – Fault-tolerant – Compression, in-memory operations – INPUT: REST, Thrift, Avro – Java API segítségével elérhető Networkshop 2016, Debrecen

Hadoop vs RBDMS A Hadoop ban az ACID nem kötelező, …ban használhatjuk a megszokott SQL terminológiát, …egyszerű eszközökkel párhuzamosítható a működés kis költséggel, …nemstrukturált adatokra is felkészített, …kifejezetten gyors pl. keyword-ok keresésére nagy adathalmazokban, …nem mindig gyorsabb, mint egy RBDMS. Networkshop 2016, Debrecen

Adatkezelési ábra Networkshop 2016, Debrecen

OUTPUT FLUME HTTP SOURCE BME AUT Node.JS kódbázis JSON adatfile Adatkezelési ábra Networkshop 2016, Debrecen

Migrációs projekt Saját szerver hardver kiválasztása Linux KVM virtualizáció Ubuntu Linux virtuális gépek Hadoop klaszter telepítés és konfigurálás (Cloudera) Node.JS szerver telepítés és konfigurálás Tesztesetek, adatfeltöltések, lekérdezések Sebességtesztek Networkshop 2016, Debrecen

Hadoop rendszer #1 Virtualizált környezet, virtio net driverek Networkshop 2016, Debrecen

Hadoop rendszer #2 Szolgáltatások: – HBase – HDFS – Hue – Hive – Impala – Oozie – Solr – Spark – Sqoop2 – YARN – ZooKeeper Networkshop 2016, Debrecen

Cloudera management Networkshop 2016, Debrecen

Node.JS kódbázis BME AUT által fejlesztett kódbázis 7 db szolgáltatás Javascript betétek szolgáltatásként futtatva Aránylag egyszerű megvalósítás REST kezelésére képes Felhasználó autentikáció megoldva, BASE64 „hash” 1 db külső „csatlakozási IP” Networkshop 2016, Debrecen

Node.JS szolgáltatások Hadoop REST POST Networkshop 2016, Debrecen

Adatbetöltés menete CSV, Excel sheet, stb.NODE.JS JSON IMPALAREST POST FLUME HBASE SINK HBASE (NoSQL store) HDFS HIVE (Data warehouse) Networkshop 2016, Debrecen

Adatfeltöltés #echo "proba:proba123" | base64 cHJvYmE6cHJvYmExMjMK #curl -X POST -v -k -H "Authorization: Basic cHJvYmE6cHJvYmExMjM=" -H "Content- Type: application/json" #curl -X POST -v -k -H "Authorization: Basic cHJvYmE6cHJvYmExMjM=" -H "Content- Type: application/json" #curl -X POST -v -k -H "Authorization: Basic cHJvYmE6cHJvYmExMjM=" -H "Content- Type: application/json" Networkshop 2016, Debrecen

Adatlekérdezés Böngészőben vagy karakteres felületen HIVE – Analitikus problémák, HiveQL – Lassú – Mapreduce batch indítás IMPALA – Inkább SQL jellegű, Real-time lekérdezések – Gyors – In-memory műveletek, cache – Saját natív instance indul Networkshop 2016, Debrecen

Lekérdezés, Impala Networkshop 2016, Debrecen

Docker, Hadoop Networkshop 2016, Debrecen

Köszönöm a figyelmet! Networkshop 2016, Debrecen