Gombos GergőKorszerű Adatbázis 2012/13 tavasz 2 Kik használják?

Slides:



Advertisements
Hasonló előadás
Big Data Korszerű adatbázisok 2014.
Advertisements

A PC gépek szoftverei Kérdés: "Mi az elefánt?" Válasz: "Egér operációs rendszerrel."
Windows Virtualizáció
2012. tavaszi félév Vitéz Gergely. A diasor ismerete nem helyettesíti a tankönyvet, és a példatárat. A diasor ismerete szükséges, de nem elégséges feltétele.
Más Valaki Problémája? Mire jó egy MVP?.
Kliens-szerver architektúra
© Kozsik Tamás Adatbáziskezelés •Relációs adatbáziskezelők •Noha a Java objektum-elvű, egyelőre nem az objektum-elvű adatbáziskezelőket támogatja.
Mit olvas az utca embere – Mit olvasunk mi?. Bevezetés  Az én személyes kíváncsiságom  Szövegértési kompetencia fejlesztése az 5-8. évfolyamokon (TÁMOP.
Gyakorló feladatsor eljárásokra Készítette: Rummel Szabolcs Elérhetősé:
2012. tavaszi félév Vitéz Gergely. A diasor ismerete nem helyettesíti a tankönyvet, és a példatárat. A diasor ismerete szükséges, de nem elégséges feltétele.
Többfelhasználós és internetes térkép kezelés, megjelenítés.
Windows Azure Infrastruktúra és platform a felhőben
Szárnyas Gábor október 11.
Számítástudományi módszerek a webes szolgáltatásokban Rácz Balázs október 20.
HADOOP Korszerű Adatbázisok Elérés, Belépés Elérés: eszakigrid109.inf.elte.hu Belépés: felhasználó/jelszó: neptun-kód Manager oldalak:
Virtuális Obszervatórium Korszerű adatbázisok 2014.
Hadoop Gyakorlat 1 Korszerű adatbázisok Parancsok Listázás – hadoop fs –ls Kiírja egy fájl tartalmát – hadoop fs –cat Betöltés – hadoop fs –put.
Lemezkezelés, RAID, partícionálás, formázás, defragmentálás
A számítógéprendszer.
Az e-kereskedelem (e-business)
Utasítás végrehajtás lépései
Adatbázis-kezelés Papp-Varga Zsuzsanna. Elérhetőségek    as.
Kliensoldali Programozás
Kiss Attila: Korszerű adatbázisok Adatbázis kutatási eredmények a TÁMOP támogatásával Június 7. Visegrád.
Oracle Database 10g szoftver telepítése
Hadoop Gyakorlat 2 Korszerű adatbázisok Parancsok Listázás – hadoop fs –ls Kiírja egy fájl tartalmát – hadoop fs –cat Betöltés – hadoop fs –put.
Napjaink Háttértárolói
Vak ember ült egy épület előtt a lépcsőn, lábánál kalap táblával, a következő szöveggel: „Vak vagyok, kérem, segítsenek!“
SQL 2012 TKOC Magas Rendelkezésreállás II. Király István Microsoft Certified Trainer Microsoft Certified Systems Engineer.
Operációs Rendszerek II.
V 1.0 ÓE-NIK, Programozás I. A Microsoft Visual Studio 2010 használata.
Információtechnológiai alapismeretek
Az operációs rendszereK
A Unix operációs rendszer Előadást tarja: Lázár András.
Részletező csoportosítások Rózsa Győző
2012. tavaszi félév Vitéz Gergely. A diasor ismerete nem helyettesíti a tankönyvet, és a példatárat. A diasor ismerete szükséges, de nem elégséges feltétele.
Az AliEn rendszer Novák Judit Vesztergombi György Predrag Buncic Pablo Saiz Jan-Erik Revsbench.
Amerikai Magyar Baptista Gyülekezet, Alhambra
Prímrekord, 2005 Csajbók Tímea, Farkas Gábor, Kasza János.
Az eredményesség kulcsa egy önkormányzati gazdaságfejlesztési projekt esetében The keys of success in case of an economic development project implemented.
Csempe Programozás érettségi mintafeladat
BIG DATA Kazi Sándor Bevezetés, HDFS
Eszköz és identitás kezelés Korlátlan fájl szerver kapacitás Másodlagos adatközpont Korlátlanul skálázódó infrastruktúra Biztonságos DMZ Hibrid adat-
CUDA C/C++ programozás
WEBSTAR CSOPORT WC S ADATBÁZIS VERZIÓKÖVETÉSE: LIQUIBASE Marics Tamás június 20.
Miért jó nekünk kutatóknak a felhő?
Adatbázis-kezelés. Alapfogalmak Adat: –észlelhető, felfogható ismeret –jelsorozat –valakinek, vagy valaminek a jellemz ő je –tény, közlés Információ:
Diákparlament E-napló Néha nem az kerül be óracímként az e- naplóba, amit valójában vettünk, ami problémát okoz a pótlásoknál, valamint a szüleinkkel.
Fájlrendszerek.
Computing n-Gram Statistics in MapReduce Klaus Berberich, Srikanta Bedathur EDBT/ICDT 2013 Joint Conference.
2. Operációs rendszerek.
 Adatbázis:  Valamilyen szempont szerint rendszerezett adathalmaz.  Adatbázis kezelés:  Adatok tárolása  Műveletek végzése az adatbázison; (Adatok.
Egy lekérdezés végrehajtása SELECT o1 FROM T1 WHERE o2 = … Hogyan jutnak el a megfelelő sorokból a mező értékei a klienshez?
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék MapReduce alapok „Big Data” elemzési módszerek Kocsis Imre,
Hadoop Gyakorlat 1 Korszerű adatbázisok.
Programozás III JPA.
Bevezetés Adatbázisok használata. Mi is az adatbázis? Az adatbázisok ma már az élet számos területén alapvető fontossággal bírnak (Google, Amazon, Flickr,
Have you ever asked yourself: PART FCL – What's behind it and how does it affect me? Airprox – What to do when coming too close? Alternative propulsion.
Ha(doop) akkor adatok... Hadoop és Node.JS adatfeltöltő (BME – NYME) Szalai László, Major Kálmán TÁMOP 4.1.1/C-12/1/KONV
Maven és Ant Build eszközök bemutatása
Előadó: Kajdocsi László
“Tudásmegosztás és szervezeti problémamegoldás a mesterséges intelligencia korában” Levente Szabados Technológiai Igazgató.
Riportok, táblák, programok
The new waves of modernisation of the Hungarian PES
Vasas Lívia, PhD 2017 WHO Vasas Lívia, PhD 2017.
Hálózati Operációs Rendszerek
„Big Data” elemzési módszerek
Bluetooth technológia
egyetemi docens, tanszékvezető, KJE
Vasas Lívia, PhD 2017 WHO Vasas Lívia, PhD 2017.
Előadás másolata:

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 2 Kik használják?

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 3 Kiknek ajánjuk a hadoopot? “... to create building blocks for programmers who just happen to have lots of data to store, lots of data to analyze, or lots of machines to coordinate, and who don’t have the time, the skill, or the inclination to become distributed systems experts to build the infrastructure to handle it.” Tom White Hadoop: The Definitive Guide

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 4 Hadoop történelem 2004 – Google publikálja a MapReduce technikát 2006 – Apache projekt lett Yahoo! támogatással További támogatók:

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 5 Miért használjunk elosztott rendszert? Feladat: Olvassunk fel 1TB adatot egy merevlemezről. Mennyi idő szükséges ehhez? Ez 4 óra lenne.

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 6 Miért használjunk elosztott rendszert?

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 7 HDFS Splits HDFS = Hadoop Distributed Filesystem A HDFS-be tölött adat blokkokra lesz szétvágva tipikus blokk méretek: –UNIX = 4KB –HDFS = 128MB

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 8 HDFS Replikálás Minden adatblokk replikálva lesz több gépre Így adatvesztés nélkül tudunk dolgozni node kiesés esetén

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 9 Architektúra Master-Slave architektúra DFS Master “Namenode” –Kezeli a fájlrendszert –Karbantartja a fájlnév és hozzátartozó blokkok kapcsolatát –Kezeli a blokk lefoglalást / replikálást –Kezeli a hozzáférést a fájlrendszerhez DFS Slaves “Datanodes” kezelik a blokk tárolást –Tárolják az adatblokkokat –Kliensek hozzáférnek a blokkokhoz közvetlenül a datanode-ról –Rendszeresen küld blokk információkat a namenode-nak –Periódikusan ellenőrzi a blokkok sértetlenségét.

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 10 Hadoop architecture

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 11 Named node Csak 1 (aktív) Name Node lehet Kezeli a fájlrendszert és a hozzátartozó metaadatokat

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 12 Data Node Tipikusan több adat node létezik Kezelik az adatblokkokat és a kliens lekérdezéseket Adatok replikálva – hiba tolerancia miatt

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 13 Job Tracker Pontosan 1 Job tracker létezik a klaszterenként Fogadja a kliens feladatokat Vezényli és monitorozza a MapReduce jobokat.

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 14 Task Tracker Tipikusan több task tracker létezik MapReduce folyamatok futásáért felelős Blokkokat olvas az adat node-okról

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 15 Hadoop alapelvek A kódot mozgassuk az adatokhoz Ne kelljen foglalkozni szinkronizálással, hiba toleranciával A nehéz munkát ő végzi, tudunk koncentrálni az adat feldolgozásra

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 16 MapReduce Paradigma: –A problémát bontsuk kisebb feladatokra,oldjuk meg párhuzamosan,összegezzük az eredményt Map: –Alakítsuk a bementi adatokat (kulcs, érték) párokra Reduce: –Alakítsuk az adott kulcshoz tartozó adatokat a kimeneti formára

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 17 MapReduce példa

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 18 Map Java

Gombos GergőKorszerű Adatbázis 2012/13 tavasz 19 Reduce Java

Köszönöm a figyelmet!