Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Hibatűrő.

Slides:



Advertisements
Hasonló előadás
Windows Virtualizáció
Advertisements

A program a „Tudáshasznosulást, tudástranszfert segítő eszköz-, és feltételrendszer kialakítása, fejlesztése a Műegyetemen” (TÁMOP /1/KMR )
Programozási tételek, és „négyzetes” rendezések
ADATBÁZISOK.
Adatbázis gyakorlat 1. Szerző: Varga Zsuzsanna ELTE-IK (2004) Budapest
Statisztikák. Foursquare • 2014 Januári adatok forrás: foursquare.com/about • Több mint 45 millió felhasználó • Több mint 5 milliárd check-in • Több mint.
Backend: Gyors és olcsó(?) ÁRVAI ZOLTÁN KITCHEN BUDAPEST.
Közösségi média és a könyvtár Trendek Közösségi média és a könyvtárak Trendek
Tisztelt Hölgyeim és Uraim! Budapest, Előadó: Dr. Mihalik József
Big Data Sidló Csaba / Benczúr András
Recovery (helyreállítás) feladatok gyakorlatra
Önálló labor beszámoló – 8. félév Nyárády Péter QJA31E
HTML5 alapú fejlesztő és futtató környezet megvalósítása
Ekler Péter Budapesti Műszaki és Gazdaságtudományi Egyetem
Kabai József AZ SQL-LEDGER SZABAD ÜGYVITELI RENDSZER
2 Forrás: The Standish Group International, Extreme Chaos, The Standish Group International, Inc., 2000.
Készítette: Takács Krisztina
A DBMS fő feladatai: - adatstruktúra (adatbázisséma) definiálása,
ÉLELMISZER ADATBÁZIS SZŰRÉSE MENNYISÉGI MEGSZORÍTÁSOK ALAPJÁN LOGARITMIKUS INDEXELÉSSEL Kusper Gábor, Márien Szabolcs Előadja: Kusper Gábor Eszterházy.
Szárnyas Gábor október 11.
Trendek a szoftveriparban: e-business és e-development Csontos Péter IQSOFT Rational e-development szakmai nap 2000 február 16.
Virtuális Obszervatórium Korszerű adatbázisok 2014.
Neo4j bevezető Rácz Gábor
Műszaki tudományok az interneten
Osztott alkalmazások kezelése. VIR elosztott architektúra indítékai: - meglévő komponensek integrációja - WEB / Internet elterjedése (nemzetköziség) -
Adatbázis-kezelés Papp-Varga Zsuzsanna. Elérhetőségek    as.
TT Kovács Sándorné.
Bevezetés az ebXML-be Forrás: An Introduction to ebXML ebXML and Web Services Practical Considerations In Implementing Web Services Romin IraniRomin Irani.
XML támogatás adatbázis-kezelő rendszerekben
PHP I. Alapok. Mi a PHP? PHP Hypertext Preprocessor Szkriptnyelv –Egyszerű, gyors fejlesztés –Nincs fordítás (csak értelmező) Alkalmazási lehetőségek:
Anyagadatbank c. tárgy gyakorlat Féléves tematika Adatbázis alapfogalmak, rendszerek Adatmodellek, adatbázis tervezés Adatbázis műveletek.
Gimp v2.2 Csanádi Norbert The Gimp.
Budapest, június 28. Ontológia kezelő modul tervezése szöveges információt kezelő informatikai rendszer számára Förhécz András BME Méréstechnika.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Bin-summarise-smooth: ‚bigvis’ „Big Data” elemzési módszerek.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre
Mozgás/hangérzékelés mobitelefonokon MobSensor Ekler Péter Budapesti Műszaki és Gazdaságtudományi Egyetem Automatizálási és Alkalmazott Informatikai Tanszék.
WEB 2.0. Amiről szó lesz… Web átalakulóban, a WEB 2.0 –Újszerű weboldalak… –Első a tartalom! –A felhasználók hatalomátvétele?! –A Web mint platform –
MIKROELEKTRONIKA, VIEEA306
Tanulást könnyítő segédprogramok
Web Architecture. Development of Computing Architectures Monolithic mainframe programming Client Server Real Client Server Web Programming.
Java programozási nyelv Filekezelés
HTML5 alapú fejlesztő és futtató környezet megvalósítása
Fontos információk.
Adatbázis-kezelés.
Adatbázis rendszerek I Relációs adatmodell strukturális része Általános Informatikai Tsz. Dr. Kovács László.
XML fejlesztések TSQL fejlesztések Tábla paraméter SQLCLR fejlesztések 8k limit feloldása Több paraméteres UDA-ek Ordered UDF-ek Entity Framework ADO.NET.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Szondázás alapú diagnosztika 1. Autonóm és hibatűrő információs.
Dobos László Komplex Rendszerek Fizikája Tanszék
Dobos László Komplex Rendszerek Fizikája Tanszék.
Eszköz és identitás kezelés Korlátlan fájl szerver kapacitás Másodlagos adatközpont Korlátlanul skálázódó infrastruktúra Biztonságos DMZ Hibrid adat-
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Megerősítő elemzés „Big Data” elemzési módszerek Salánki.
Téradatok létrehozása, szerkesztése
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Korlátkielégítési problémák Autonóm és hibatűrő információs.
Gombos GergőKorszerű Adatbázis 2012/13 tavasz 2 Kik használják?
Computing n-Gram Statistics in MapReduce Klaus Berberich, Srikanta Bedathur EDBT/ICDT 2013 Joint Conference.
A PKI project célja Digitális kulccsal elérhető szerver Hamisíthatatlan naplózás Új kulcsok dinamikus létrehozása Felhasználók letiltása.
UNIVERSITY OF SZEGED D epartment of Software Engineering UNIVERSITAS SCIENTIARUM SZEGEDIENSIS 3. Átszövődő vonatkozások Dr. Bilicki Vilmos Szegedi Tudományegyetem.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre
Piramis klaszter rendszer
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék MapReduce alapok „Big Data” elemzési módszerek Kocsis Imre,
.NET FRAMEWORK Röviden Krizsán Zoltán 1.0. Tulajdonságok I Rövidebb fejlesztés 20 támogatott nyelv (nyílt specifikáció) 20 támogatott nyelv (nyílt specifikáció)
Gráfadatbázisok Rácz Gábor.
Adatbázisszintű adatmodellek
Bevezetés Adatbázisok használata. Mi is az adatbázis? Az adatbázisok ma már az élet számos területén alapvető fontossággal bírnak (Google, Amazon, Flickr,
Ha(doop) akkor adatok... Hadoop és Node.JS adatfeltöltő (BME – NYME) Szalai László, Major Kálmán TÁMOP 4.1.1/C-12/1/KONV
Pinczel Balázs, ELTE IK, április Emlékeztető: NoSQL Célok: Nagy teljesítmény Magas rendelkezésre állás Elosztott működés Következmények:
Kovács Gergely Péter Bevezetés
„Big Data” elemzési módszerek
Adatbázis-kezelés.
Könyvtári rendszerek felső fokon
Előadás másolata:

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Hibatűrő Rendszerek Kutatócsoport N O SQL RENDSZEREK Szárnyas Gábor december 3.

Google Trends: „Big Data”  N.B. ez is egy Big Data feladat  Gartner hype cycle: HF

Gartner: Hype Cycle for Big Data – 2012 noSQL Database Management Systems

DB-Engines Ranking –

BigTable Cassandra Redis Cassandra MongoDB 400 millió 50 millió 300 millió 55 millió 200 millió

Skálázhatóság feldolgozási sebesség feldolgozóegységek száma lineáris skálázódás jól skálázódó rendszer

Skálázódás  Vertikális skálázódás

Skálázódás  Vertikális skálázódás  Horizontális skálázódás o Commercial off-the-shelf (COTS) hardver

NOSQL RENDSZEREK

Google Trends – NoSQL

Relációs rendszerek relációs adatmodell SQL

Relációs rendszerek

Dominancia  Relációs modellben gondolkozunk  Legyőzte a hálós modellt a ’70-es években  Legyőzte az objektum modellt a ’90-es években „Az SQL adatbázis tovább él, mint az elérésre használt programozási nyelv” „Az SQL adatbázis tovább él, mint az azt futtató operációs rendszer”

Reneszánsz  2005 előtt: RDBMS/SQL legtöbb weboldal mögött  2005 környéke: Google cikkek o Ghemawat, Gobioff, Leung: Google File System o Chang, Dean, Ghemawat, et al.: Bigtable o Mike Burrows: Chubby o Chandra, Griesemer, Redstone: Paxos made live o Dean, Ghemawat: MapReduce  DeCandia et al., Amazon: Dynamo  Facebook: Cassandra HDFS Hadoop

Google cikkek  Nincs forradalmi algoritmus vagy adatszerkezet  Létező ötletek újfajta alkalmazása  Rendszertervezésről szóló cikkek  Új, elosztott architektúra  Nem relációs modell, nincs SQL

NoSQL „forradalom”  Google, Amazon technológiák o nem nyílt forráskódúak  2005–2010: új nyílt forráskódú NoSQL technológiák a Google és az Amazon ötletei alapján  Maximum: 2009, hetente új projektek

NoSQL definíció  Nyílt forráskódú  Nem-relációs  Elosztott  Horizontálisan skálázható  Sémamentes adatmodell  Replikáció támogatása  Fokozatos konzisztencia

NoSQL definíció  Nyílt forráskódú  Nem-relációs  Elosztott  Horizontálisan skálázható  Sémamentes adatmodell  Replikáció támogatása  Fokozatos konzisztencia

SKÁLÁZHATÓSÁGI KIHIVÁSOK

Szerverek száma – 2010 Facebook: Google: Intel:

Replikáció  Többpéldányos tárolás V = read V write V = read V

Elméleti korlát: a CAP tétel  Sejtés: Eric Brewer, 2000  Tétel: Nancy Lynch, Seth Gilbert, 2002  Tulajdonságok: o Consistency o Availability o Partition tolerance  „Elosztott rendszerben egy időben nem garantálható mindhárom tulajdonság.”

CAP tétel precízebben  Egy elosztott rendszerben nem biztosítható, hogy a rendszer mindig (üzenetek elvesztése esetén is) garantálja az alábbi tulajdonságokat: o atomi konzisztencia (consistency), o rendelkezésre állás (availability).

V = Consistency – konzisztencia  Egy adategység értékét bármely csomóponttól lekérdezve ugyanazt az értéket kapjuk. read V db0db1 write V = Nem konzisztens adategység

Availability – rendelkezésre állás  A rendszer minden működő csomóponthoz érkező kérésre válaszol read V db0db1 write V = V = Nem elérhető adategység

CAP tétel precízebben (ism.)  Egy elosztott rendszerben nem biztosítható, hogy a rendszer mindig (üzenetek elvesztése esetén is) garantálja az alábbi tulajdonságokat: o atomi konzisztencia (consistency), o rendelkezésre állás (availability).

A CAP tétel kritikája  Egyszeres hibapontok (single point of failure, SPOF)  Adatbázis-kezelő összeomlása  Alkalmazáshibák  Teljesítmény figyelmen kívül hagyása o Áteresztőképesség [adategység/s] o Késleltetés [s]

A késleltetés ára 100 ms késleltetés 1% csökkenés az eladásokban

A késleltetés ára 500 ms késleltetés 20% bevételcsökkenés

gyenge konzisztencia fokozatos konzisztencia erős konzisztencia Konzisztenciamodellek  A CAP tétel következménye erős konzisztencia több adategységen Gyakori kompromisszum

Demó  Fokozatos konzisztencia a gyakorlatban: Tumblr

Tranzakciók – ACID garanciák  Atomicity  Consistency  Isolation  Durability Ld.

ACID–BASE  Basically Available  Soft state  Eventually consistent  Atomicity  Consistency  Isolation  Durability

NOSQL ADATBÁZISOK TÍPUSAI

NoSQL definíció  Nyílt forráskódú  Nem-relációs  Elosztott  Horizontálisan skálázható  Sémamentes adatmodell  Replikáció támogatása  Fokozatos konzisztencia

NoSQL adatbázisok típusai  Kulcs-érték tárolók  Dokumentumtárolók  Oszlopcsaládok  Gráfadatbázisok

NoSQL adatbázisok típusai  Kulcs-érték tárolók  Dokumentumtárolók  Oszlopcsaládok  Gráfadatbázisok

Kulcs-érték tárolók  Nagyon egyszerű programozási felület: o get(key) o put(key, value) o delete(key)

Kulcs-érték tárolók felhasználása  Munkamenetek tárolása  Egyszerű felhasználói profilok  Képek  Gyorsítótárazás (cache)

Kulcs-érték tároló implementációk 32 millió dollár

NoSQL adatbázisok típusai  Kulcs-érték tárolók  Dokumentumtárolók  Oszlopcsaládok  Gráfadatbázisok

Dokumentumtárolók  Szemistrukturált adatok  Nincs előre definiált séma  Nincs illesztés művelet

Dokumentumtárolók – JSON {"document": [ { "firstname": "Klemens", "city": "Stuttgart", "age": "42" }, { "firstname": "Rajesh", "city": "Delhi", "age": "29" }, { "firstname": "Colin", "company": "Oracle" }, { "cars": ["BMW 320d", "Jaguar XF"] } ]} szemistrukturált formátum

Dokumentumtárolók  Naplózás  Tartalomkezelő rendszerek (CMS)  Valós idejű adatelemzés

Dokumentumtároló implementációk

NoSQL adatbázisok típusai  Kulcs-érték tárolók  Dokumentumtárolók  Oszlopcsaládok  Gráfadatbázisok

Oszlopcsaládok  Táblák o Sorok = kulcs-érték párok  Nincs illesztés művelet  Előre definiált, de rugalmas séma  Például: o Memória o Kijelző átmérője o Szín o Mobiltelefon szolgáltató o stb.

Oszlopcsalád implementációk

Oszloptárolók használata  Dokumentumtárolókhoz hasonló o Naplózás o Tartalomkezelő rendszerek (CMS) o Kötegelt adatfeldolgozás (MapReduce)

Vásárlói kosár db0db1

Vásárlói kosár db0db1

NoSQL adatbázisok típusai  Kulcs-érték tárolók  Dokumentumtárolók  Oszlopcsaládok  Gráfadatbázisok

Gráf adatmodell Forrás: Titan: The Rise of Big Graph Data,

Gráf adatmodell

Korlátozott kifejezőerő

Gyakorlatiasabb modell

Tulajdonsággráf

Gráfadatbázis implementációk

Kitérő: Graphviz digraph Neo { N1 [ label = "{Node\[1\]| 'name' = 'Analízis 1.' : String\l 'credits' = 7 : long\l 'semester' = 1 : long\l 'exam' = true : boolean\l}" ] N1 -> N2 [ label = "KREDITRE_EPUL\n" ] N2 [ label = "{Node\[2\]| 'name' = 'Analízis 2.' : String\l...

Előtanulmányi rend – Graphviz

Mérnök informatikus előtanulmányi rend „Szoftver laboratórium 5.” tárgy előkövetelményei START n=node:node_auto_index(name='Szoftver laboratorium 5.') MATCH a-[r ]->n RETURN a, r START n=node:node_auto_index(name='Szoftver laboratorium 5.') MATCH a-[r ]->n RETURN a, r r*

Mérnök informatikus előtanulmányi rend START n=node:node_auto_index(semester='4') MATCH n-[r*]->o WHERE n.exam = TRUE AND o.exam = TRUE RETURN o START n=node:node_auto_index(semester='4') MATCH n-[r*]->o WHERE n.exam = TRUE AND o.exam = TRUE RETURN o 4. féléves vizsgás tárgyakra épülő vizsgás tárgyak

Alkalmazás: SZTAKI szótár Neo4j backend

SZTAKI szótár – szócikk gráfja

Források  NoSQL adatbázis-kezelők:  Christof Strauch, NoSQL Databases, strauch.de/nosqldbs.pdfhttp:// strauch.de/nosqldbs.pdf  SZTAKI Szótár – Olyan jó, hogy nem találom a szavakat,  Titan: The Rise of Big Graph Data, graph-data graph-data  BME Adatbázisok haladóknak kurzus, haladoknak haladoknak

Technológiák  Cassandra: o o  Neo4j:  Titan:  Massey Architecture Explorer,  Graphviz:

Érdekességek  MongoDB shell:  Neo4j konzol:  Sakkjátszmák gráfadatbázisban: