Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Hibatűrő.

Hasonló előadás


Az előadások a következő témára: "Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Hibatűrő."— Előadás másolata:

1 Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Hibatűrő Rendszerek Kutatócsoport N O SQL RENDSZEREK Szárnyas Gábor szarnyas@mit.bme.hu szarnyas@mit.bme.hu 2014. december 3.

2 Google Trends: „Big Data”  N.B. ez is egy Big Data feladat  Gartner hype cycle: HF

3 Gartner: Hype Cycle for Big Data – 2012 noSQL Database Management Systems

4 DB-Engines Ranking – 2014 http://db-engines.com/en/ranking_trend

5 BigTable Cassandra Redis Cassandra MongoDB 400 millió 50 millió 300 millió 55 millió 200 millió

6 Skálázhatóság feldolgozási sebesség feldolgozóegységek száma lineáris skálázódás jól skálázódó rendszer

7 Skálázódás  Vertikális skálázódás

8 Skálázódás  Vertikális skálázódás  Horizontális skálázódás o Commercial off-the-shelf (COTS) hardver

9 NOSQL RENDSZEREK

10 Google Trends – NoSQL

11 Relációs rendszerek 196019701980199020002010 relációs adatmodell SQL

12 Relációs rendszerek http://db-engines.com/en/ranking_trend

13 Dominancia  Relációs modellben gondolkozunk  Legyőzte a hálós modellt a ’70-es években  Legyőzte az objektum modellt a ’90-es években „Az SQL adatbázis tovább él, mint az elérésre használt programozási nyelv” „Az SQL adatbázis tovább él, mint az azt futtató operációs rendszer”

14 Reneszánsz  2005 előtt: RDBMS/SQL legtöbb weboldal mögött  2005 környéke: Google cikkek o Ghemawat, Gobioff, Leung: Google File System o Chang, Dean, Ghemawat, et al.: Bigtable o Mike Burrows: Chubby o Chandra, Griesemer, Redstone: Paxos made live o Dean, Ghemawat: MapReduce  DeCandia et al., Amazon: Dynamo  Facebook: Cassandra HDFS Hadoop

15 Google cikkek  Nincs forradalmi algoritmus vagy adatszerkezet  Létező ötletek újfajta alkalmazása  Rendszertervezésről szóló cikkek  Új, elosztott architektúra  Nem relációs modell, nincs SQL

16 NoSQL „forradalom”  Google, Amazon technológiák o nem nyílt forráskódúak  2005–2010: új nyílt forráskódú NoSQL technológiák a Google és az Amazon ötletei alapján  Maximum: 2009, hetente új projektek

17 NoSQL definíció  Nyílt forráskódú  Nem-relációs  Elosztott  Horizontálisan skálázható  Sémamentes adatmodell  Replikáció támogatása  Fokozatos konzisztencia

18 NoSQL definíció  Nyílt forráskódú  Nem-relációs  Elosztott  Horizontálisan skálázható  Sémamentes adatmodell  Replikáció támogatása  Fokozatos konzisztencia

19 SKÁLÁZHATÓSÁGI KIHIVÁSOK

20 Szerverek száma – 2010 Facebook: 30 000 Google: 1 000 000+ Intel: 100 000

21 Replikáció  Többpéldányos tárolás V = read V write V = read V

22 Elméleti korlát: a CAP tétel  Sejtés: Eric Brewer, 2000  Tétel: Nancy Lynch, Seth Gilbert, 2002  Tulajdonságok: o Consistency o Availability o Partition tolerance  „Elosztott rendszerben egy időben nem garantálható mindhárom tulajdonság.”

23 CAP tétel precízebben  Egy elosztott rendszerben nem biztosítható, hogy a rendszer mindig (üzenetek elvesztése esetén is) garantálja az alábbi tulajdonságokat: o atomi konzisztencia (consistency), o rendelkezésre állás (availability).

24 V = Consistency – konzisztencia  Egy adategység értékét bármely csomóponttól lekérdezve ugyanazt az értéket kapjuk. read V db0db1 write V = Nem konzisztens adategység

25 Availability – rendelkezésre állás  A rendszer minden működő csomóponthoz érkező kérésre válaszol read V db0db1 write V = V = Nem elérhető adategység

26 CAP tétel precízebben (ism.)  Egy elosztott rendszerben nem biztosítható, hogy a rendszer mindig (üzenetek elvesztése esetén is) garantálja az alábbi tulajdonságokat: o atomi konzisztencia (consistency), o rendelkezésre állás (availability).

27 A CAP tétel kritikája  Egyszeres hibapontok (single point of failure, SPOF)  Adatbázis-kezelő összeomlása  Alkalmazáshibák  Teljesítmény figyelmen kívül hagyása o Áteresztőképesség [adategység/s] o Késleltetés [s]

28 A késleltetés ára 100 ms késleltetés 1% csökkenés az eladásokban

29 A késleltetés ára 500 ms késleltetés 20% bevételcsökkenés

30 gyenge konzisztencia fokozatos konzisztencia erős konzisztencia Konzisztenciamodellek  A CAP tétel következménye erős konzisztencia több adategységen Gyakori kompromisszum

31 Demó  Fokozatos konzisztencia a gyakorlatban: Tumblr http://eventualconsistency.tumblr.com/ http://eventualconsistency.tumblr.com/

32 Tranzakciók – ACID garanciák  Atomicity  Consistency  Isolation  Durability Ld. http://en.wikipedia.org/wiki/Acid_test_(gold)http://en.wikipedia.org/wiki/Acid_test_(gold)

33 ACID–BASE  Basically Available  Soft state  Eventually consistent  Atomicity  Consistency  Isolation  Durability

34 NOSQL ADATBÁZISOK TÍPUSAI

35 NoSQL definíció  Nyílt forráskódú  Nem-relációs  Elosztott  Horizontálisan skálázható  Sémamentes adatmodell  Replikáció támogatása  Fokozatos konzisztencia

36 NoSQL adatbázisok típusai  Kulcs-érték tárolók  Dokumentumtárolók  Oszlopcsaládok  Gráfadatbázisok

37 NoSQL adatbázisok típusai  Kulcs-érték tárolók  Dokumentumtárolók  Oszlopcsaládok  Gráfadatbázisok

38 Kulcs-érték tárolók  Nagyon egyszerű programozási felület: o get(key) o put(key, value) o delete(key)

39 Kulcs-érték tárolók felhasználása  Munkamenetek tárolása  Egyszerű felhasználói profilok  Képek  Gyorsítótárazás (cache)

40 Kulcs-érték tároló implementációk 32 millió dollár

41 NoSQL adatbázisok típusai  Kulcs-érték tárolók  Dokumentumtárolók  Oszlopcsaládok  Gráfadatbázisok

42 Dokumentumtárolók  Szemistrukturált adatok  Nincs előre definiált séma  Nincs illesztés művelet

43 Dokumentumtárolók – JSON {"document": [ { "firstname": "Klemens", "city": "Stuttgart", "age": "42" }, { "firstname": "Rajesh", "city": "Delhi", "age": "29" }, { "firstname": "Colin", "company": "Oracle" }, { "cars": ["BMW 320d", "Jaguar XF"] } ]} szemistrukturált formátum

44 Dokumentumtárolók  Naplózás  Tartalomkezelő rendszerek (CMS)  Valós idejű adatelemzés

45 Dokumentumtároló implementációk

46 NoSQL adatbázisok típusai  Kulcs-érték tárolók  Dokumentumtárolók  Oszlopcsaládok  Gráfadatbázisok

47 Oszlopcsaládok  Táblák o Sorok = kulcs-érték párok  Nincs illesztés művelet  Előre definiált, de rugalmas séma  Például: o Memória o Kijelző átmérője o Szín o Mobiltelefon szolgáltató o stb.

48 Oszlopcsalád implementációk

49 Oszloptárolók használata  Dokumentumtárolókhoz hasonló o Naplózás o Tartalomkezelő rendszerek (CMS) o Kötegelt adatfeldolgozás (MapReduce)

50 Vásárlói kosár db0db1

51 Vásárlói kosár db0db1

52 NoSQL adatbázisok típusai  Kulcs-érték tárolók  Dokumentumtárolók  Oszlopcsaládok  Gráfadatbázisok

53 Gráf adatmodell Forrás: Titan: The Rise of Big Graph Data, http://www.slideshare.net/slidarko/titan-the-rise-of-big-graph-datahttp://www.slideshare.net/slidarko/titan-the-rise-of-big-graph-data

54 Gráf adatmodell

55

56 Korlátozott kifejezőerő

57

58 Gyakorlatiasabb modell

59

60 Tulajdonsággráf

61

62

63

64

65

66

67

68 Gráfadatbázis implementációk

69 Kitérő: Graphviz digraph Neo { N1 [ label = "{Node\[1\]| 'name' = 'Analízis 1.' : String\l 'credits' = 7 : long\l 'semester' = 1 : long\l 'exam' = true : boolean\l}" ] N1 -> N2 [ label = "KREDITRE_EPUL\n" ] N2 [ label = "{Node\[2\]| 'name' = 'Analízis 2.' : String\l...

70 Előtanulmányi rend – Graphviz

71

72 Mérnök informatikus előtanulmányi rend „Szoftver laboratórium 5.” tárgy előkövetelményei START n=node:node_auto_index(name='Szoftver laboratorium 5.') MATCH a-[r ]->n RETURN a, r START n=node:node_auto_index(name='Szoftver laboratorium 5.') MATCH a-[r ]->n RETURN a, r r*

73 Mérnök informatikus előtanulmányi rend START n=node:node_auto_index(semester='4') MATCH n-[r*]->o WHERE n.exam = TRUE AND o.exam = TRUE RETURN o START n=node:node_auto_index(semester='4') MATCH n-[r*]->o WHERE n.exam = TRUE AND o.exam = TRUE RETURN o 4. féléves vizsgás tárgyakra épülő vizsgás tárgyak

74 Alkalmazás: SZTAKI szótár Neo4j backend

75 SZTAKI szótár – szócikk gráfja

76 Források  NoSQL adatbázis-kezelők: http://nosql-database.org/ http://nosql-database.org/  Christof Strauch, NoSQL Databases, http://www.christof- strauch.de/nosqldbs.pdfhttp://www.christof- strauch.de/nosqldbs.pdf  SZTAKI Szótár – Olyan jó, hogy nem találom a szavakat, http://nws.niif.hu/ncd2012/docs/ehu/022.pdf http://nws.niif.hu/ncd2012/docs/ehu/022.pdf  Titan: The Rise of Big Graph Data, http://www.slideshare.net/slidarko/titan-the-rise-of-big- graph-data http://www.slideshare.net/slidarko/titan-the-rise-of-big- graph-data  BME Adatbázisok haladóknak kurzus, https://www.db.bme.hu/targyak/adatbazisok- haladoknak https://www.db.bme.hu/targyak/adatbazisok- haladoknak

77 Technológiák  Cassandra: o http://cassandra.apache.org/ http://cassandra.apache.org/ o http://www.datastax.com/ http://www.datastax.com/  Neo4j: http://www.neo4j.org/http://www.neo4j.org/  Titan: http://thinkaurelius.github.io/titan/http://thinkaurelius.github.io/titan/  Massey Architecture Explorer, http://xplrarc.massey.ac.nz/ http://xplrarc.massey.ac.nz/  Graphviz: http://www.graphviz.org/http://www.graphviz.org/

78 Érdekességek  MongoDB shell: http://try.mongodb.org/http://try.mongodb.org/  Neo4j konzol: http://console.neo4j.org/http://console.neo4j.org/  Sakkjátszmák gráfadatbázisban: http://gist.neo4j.org/?6506717 http://gist.neo4j.org/?6506717


Letölteni ppt "Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Hibatűrő."

Hasonló előadás


Google Hirdetések