Hadoop Gyakorlat 1 Korszerű adatbázisok.

Slides:



Advertisements
Hasonló előadás
Big Data Korszerű adatbázisok 2014.
Advertisements

Operációs Rendszerek I.
Operációs Rendszerek I.
Felhasználói felületek és üzleti logika Bollobás Dávid ASP.NET
2012. tavaszi félév Vitéz Gergely. A diasor ismerete nem helyettesíti a tankönyvet, és a példatárat. A diasor ismerete szükséges, de nem elégséges feltétele.
Ismétlés. Ismétlés: Adatbázisok megnyitása: OPEN DATABASE adatbázis_név OPEN DATABASE ”adatbázis_név elérési útvonallal” Adattábla megnyitása: USE tábla_név.
Számítógépes Hálózatok
Rendszerfejlesztés II gyak
Adaptív megjelenítés a WPF layout rendszer segítségével.
Adatbázis alapú rendszerek
HADOOP Korszerű Adatbázisok Elérés, Belépés Elérés: eszakigrid109.inf.elte.hu Belépés: felhasználó/jelszó: neptun-kód Manager oldalak:
Virtuális Obszervatórium Korszerű adatbázisok 2014.
Hadoop Gyakorlat 1 Korszerű adatbázisok Parancsok Listázás – hadoop fs –ls Kiírja egy fájl tartalmát – hadoop fs –cat Betöltés – hadoop fs –put.
LINUX/UNIX PARANCSOK.
11. előadás (2005. május 10.) A make segédprogram Alacsony szintű műveletek és bitmezők Fájl, katalógus rendszer hívások 1.
Mikrovezérlők alkalmazástechnikája laboratóriumi gyakorlat Kovács Tamás & Mingesz Róbert 3. óra február 20., 23.
Windows alapok Fájlkezelés.
Könyvtárak kezelése Könyvtárműveletek
Készítette: Keszthelyi Zsolt
Könnyen,gyorsan Powershell-ül
Pandora felhasználók Active Directory migrációja.
Kiss Attila: Korszerű adatbázisok Adatbázis kutatási eredmények a TÁMOP támogatásával Június 7. Visegrád.
Hadoop Gyakorlat 2 Korszerű adatbázisok Parancsok Listázás – hadoop fs –ls Kiírja egy fájl tartalmát – hadoop fs –cat Betöltés – hadoop fs –put.
Operációs rendszerek gyakorlat
WEB Technológiák WEB-DB és XML ME Általános Informatikai Tsz. dr. Kovács László.
Operációs rendszerek gyakorlat 4. Gyakorlat Vakulya Gergely.
Operációs rendszerek gyakorlat 2. Gyakorlat Vakulya Gergely.
PHP III. Fájlok, űrlapok.
PHP VII Sütik, munkamenetek. Sütik Mi az a süti? A süti (cookie) állapotot tárol a felhasználó böngészőjében. Pl. ha egy oldalon beállítható, hogy milyen.
Exchange Server 2007 Client Access Role
Mikrovezérlők, perifériák laboratóriumi gyakorlat 3. óra szeptember 18. Mingesz Róbert v
Mappák és állományok kezelése
Kezelői felületek. Exchange 2000/2003 Exchange System Management (ESM) MMC konzol Exchange 2007 Exchange Management Console (EMC) MMC konzol Exchange.
Operációs rendszerek gyakorlat 1. Bevezetés Vakulya Gergely.
Hálózati beállítások és szolgáltatások
Fájlkezelés Pascalban
Felhasználók és jogosultságok
1 Operációs rendszerek I, 3. gyakorlat Windisch Gergely
Készítette: Lipp Marcell
Készítette: Rummel Szabolcs Elérhetőség:
PARANCSOK HASZNÁLATA WINDOWS-BAN ÉS LINUXBAN II. Balaton Marcell Balázs.
1Szegedi Tudományegyetem Természettudományi és Informatikai KarAntal Gábor Programozás I. 1. gyakorlat.
3. előadás.  Apache szerver tudnivalók  Az index.php .htaccess – web-szerverünk beállításai  Konfigurációs állományok  Adatbázis kapcsolódás beállítása.
Web fejlesztés V. Illés Zoltán ELTE Informatikai Kar
Gráf-adatbázis építése twitter adatokból
Egyenesvonalú (lineáris) adatszerkezetek
Adatbázis-kezelés Tarcsi Ádám január. 15. MySQL és PHP.
OPERÁCIÓS RENDSZEREK LINUX – PARANCSSOR.
Power Lutár Patrícia Pellek Krisztián.  -ltLess than  -leLess than or equal to  -gtGreater than  -geGreater than or equal to  -eqEqual to  -neNot.
Fejlett Programozási Technológiák II. 2009, Nagy Csaba JSP – Java Server Pages.
Illés Zoltán ELTE Informatikai Kar
Java web programozás 7-8..
1Szegedi Tudományegyetem Természettudományi és Informatikai KarAntal Gábor Programozás I. 1. gyakorlat.
Java web programozás 6..
Gombos GergőKorszerű Adatbázis 2012/13 tavasz 2 Kik használják?
Computing n-Gram Statistics in MapReduce Klaus Berberich, Srikanta Bedathur EDBT/ICDT 2013 Joint Conference.
1Szegedi Tudományegyetem Természettudományi és Informatikai KarAntal Gábor Programozás I. 1. gyakorlat.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék MapReduce alapok „Big Data” elemzési módszerek Kocsis Imre,
Gráfadatbázisok Rácz Gábor.
Műveletek mappákkal és a fájltípusok
Pinczel Balázs, ELTE IK, április Emlékeztető: NoSQL Célok: Nagy teljesítmény Magas rendelkezésre állás Elosztott működés Következmények:
Logikai programozás 10..
Triggerek gyakorlás.
Total commander.
„Designer-barát” játéklogika
Unix Linux GNU Copyright kriptográfia
Rendszerfejlesztés gyakorlat
Docker (on Windows) Hogyan kerüljük el a csapdákat?
„Big Data” elemzési módszerek
Műveletek mappákkal és a fájltípusok
Előadás másolata:

Hadoop Gyakorlat 1 Korszerű adatbázisok

Elérés Namenode: ResourceManager Jobhistory SSH / SCP http://monet.inf.elte.hu:6270/ ResourceManager http://monet.inf.elte.hu:6288 Jobhistory http://monet.inf.elte.hu:6289 SSH / SCP http://monet.inf.elte.hu:6222 felh / jelszo : ka_{neptun_azon} / 123456

Parancsok Listázás Kiírja egy fájl tartalmát Betöltés hdfs dfs –ls Kiírja egy fájl tartalmát hdfs dfs –cat Betöltés hdfs dfs –put Könyvtár létrehozás hdfs dfs –mkdir Könyvtár törlése rekurzívan hdfs dfs –rm -r Gombos Gergő Korszerű Adatbázisok 2014

Hadoop example ggombos@dbpc62:~$ yarn jar ../hadoop/hadoop-2.6.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar pi 16 100000

Eclipse plugin Letölteni a szükséges jar-okat http://oktnb16.inf.elte.hu/ggombos/korszeru/ hadoop-eclipse-kepler-plugin-2.2.0.jar hadoop-common-2.6.0.jar hadoop-mapreduce-client-core-2.6.0.jar Plugin bemásolása az eclipse/plugin mappába Elindítjuk az eclipset Nézet átállítása Map/Reduce-ra New Hadoop location beállítása Gombos Gergő Korszerű Adatbázisok 2014

Hadoop location map/reduce master: dfs master: host: monet.inf.elte.hu port: 6210 dfs master: use M/R Master host OK port: 6220 User name: ka_{neptun azonosito} Gombos Gergő Korszerű Adatbázisok 2014

Segítség A generált kódban lecseréljük a sorokat erre: conf.setInputFormat(TextInputFormat.class); conf.setOutputFormat(TextOutputFormat.class); FileInputFormat.setInputPaths(conf, new Path("In")); FileOutputFormat.setOutputPath(conf, new Path("Out")); Létező fmappák törlése: FileSystem fs = FileSystem.get(conf); if (fs.exists(new Path(“Outer”))) fs.delete(new Path(“Outer”),true); Gombos Gergő Korszerű Adatbázisok 2014

Futtatás Export -> normal JAR Felmásoljuk a dbpc62-re Set main class!!!! Felmásoljuk a dbpc62-re yarn jar jar_name.jar Gombos Gergő Korszerű Adatbázisok 2014

Adathalmazok Tweet/ User_mention/

Hadoop feladatok Számolás Legyűjtés Szűrés Elosztott számítás Rendezés Chain Gráf elemzés

Feladat 0 (WordCount) Feladat: Implementáljuk a WordCount feladatot! Input: /user/ggombos/WCInput/wcInput.txt

Feladat 1 (Számolás) Feladat: Hány tweet jött mobilról? (Amelyiknek van lat, lon adata, az mobilról jött) Input: /user/hadoop/korszeruInput/tweets + Combiner

Feladat 2 (Legyűjtés) Feladat: Userek melyik tweetben voltak említve? Input: /user/hadoop/korszeruInput/mentions

Feladat 3 (Szűrés) Feladat: Gyűjtsük le azokat a tweeteket amelyekben szerepel a ‚hebdo’ szó. input: /user/hadoop/korszeruInput/tweets

Feladat 4 (Elosztott számítás) Feladat: Hány négyzetszám van 1..10 000 000 között? Input: /user/ggombos/szamokInput/SzamokInput.txt Megj.: nincs reducer

Feladat 5 (Rendezés) Feladat: Rendezzük a 7-8 óra közötti tweeteket időrendbe! Input: /user/hadoop/korszeruInput/tweets

Feladat 6 (Chain) Feladat: Gyűjtsük le azokat a tweeteket amelyekben szerepel a ‚hebdo’ szó, gyűjtsük össze melyik user hány tweetjében említette. input: /user/hadoop/korszeruInput/tweets Megj.: chain (MAP+ | REDUCE | MAP* )

Feladat 6 (Chain) Feladat: Gyűjtsük le azokat a tweeteket amelyekben szerepel a ‚hebdo’ szó, gyűjtsük össze melyik user hány tweetjében említette. MAP1 – szűrés MAP2 – user emlites Reducer – összeadja az emliteseket MAP3 – Megforditja a kiiratast

Feladat 7 (Gráf elemzés) Feladat: Ki-kit említett? Kimenő, bemenő élek egy adott user-re Input: /user/hadoop/korszeruInput/mentions Megj.: combiner

Köszönöm a figyelmet!