Bevezetés a Grid rendszerekbe Prof Kacsuk Péter MTA SZTAKI Párhuzamos és elosztott rendszerek laboratórium

Slides:



Advertisements
Hasonló előadás
EGEE-II Enabling Grids for E-sciencE EGEE and gLite are registered trademarks HunGrid Grid technológiák hozzáférési lehetőségei az intézetben.
Advertisements

Nagy teljesítményű számítástechnika és elosztott számítóhálózatok
Virtualizált Biztonságos BOINC Németh Dénes Deák Szabolcs Szeberényi Imre.
IBM Software Group © 2006 IBM Corporation Hatékonyság és üzleti intelligencia Egységesített felület meglévő alkalmazásainkhoz Szabó János Technikai szakértő.
SPC/SQC valósidejű rendszerekben 2000 November /Magyar Batch Fórum 1 Hi-Spec Solutions SPC/SQC in Real Time Systems (Statisztikai és minőségi szabályzás.
„Egy hálóban webezünk!” - a reformok informatikai kihívásai
Önkormányzati informatika ASP alapokon
Microsoft Üzleti Megoldások Konferencia Naprakész Microsoft technológiák banki környezetben Bessenyei László Magyar Külkereskedelmi Bank Rt.
Párhuzamos programozás Grid környezetben Kacsuk Péter MTA SZTAKI
Infrastruktúra-felügyelet a privát felhőben
1 GTS Szerver Virtualizáció – Ügyvitel a felhőben.
Alkalmazások portolása Gridre Balaskó Ákos MTA SZTAKI 2011 november 14.
RENDSZERINTEGRÁLÁS B_IN012_1
Adminisztratív teendők Kacsuk Péter Egyetemi tanár
SQL Server 2005 Reporting Services a gyakorlatban
2 Forrás: The Standish Group International, Extreme Chaos, The Standish Group International, Inc., 2000.
A számítógépes hálózatok világa
Virtualizáció Korszerű Adatbázisok Ferenci László
1 KLASZTER PROGRAMOZÁSI TECHNOLÓGIA ÉS ALKALMAZÁSA A METEOROLÓGIÁBAN Kacsuk Péter Horányi András
Az ETR technológia DEXTER Informatikai kft..
1 Hálózati Operációs Rendszerek gyakorlat Bevezető Előadó: Bilicki Vilmos
Cluster Szorosan összekapcsolt számítógépek csoportja (egy gépet alkotnak) Gyakori a LAN megoldás Céljuk: – Teljesítmény növelése – Rendelkezésre állás.
A CAD/CAM modellezés alapjai
Többmagos processzorok
Hungrid grid.kfki.hu/hungrid. Hungrid Mi a Hungrid? –az EGEE egyetlen általános célú, hivatalos magyar VO-ja –teljeskörű grid szolgáltatás az egész akadémiai.
Hernáth Szabolcs RMKI grid és Hungrid Hernáth Szabolcs
Hungrid: Magyarország kapuja az EGEE infrastruktúrájához Hernáth Szabolcs MTA KFKI RMKI
2004. március eEgészség – Digitális Aláírás Workshop 2004 Március Tim Zoltán, CISA Insurance Technology Kft. „Megbízható harmadik fél szolgáltatás,
1 Virtuális szuperszámítógép szolgáltatás kialakítása az akadémiai hálózat felhasználásával Kacsuk Péter
Hibrid felhő Privát-, publikus és hoster felhők összekapcsolása
Költség hatékony és rugalmas infrastruktúra ami az ismert és meglevő termékeken alapul  Heterogén környezetek támogatása  Folyamat automatizálás  Önkiszolgáló.
Demo/teszt környezetek Szerver konszolidáció Adatközpontok alapja.
1 Virtuális szuperszámítógép szolgáltatás kialakítása az akadémiai hálózat felhasználásával Kacsuk Péter Szeberényi.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks P-GRADE Portal gyakorlat ismertető Gergely.
SEEGRID használat saját tanusítvánnyal. Lépések Tanusítvány transzformálása –Igen, sajnos megint... Bejelentkezés saját accounttal Tanusítvány és titkos.
Grid felhasználói és alkalmazás fejlesztői kurzus Debreceni Egyetem, Január
SZTAKI Desktop Grid Kacsuk Péter MTA SZTAKI
A SHIWA projekt – Munkafolyamat gráfok és különböző grid köztesrétegek együttműködésének problémái és megoldásai e-Science Café Budapest, Óbudai.
EGI-InSPIRE RI EGI-InSPIRE EGI-InSPIRE RI e-Science Café RMKI Hernáth Szabolcs 8/5/2014.
World Wide Web Magyarországon Kovács László MTA SZTAKI Elosztott Rendszerek Osztály dsd.sztaki.hu.
A Magyar ClusterGRID projekt Stefán Péter tudományos munkatárs NIIF Iroda
Web Architecture. Development of Computing Architectures Monolithic mainframe programming Client Server Real Client Server Web Programming.
Az AliEn rendszer Novák Judit Vesztergombi György Predrag Buncic Pablo Saiz Jan-Erik Revsbench.
Az AliEn rendszer Novák Judit Vesztergombi György Predrag Buncic
Nagy teherbírású rendszerüzemeltetés a felhőben. Miről lesz szó? Cloud áttekintő Terheléstípusok és kezelésük CDN Loadbalancing Nézzük a gyakorlatban.
Bevezetés az európai és magyar Grid rendszerekbe Sipos Gergely MTA SZTAKI Párhuzamos és elosztott rendszerek laboratórium
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Alkalmazás és megjelenítés virtualizáció Micskei Zoltán.
EGEE-II INFSO-RI Enabling Grids for E-sciencE A HunGrid infrastruktúra és alkalmazásfejlesztő környezete Gergely Sipos
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Bioinformatikai és orvosbiológiai Grid alkalmazások.
Ritter Dávid NIIF Műszaki Tanács
Alkalmazások skálázása felhőben Farkas Zoltán MTA SZTAKI LPDS Budapest,
Akos Balasko MTA SZTAKI, Hungarian Academy of Sciences Felhő használat paraméterteret bejáró szimulációk futtatására.
Miért jó nekünk kutatóknak a felhő?
Kitekintés a jövőbe Kacsuk Péter MTA SZTAKI. SZTAKI Felhő használata A SZTAKI Felhőt minden MTA kutató ingyenesen használhatja Ehhez be kell regisztrálni.
Felhő PC demonstráció Gergely Márk MTA SZTAKI Laboratory of Parallel and Distributed Systems
"Kulturális honlapjaink minősége - európai szemmel" Integrált egyetemi könyvtár honlapkészítésének dilemmái Karácsony Gyöngyi Debreceni Egyetem Egyetemi.
EGEE-III INFSO-RI Enabling Grids for E-sciencE A Hungrid VO szolgáltatásai A Hungrid, a magyar NGI bölcsője Hernáth Szabolcs Szeberényi.
A Windows Server 2003 termékcsalád A Windows Server 2003 termékcsaládnak 4 tagja van: Windows Server 2003, Standard Edition Windows Server 2003, Enterprise.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Összefoglalás M. Kozlovszky MTA SZTAKI
Advanced Next gEneration Mobile Open NEtwork ANEMONE Promóciós Nyílt Nap Nyitó előadás 2008 április 22. Dr. Imre Sándor
Bolognai Folyamat a az európai és a hazai mérnökképzésben Jobbágy Ákos BME november 17.
Piramis klaszter rendszer
05 Novembre év a részecskefizika kutatásban Európai Nukleáris Kutatási Szervezet Európai Részecskefizikai Laboratórium.
LPDS és felhő technológia Peter Kacsuk
30 éves a Nemzeti Információs Infrastruktúra Fejlesztési Program
Eötvös Szabolcs Tamás Polyák Ádám Réthy Balázs Szeiler Beáta
Délkelet-Európai HPC Projekt
Információtechnológiák és tudásbázis az Agrof-MM Leonardo+ projektben M=Mountain; M=Mediterranean
Docker technológia és alkalmazások: gyártás és logisztika szimulátor
Microsoft SQL licenselés a gyakorlatban
Előadás másolata:

Bevezetés a Grid rendszerekbe Prof Kacsuk Péter MTA SZTAKI Párhuzamos és elosztott rendszerek laboratórium

Tartalom ● Mi a grid, miért és mire használják? ● Általános grid architektúra ● Szolgáltatás Gridek ● Hozzáférés szolgálatás gridhez ● Desktop Gridek ● Hozzáférés desktop gridhez ● A tanfolyam célja ● Konklúziók

Mi az a Grid? ● Ezek az erőforrások heterogének ● A Grid számítógépek, tárolóegységek, speciális berendezések és szolgáltatások együttese, amik dinamikusan csatlakozhatnak és hagyhatják el a Gridet Internet ● Földrajzilag elosztottak és tipikusan Internettel vannak összekötve ● Igény szerint (on- demand) érhetők el

Miért használnak Gridet? ● A felhasználónak olyan komplex problémát kell megoldani, ami sok szolgáltatás és erőforrás együttes alkalmazását igényli azért, hogy Csökkentse a feldolgozási időt Elérjen nagy adatbázisokat és speciális készülékeket Együttműködjön másokkal Internet

Tipikus Grid alkalmazási területek Nagy számítási kapacitást igénylő alkalmazások Nagy teljesítményű számítás (High Performance Computing) Egyetlen párhuzamos program végrehajtásának idejét lerövidíteni Nagy áteresztőképességű számítások (High Throughtput Computing) Minél több hasonló méretű, egymástól független jobot lefuttatni egységnyi idő alatt Nagy adatmennyiségekel dolgozó alkalmazások Általában több adatbázis, tudásbázis együttes bevonásával Kollaboratív munka Több felhasználó együttes bevonásával összetett tudást igénylő problémák megoldása

Példa: Large Hidron Collider, CERN, Genf ATLASCMS LHCb ~10-15 PetaBytes /year ~10 8 events/year ~10 3 batch and interactive users

Példa: Rolls Royce repülőgép motorok 1Gb data per engine per flight ● Real-time adatletöltés a bázis repülőtérre ● Historikus összehasonlítás ● Adatintegráció repterek között ● Elemzés, analizálás ● Számítás elosztott architektúrán ● Kiszolgáló személyzet felkészítése

Példa: Orvosi képfeldolgozás... Push images in the workflow Image + metadata Metadata Server LFN Other medical metadata ~ 1 millió kép / paciens 1024 x 1024 felbontás / kép ~ 1 gByte / paciens 5 paciens / nap

További példák In silico gyógyszerkutatás – molekula szimulációk, alkalmatlan vegyületek kiszűrése Földtudományok, űrkutatás – szatellit és távcső képek megosztása, elemzése Archeologia – digitális archivumok létrehozása és megosztása, szimulációk futtatása Időjárás előrejelzés – adatbegyűjtés, modellválasztás, szimulációk, összegzés Mérnöki tudományok – épületek, közlekedési eszközök szimulációja

Miért célszerű erre Grid rendszert használni? Az ilyen tipusú problémákra 5-10 éve még szuperszámítógépeket használtak Ma nagy részükre Grid rendszert használnak Az okok: A Grid képes egyesíteni és kihasználni az intézetek szabad számítógép kapacitását mindenféle extra beruházás nélkül Virtuálisan és igény szerint megnöveli minden csatlakozó intézmény gépparkjának kapacitását Elosztott erőforrásokat integrál Rugalmas hozzáférést tesz lehetővé

GRIDMIDDLEWAREGRIDMIDDLEWARE Visualising Workstation Mobile Access Supercomputer, PC-Cluster Data-storage, Sensors, Experiments Internet, networks Grid vízió

Megoldandó problémák ● Erőforrások standard elérése ● Számítógépek ● Tárolóeszközök ● Speciális eszközök ● Szoftverek ● Hozzáférés szabályozás (biztonságtechnika) ● Terheléselosztás ● Erőforrások állapotának monitorozása ● Alkalmazások monitorozása ● Hibakezelés ● Alkalmazási metodika, programozási koncepció ●...

Általános Grid modell Internet Szabad kapacitás kiajánlása Kapacitás igénylés Int1 Int2 Int4 Int3

A Grid két szereplője Erőforrás felajánlók (donorok) = D Erőforrás felhasználók = H A kettő közötti viszony adja meg az alkalmazott Grid modell típusát: Ha H ~ D => általános Grid modell Ha H >> D=> szolgáltatói Grid modell Ha H desktop Grid modell

Általános Grid modell jellemzői Bárki felajánlhat erőforrást Heterogén erőforrások, amik dinamikusan jönnek, mennek Bárki felhasználhatja a felajánlott erőforrásokat SAJÁT alkalmazásának megoldására Szimmetrikus és egyenjogú kapcsolat az erőforrás donorok és használók között: H ~ D

Az általános grid modell bonyolult... ● Számtalan felhasználási lehetőség ● Bonyolult biztonsági megoldások ● Fejlett erőforrás információs rendszer ● Fejlett brókerezési rendszer ● Bonyolult installálni és karbantartani ● Nagyon megbízhatatlan ● Gyakorlatban két irányba egyszerűsödött: ● Szolgáltatás Gridek ● Dekstop Gridek

Szolgáltatás Gridek

Szolgáltatói Grid modell példa: Enabling Grids for E-sciencE (EGEE) Internet Szabad kapacitás kiajánlása napi 24 órában (statikusan) Kapacitás igénylés dinamikusan Kutatóhely1 Felhasználó 1 Kutatóhely2 Felhasználó N Donor és Felhasználó

Szolgáltatói Grid modell jellemzői Csak “professzionális” szolgáltatók ajánlhatnak fel erőforrást Homogén erőforrások – egyszerűbb karbantarthatóság, alkalmazás fejlesztés Bárki felhasználhatja a felajánlott erőforrásokat SAJÁT alkalmazásának megoldására Asszimmetrikus és nem egyenjogú kapcsolat az erőforrás donorok és használók között: H >> D

Generic Grid Architecture CPUs Tertiary Storage Online Storage Communications Scientific Instruments Resource Management Application Environments Application Support Grid Common Services: Middleware services Grid Fabric - local resources Information Services Resource Sceduling Data Access Caching Resource Co-Allocation Authentication Authorisation Monitoring Fault Management Policy Accounting Instrument Management Analysis & Visualisation Collaboratories Problem Solving Environments Grid Portals MPICONDORCORBAJAVA/JINI OLE DCOM Other... Applications

Szolgáltatói Grid példa: EGEE Country participating in EGEE ● > 200 sites in 40 countries ● ~ CPUs ● ~ 5 PB storage ● 98k jobs/day ● > 200 Virtual Organizations ● ⇨ The world’s largest multi-disciplinary Grid ● gLite middleware

Szolgáltatói Grid példa: Open Science Grid 30 Virtual Organizations 105 Resources 26 Support Agencies Middleware: – Virtual Data Toolkit (VDT): collection of grid tools – Condor – Globus – VO Management Service

Dynamic Grid ~ 33 sites, ~1400 CPUS Production Grid – Applications from various scientific disciplines – Sites operate 24/7 – Mostly unattended by administrators Middleware: – Advanced Resource Connector (ARC) Szolgáltatói Grid példa : NorduGrid

HunGrid – EGEE magyar VO-ja ● Folyamatos működésű (napi 24 órában működik) ● Cél: az akadémiai intézetek kutatóinak folyamatos támogatása ● Az EGEE Grid magyar adaptációja, virtuális szervezete ● januárban lett felállítva ● Résztvevő telephelyek: ● RMKI: 200 proc. ● ELTE: 64 proc. ● BME: 32 proc. ● NIIF: 12 proc. ● Összes proc. kapacitás: 308 proc.

Limitált szolgálatás grid változat: Magyar KlaszterGrid Internet Szabad kapacitás kiajánlása éjszaka Kapacitás igénylés éjszaka Egyetem1 Egyetem2Egyetem3 Egyetem4

ClusterGrid ● Szakaszos működésű: A nappal oktatásban használt PC laborokat köti Gridbe ● éjszakánként ● hétvégeken ● ~1400 PC 26 egyetemen ill. főiskolán ● A grid teljesítmény ~0.5 Tflop ● 70 tudományos projekt ● 2003 július óta üzemel és folyamatosan nő a kapacitása

Szolgáltatás Grid hozzáférés

Szolgáltatás gridek és Virtuális organizációk VO: erőforrások és felhasználók csoportja Logikai egység Hozzáférési határ Grid Virtuális szervezet

Szolgáltatás grid hozzáférés ● Grid tanusítvány beszerzése egy elismert Tanusítvány Szolgáltatótól (CA) ● Magyarországi CA: NIIF ● Regisztráció egy Virtuális Organizációba ● EGEE VO-k listája: Central Operations portal: ● HunGrid VO: eneral ● Grid használat parancssorból vagy P-GRADE portálból

P-GRADE Portál röviden Fájl replika és katalógus szolgáltatások Erőforrás bróker Fájl tároló szolgáltatások Számítási erőforrások Tanusítvány alapú azonosítás Információs rendszer P-GRADE Portal HTTP

A P-GRADE Portal szolgáltatásai WORKFLOW CERTIFICATE PERFORMANCE EXECUTION DESIGN MANAGEMENT ANALYSIS ON GRID(S)   

Egy P-GRADE Portál alkalmazás ● Irányított aciklikus gráf, amelyben ● Csomópontok: végrehajtható programok ● Portok: input/output fájlok melyeket a programok olvasnak vagy írnak ● Élek: programok közötti adatfüggőségek ● Workflow szemantikája: ● Egy csomópontban lévő program akkor indítható ha minden input fájlja rendelkezésre áll ● A portál szerverbe épített workflow menedzser felelőssége

Programok párhuzamosítása Egyidőben több processze fut – Párhuzamos futás egy szolgáltatás grid csomóponton belül (MPI) – Párhuzamos futás a workflow gráfon belül Egyidőben több programja fut – A workflow futtatása több példányban paraméter vizsgálatként Egyidőben több példánya fut

Desktop Gridek

Desktop Grid modell Internet Szabad kapacitás kiajánlása dinamikusan Munkacsomagok kiosztása Vállalati/ egyetemi szerver Vállalati/ egyetemi PC Megoldandó feladat

Desktop Grid modell jellemzői Bárki felajánlhat erőforrást Heterogén erőforrások, amik dinamikusan jönnek, mennek Egy vagy néhány projekt használhatja fel a felajánlott erőforrásokat Asszimmetrikus és nem egyenjogú kapcsolat az erőforrás donorok és használók között: H << D

Desktop Grid fajtái Globális Desktop Grid (DG) Célja nagy horderejű tudományos feladatokhoz donor PC-ket gyűjteni Lokális DG Célja, hogy a DG koncepciót bármilyen közösség (kut.intézet, egyetemi tsz., kar, vállalat, város, stb.) tudja használni

SETI: egy globális DG ● ● 1 grid 1 alkalmazáshoz ● 3.8M önkéntes 226 országból ● 1200 CPU év/nap ● 38 TF fenntartható teljesítmény ~ 28. a TOP500 listán (Japanese Earth Simulator 30. ugyanitt) ● Alapját adó BOINC infrastruktúra már külön is elérhető

SZTAKI Desktop Grid ● BOINC DG technológián alapuló rendszer ● Megkönnyíteni DG alkalmazások létrehozását és futtatását ● Megkönnyíteni DG infrastruktúra installálását és üzemeltetését ● Lokális és globális csomag is elérhető ● Globális minta installáció: ● júniusban lett felállítva a SZTAKI-ban: ● Megoldandó feladat: általánosított bináris számrendszerek keresése (ELTE Matematikai Tanszék) ● Több mint beregisztrált résztvevő ● ~ számítógép ● GFlop teljesítmény Demonstrálni és bizonyítani a DG koncepció működését Meggyőzni a kételkedőket a DG használhatóságáról Bárki beszállhat mint erőforrás felajánló

SZTAKI Desktop Grid globális verzió

SZTAKI Desktop Grid globális mintarendszer SZTAKI DG mintainstalláció:750 GFlops NIIF Supercomputer: 300 GFlops NIIF ClusterGrid: 500 GFlops OMSZ Supercomputer: 900 GFlops TOP 500 entry performance:5929 GFlops

SZTAKI DG használatának fokozatai 1.Bárki kipróbálhatja a DG koncepció működését PC- jét beregisztrálva a mintarendszerbe 2.Bárki hozhat alkalmazást, amit szeretne az SZDG- re feltelepíteni. Ekkor segítünk az alkalmazás SZDG adaptálásában és elvégezzük a telepítést 3.Bármely szervezet felállíthatja saját DG rendszerét az SZDG mintájára: Egyetlen PC szervert kell beruháznia Mi vállaljuk, hogy egyetlen nap alatt felállítjuk a DG-t Segítünk a szervezet alkalmazásait adaptálni és telepíteni a saját DG-re

Két alapvető Grid irányzat Grid Technológia Desktop Grid Utility Grid Alkalmazás fejlesztés Tipikus alkalmazás DC API P-GRADE portal Mester-szolgaÁlt.párhuzam. (Workflow) (EGEE, HunGrid)

Kihasználható párhuzamosság típusok a Gridben Szolgáltatás Grid – Master-slave (paraméter vizsgálat) – Telephelyen belüli párhuzamosság – Telephelyek közötti párhuzamosság – Workflow – Ezek kompinációi, pl Telephelyen belüli paraméter vizsgálat Workflow paraméter vizsgálat Desktop Grid – Master-slave (paraméter vizsgálat)

Paraméter vizsgálat v. Mester/szolga párhuzamosság Internet Mester munkacsomag1 munkacsomag2 munkacsomag3 munkacsomagN

Telephelyen belüli párhuzamosság Internet

Telephelyek közötti párhuzamosság Internet

Workflow párhuzamosság Internet

Kombinált párhuzamosság: Telephelyen belüli és paraméter vizsgálat Internet

Kombinált párhuzamosság: Worlkflow parameter vizsgalat Internet

A Grid Computing három hulláma A kutatási hullám Az ipari hullám A vásárlói hullám Technológia, Prototípus Griden futó termékek Commodity Virtuális Organizációk Vállalati megoldások IT közmű Standardok Együttműködési képesség Integráció GGF, IETF, OASIS GGF, EGA, IETF, OASIS Jogi, politikai szervezetek “Grid lehetőségek tudatosítása” “Könnyű elérés” “Grid Service Provider” Itt tartunk

A tanfolyam célja ● Bemutatni azokat a grid infrastruktúrákat, amiket a magyar kutatók elérhetnek ● Megmutatni, hogy ezeket hogyan kell használni: ● Grid tanusítványok beszerzése ● Alkalmazások fejlesztés a gridre ● Futtatás a gridben ● Mind elvi, mind gyakorlati képzés lesz

Mit tegyünk a tanfolyam után ● Ha tényleg akarjuk használni a gridet, akkor forduljunk a SZTAKI GASuC szolgáltatásához ● GASuC (Grid Application Support Centre): ● Segit az alkalmazás gridesítésében ● Segít a kezdeti nehézségeket áthídalni az új grid felhasználók számára ●

Konkluzió Általános Grid modell jó, de megvalósítani bonyolult Kutatási témák TDK, diplomamunka, PhD téma Témavezetést vállalunk minden szinten Gyakorlatban Szolgáltatás Gridek és Desktop Gridek Léteznek működő Grid infrastruktúrák hazánkban: ClusterGrid: PVM programok számára HunGrid: workflow és paraméter vizsgálat SZTAKI DG: Mester-szolga alkalmazásokra Elérhetők európai grid infrastruktúrák is: SEEGRID, VOCE, GILDA Mindezek a P-GRADE portál interfészen keresztül transzparensen használhatók Bárki regisztrálhat, mint erőforrás felajánló, vagy mint alkalmazó Bármely magyar kutató ingyenesen igénybe veheti a GASuC szolgáltatást

Köszönöm a figyelmet ? További információ: