PVM programok írása
Hasznos információk
PVM - Parallel Virtual Machine Szoftver rendszer, mellyel hálózatba kapcsolt számítógépeket egyetlen nagy párhuzamos számítógépként lehet látni és kezelni. Kezdet: Oak Ridge National Laboratory A párhuzamos programok írásának egyik szabványává vált. A publikus változata ingyen elérhető. Sok hardver gyártó biztosítja a saját gépére optimalizált, gyorsabb változatát is.
Felépítése A rendszerben vannak programok, amelyek a felhasználó által írt párhuzamos program futtatását biztosítják. –PVM démon –PVM konzol Vannak C, illetve Fortran77 könyvtárak a párhuzamos programok megírásához.
Használata PVM rendszerbe kapcsolhatunk több - akár különböző típusú - számítógépet. A rendszer a rajta futó programok szempontjából ezek után egy nagy, elosztott memóriájú virtuális számítógépnek látszik. Különböző processzorokon, különböző programokat indíthatunk el. A szinkronizációt és a kommunikációt a PVM könyvtári függvényekkel oldhatjuk meg.
A párhuzamos programok Taszkokból (folyamatokból) épülnek fel Taszk = UNIX/Windows/… program A taszkok a pvm könyvtárat használják –C, C++, Fortran77 A kommunikáció a pvm démonon keresztül történik
Működés Számítógépek hálózatba szervezve A felhasználó jogosult bármelyik gépre bejelentkezni Minden gépen futtat egy pvm démont És futtatja a taszkokat, melyek a démonokon keresztül lépnek egymással kapcsolatba –Egy gépen több taszk is futhat
Hálózat Programozási nyelvek labor (00-803) nyl01.nylab.inf.elte.hu nyl02.nylab.inf.elte.hu … nyl40.nylab.inf.elte.hu …
Hálózat ATLASZ Egyetemi gépre belépve → ATLASZ.ELTE.HU blade01... blade14
Saját gép Viszonylag egyszerűen hazavihető és feltelepíthető Linux – triviális(pvm, pvm-dev), Windows picit macerásabb Fejlesztéshez ez is jó Egy (több) processzoron/gépen fut minden taszk Teszteléshez nem elég! –A tesztelés egy része itt is végezhető
Az első program „hello” alkalmazás Két taszk: hello és hello_other Két különálló C program, külön-külön lefordítva A főprogram a hello Elindítja a hello_other-t a PVM-en keresztül
hello.c #include #include "pvm3.h" int main() { int tid; int num; printf("i'm t%x\n", pvm_mytid()); pvm_spawn( "hello_other", (char**)0, 0, "", 1, &tid); pvm_recv(-1, -1); pvm_upkint(&num,1,1); printf("from t%x: %d\n", tid, num); pvm_exit(); return 0; }
hello_other.c #include "pvm3.h" int main() { int tid = pvm_mytid(); int ptid = pvm_parent(); pvm_initsend(PvmDataDefault); pvm_pkint(&tid,1,1); pvm_send(ptid, 1); pvm_exit(); return 0; }
Futtatás pvm pvm> spawn -> hello spawn -> hello [1] 1 successful t40002 pvm> [1:t40002] i'm t40002 [1:t40002] from t40003: [1:t40003] EOF [1:t40002] EOF [1] finished pvm>
Újabb host felvétele a virtuális gépbe pvm> add blade01 add nyl14 1 successful HOST DTID blade pvm> conf conf 2 hosts, 1 data format HOST DTID ARCH SPEED DSIG atlasz LINUX64 1 0x00408c41 blade LINUX x00408c41
Újabb futtatás 2 hosts, 1 data format HOST DTID ARCH SPEED DSIG atlasz LINUX64 1 0x00408c41 blade LINUX x00408c41 pvm> spawn -> hello spawn -> hello [1] 1 successful t80001 pvm> [1:t40002] EOF [1:t80001] i'm t40001 [1:t80001] from t80002: [1:t80001] EOF [1] finished
hello.c #include #include "pvm3.h" int main() { int cc, tid; char buf[100]; printf("i'm t%x\n", pvm_mytid()); cc = pvm_spawn( "hello_other", (char**)0, 0, "", 1, &tid); if (cc == 1) { cc = pvm_recv(-1, -1); pvm_bufinfo(cc, (int*)0, (int*)0, &tid); pvm_upkstr(buf); printf("from t%x: %s\n", tid, buf); } else printf("can't start hello_other\n"); pvm_exit(); exit(0); }
hello_other.c #include "pvm3.h" int main(){ int ptid; char buf[100]; pvm_mytid(); ptid = pvm_parent(); strcpy(buf, "hello, world from other"); pvm_initsend(PvmDataDefault); pvm_pkstr(buf); pvm_send(ptid, 1); pvm_exit(); exit(0); }
Makefile.aimk # A lefordítandó programok nevei (szóközzel elválasztott felsorolás) BINS= hello hello_other
Egyszer kell megcsinálni: ssh ssh atlasz.elte.hu mkdir pvm3 mkdir pvm3/bin mkdir pvm3/bin/LINUX64
Utána mindig ezt kell csinálni cd pvm3/src/hello ls Makefile.aimk hello.c hello_other.c aimk making in LINUX/ for LINUX cc -I/usr/lib/pvm3/include -Ddebug -o hello../hello.c -L/usr/lib/pvm3/lib/LINUX -lpvm3 cc -I/usr/lib/pvm3/include -Ddebug -o hello_other../hello_other.c - L/usr/lib/pvm3/lib/LINUX -lpvm3
Utána mindig ezt kell csinálni (2): ls LINUX Makefile.aimk hello.c hello_other.c ls LINUX hello hello_other aimk links making in LINUX/ for LINUX cd /h/teacher/kto/pvm3/bin/LINUX ln -s /h/teacher/kto/pvm3/src/hello/LINUX/hello hello ln -s /h/teacher/kto/pvm3/src/hello/LINUX/hello_other hello_other ls ~/pvm3/bin/LINUX/ hello hello_other pvm pvm> spawn -> hello
PVM indítása Legegyszerűbb, ha belépünk a PVM-konzol programba, és onnan futtatunk. Ez automatikusan elindítja a virtuális gépet is, azaz a PVM démont. Kilépés és a virtuális gép leállítása: halt pvm> halt halt Terminated ~$
PVM démon A virtuális gép (démon) független a konzoltól, anélkül is elindítható Könnyű megfelejtkezni róla, és akkor csak eszi az erőforrásokat Még nagyobb a baj, ha bent ragad a programunk (pl. mert elszállt) Legközelebb el sem indul a pvm démon, leáll hibával
Bentragadt PVM program Figyeljük, hogy minden taszkunk rendesen leállt-e Ha nem, lőjük ki a bent ragadtakat Ha a pvm démont nem tudjuk leállítani, lőjük ki azt is Töröljük le a /tmp/pvm. /sock fájlt ls /tmp/pvm.11700/ log sock id uid=11700(kto) gid=10713(aszt) groups=10713(aszt)
Bentragadt PVM program Figyeljük, hogy minden taszkunk rendesen leállt-e Ha nem, lőjük ki a bent ragadtakat Ha a pvm démont nem tudjuk leállítani, lőjük ki azt is Töröljük le a /tmp/pvm.11700/sock fájlt ~$ ls /tmp/pvmd ~$ id uid=11700(tothmelinda) gid=100(users) groups=100(users),8291(pvm) ~$
Ideiglenes kilépés a konzolból A quit paranccsal: a démon, azaz a virtuális gép fut tovább pvm> quit quit Console: exit handler called pvmd still running.
Ilyenkor leállítás Visszalépni/belépni a konzolba és onnan halt paranccsal ki. pvm pvmd already running. pvm> halt halt Terminated
~/pvm3/proba/hello$ cd LINUX/ ~/pvm3/proba/hello/LINUX$ ls hello hello_other ~/pvm3/proba/hello/LINUX$ pvm pvm> quit quit Console: exit handler called pvmd still running. ~/pvm3/proba/hello/LINUX$./hello i'm t40002 from t40003: ~/pvm3/proba/hello/LINUX$ ~/pvm3/proba/hello/LINUX$ pvm pvmd already running. pvm> halt halt Terminated ~/pvm3/proba/hello/LINUX$
Legfontosabb PVM függvények pvm_mytid() pvm_parent() pvm_spawn() pvm_exit() pvm_initsend() pvm_pk*() pvm_send() pvm_upk*() pvm_recv()
Üzenetküldés initsend, pk*, send –pkint, pkdouble… Egy üzenetben sok adat is elküldhető –Több pk* hívás lehetséges –Egy pk hívással egy sorozat adatot lehet becsomagolni az üzenetbe (tömb, mátrix egy oszlopa) Tipikus hiba: egy üzenetet szétdarabolsz
Üzenet fejléce Minden üzenet tartalmaz az adatok mellett egy fejlécet is Üzenettípusok definiálása pvm_send( címzett, fejléc ); A fogadásnál kereshetsz az üzenetsorban a küldő és a fejléc alapján
Üzenetfogadás Üzenetsor (postaláda) Minden folyamatnak van egy üzenetsora pvm_recv( küldő, fejléc ); A -1 azt jelenti, hogy „bármi” pvm_recv( -1,-1 );
Az üzenetfogadás fajtái „Szinkron” –pvm_recv –a fogadó folyamat blokkolódik az üzenet megérkezéséig „Aszinkron” –pvm_nrecv –non-blocking receive –ha van üzenet, beolvassuk, egyébként skip
Multicast Ha ugyanazt az üzenetet több folyamatnak is el szeretnénk küldeni pvm_mcast
Hasznos parancsok a PVM konzolban spawnprogram indítása addprocesszorok megfogása confmegfogott processzorok psfutó folyamatok haltleállítás quitideiglenes kilépés
add, conf (1) ~$ pvm pvm> conf conf 1 host, 1 data format HOST DTID ARCH SPEED DSIG Atlasz LINUX64 1 0x00408c41 pvm>
add, conf (2) pvm> add blade02 add blade02 1 successful HOST DTID blade pvm> conf conf 2 hosts, 1 data format HOST DTID ARCH SPEED DSIG atlasz LINUX64 1 0x00408c41 blade LINUX x00408c41 pvm>
add, conf (3) pvm> add blade03 blade04 blade05 add blade03 blade04 blade05 3 successful HOST DTID blade03 c0000 blade blade pvm>
add, conf (4) pvm> add blade16 add blade16 0 successful HOST DTID blade16 No such host pvm>
hosts Készíthetsz egy fájlt, amiben felsorolod azokat a gépeket, amelyeket meg akarsz fogni Ezt a fájlt a konzol indításakor kell átadni paraméterként Nem kell add-dal fogdosni össze a processzorokat
hosts példa :~$ cat hosts blade01 … blade14 :~$ pvm hosts pvm> conf conf 15 hosts, 1 data format HOST DTID ARCH SPEED DSIG atlasz LINUX x00408c41 blade LINUX x00408c41... blade14 1c0000 LINUX x00408c41
A beadandó programokról... Sok gépen futtatva kell bemutatni Sok gépen végzett tesztelést kell dokumentálni A tesztelésnek az algoritmus műveletigényéről kell szólnia –pl. “n adat n processzoron O(log n) időben” Géptermi zárthelyi!!!