1 Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Rendszermonitorozás Tóth Dániel, Kocsis Imre Intelligens.

Slides:



Advertisements
Hasonló előadás
A számítógépes hálózatok és az Internet
Advertisements

4. alkalom – Hálózat Kezelés
„Esélyteremtés és értékalakulás” Konferencia Megyeháza Kaposvár, 2009
PPKE ITK 2009/10 tanév 8. félév (tavaszi) Távközlő rendszerek forgalmi elemzése Tájékoztatás
Aruba Instant vállalati vezeték nélküli megoldások
Készítette: Bátori Béla 12.k
Önkormányzati informatika ASP alapokon
Erőállóképesség mérése Találjanak teszteket az irodalomban
HÁLÓZATOK.
1 Informatikai Szakképzési Portál Hálózati és Internet ismeretek Hálózati menedzsment.
1 Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Infrastruktúra alapelemek Szatmári Zoltán Intelligens.
Hálózati architektúrák
Hatékonyságnövelés IT biztonsági megoldásokkal Szincsák Tamás IT tanácsadó 2012.Október 17.
Jogában áll belépni?! Détári Gábor, rendszermérnök.
Elektromos mennyiségek mérése
Mérés és adatgyűjtés laboratóriumi gyakorlat Virtuális méréstechnika levelező Mingesz Róbert 5. Óra MA-DAQ – Műszer vezérlése November 26.
ZigBee alapú adatgyűjtő hálózat tervezése
1 Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Rendszermonitorozás Tóth Dániel, Kocsis Imre Intelligens.
1 Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Rendszermonitorozás Tóth Dániel, Kocsis Imre Intelligens.
Utófeszített vasbeton lemez statikai számítása Részletes számítás
A tételek eljuttatása az iskolákba
Mérés és adatgyűjtés Kincses Zoltán, Mingesz Róbert, Vadai Gergely 10. Óra MA-DAQ – Műszer vezérlése November 12., 15. v
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Virtuális méréstechnika MA-DAQ műszer vezérlése 1 Mingesz Róbert V
Ember László XUBUNTU Linux (ami majdnem UBUNTU) Ötödik nekifutás 192 MB RAM és 3 GB HDD erőforrásokkal.
VÁLOGATÁS ISKOLÁNK ÉLETÉBŐL KÉPEKBEN.
1. IS2PRI2 02/96 B.Könyv SIKER A KÖNYVELÉSHEZ. 2. IS2PRI2 02/96 Mi a B.Könyv KönyvelésMérlegEredményAdóAnalitikaForintDevizaKönyvelésMérlegEredményAdóAnalitikaForintDeviza.
Távközlő hálózatok tervezése szeptember Forgalmi méretezés alapelvei Takács György 2. Előadás.
DRAGON BALL GT dbzgtlink féle változat! Illesztett, ráégetett, sárga felirattal! Japan és Angol Navigáláshoz használd a bal oldali léptető elemeket ! Verzio.
A közép- és emelt szintű vizsga tanári értékelése
Hálózatkezelési újdonságok Windows 7 / R2
Miért felügyeljük az ügyfélkörnyezetet? Tervezési segédlet Ügynök nélküli felügyelet A fontos ügyfelekről Riportok, trendek és amit ezekből tanulhatunk.
Anyagadatbank c. tárgy gyakorlat Féléves tematika Adatbázis alapfogalmak, rendszerek Adatmodellek, adatbázis tervezés Adatbázis műveletek.
szakmérnök hallgatók számára
Logikai szita Izsó Tímea 9.B.
Beágyazott internet az alállomási irányítástechnikában Hogyan kerül irodai megoldás az ipari irányítástechnikába? Ez egészen biztosan nagyon veszélyes!
Központosított rendszerfelügyelet System Center Essentials 2007 Micskei Zoltán.
1 Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Modellezés gyakorlat Micskei Zoltán
2007. május 22. Debrecen Digitalizálás és elektronikus hozzáférés 1 DEA: a Debreceni Egyetem elektronikus Archívuma Karácsony Gyöngyi DE Egyetemi és Nemzeti.
Topológia felderítés hibrid hálózatokban
Bemutatkozás Név: Vespi Gábor Kelt: december 27.
A klinikai transzfúziós tevékenység Ápolás szakmai ellenőrzése
2006. május 15P2P hálózatok 1 Fóliák a vizsgára: 1. előadás  Bevezető: 11-16, 21,  Usenet: előadás:  Bevezető: 3-8  Napster: 
2006. Peer-to-Peer (P2P) hálózatok Távközlési és Médiainformatikai Tanszék.
Web Architecture. Development of Computing Architectures Monolithic mainframe programming Client Server Real Client Server Web Programming.
Nagy teherbírású rendszerüzemeltetés a felhőben. Miről lesz szó? Cloud áttekintő Terheléstípusok és kezelésük CDN Loadbalancing Nézzük a gyakorlatban.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Szondázás alapú diagnosztika 1. Autonóm és hibatűrő információs.
Alapozó eszközök Eseménynapló Eseményszámba megy… Analytic and Debug Logs Custom Views / Cross-log queries Event Forwarding > Subscriptions Feladatütemező.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Alkalmazás és megjelenítés virtualizáció Micskei Zoltán.
Magas rendelkezésre állású Hyper-V rendszer építése
1. Melyik jármű haladhat tovább elsőként az ábrán látható forgalmi helyzetben? a) A "V" jelű villamos. b) Az "M" jelű munkagép. c) Az "R" jelű rendőrségi.
Virtuális Méréstechnika Sub-VI és grafikonok 1 Makan Gergely, Vadai Gergely v
Mérés és adatgyűjtés laboratóriumi gyakorlat - levelező Sub-VI és grafikonok 1 Mingesz Róbert V
A teljes infrastruktúra egységesített felügyelete és védelme.
Automatizálási folyamatok az SQL 2012-ben
OKOSTELEFON KÖZÉPRÉTEG, VALÓS IDEJŰ TELJESEN ELOSZTOTT ADATFELDOLGOZÁS
Felhő PC demonstráció Gergely Márk MTA SZTAKI Laboratory of Parallel and Distributed Systems
Kapcsolatok ellenőrzése
> aspnet_regiis -i 8 9 TIPP: Az „Alap” telepítés gyors, nem kérdez, de később korlátozhat.
Számítógép hálózatok.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Korlátkielégítési problémák Autonóm és hibatűrő információs.
1 Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék P2P protokollok és autonóm számítástechnika: szemelvények.
A KÖVETKEZŐKBEN SZÁMOZOTT KÉRDÉSEKET VAGY KÉPEKET LÁT SZÁMOZOTT KÉPLETEKKEL. ÍRJA A SZÁMOZOTT KÉRDÉSRE ADOTT VÁLASZT, VAGY A SZÁMOZOTT KÉPLET NEVÉT A VÁLASZÍV.
1 Az igazság ideát van? Montskó Éva, mtv. 2 Célcsoport Az alábbi célcsoportokra vonatkozóan mutatjuk be az adatokat: 4-12 évesek,1.
Iskolai számítógépes hálózat bővítése Készítette Tóth László Ferenc.
2. Operációs rendszerek.
Infrastruktúra alapelemek
1 Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Rendszermonitorozás Tóth Dániel, Kocsis Imre Intelligens.
1 Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Rendszermonitorozás Tóth Dániel, Kocsis Imre, Salánki.
Hálózati rendszerek adminisztrációja JunOS OS alapokon
Előadás másolata:

1 Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Rendszermonitorozás Tóth Dániel, Kocsis Imre Intelligens rendszerfelügyelet (VIMIA370)

2 „When you can measure what you are speaking about, and express it in numbers, you know something about it; but when you cannot measure it, when you cannot express it in numbers, your knowledge of it is of a meager and unsatisfactory kind” Lord Kelvin

3 „Kézbentartott” rendszer rome vegas Külső web sicily DHCP, AD Server chicago Belső web don DHCP

4 „Kézbentartott” rendszer rome vegas Külső web sicily DHCP, AD Server chicago Belső web don DHCP

5 Megnézem… Káosz Nem megy „Az Internetem”! No de mégis mi a probléma? Hát a böngészőben nem látom a weboldalunkat…

6 Káosz ? ? ? ? Na vajon mi nem működik? ?

7 Húú, hát itt sok mindennel baj van… Káosz   Na vajon mi nem működik?       ! !

8 Alapfogalmak (ITIL) „Monitoring refers to the activity of observing a situation to detect changes that happen over time.” A monitorozás valamely „helyzet” megfigyelése, mely során az időbeni változásokat kívánjuk érzékelni.

9 Monitorozás jellemzői (ITIL)  Fontos CI-k és tevékenységek (cél)eszközökkel megfigyelése  Meghatározott feltételek teljesülése  riasztás  Megfelelőség ellenőrzése: o Rsz.-komponensek teljesítménye/kihasználtsága o Nem normális tevékenységek/tevékenységi szintek o Nem engedélyezett változtatások o Eljárásrendek o „Szolgáltatások” minősége o KPI-k

10 Alapfogalmak (ITIL) „Reporting refers to the analysis, production and distribution of the output of the monitoring activity.” A jelentéskészítés a monitorozás kimenetének analízisét, „eredményének” előállítását és az eredmények megfelelő terítését fedi.

11 Alapfogalmak (ITIL) „Control refers to the process of managing the utilization or behaviour of a device, system or service. […]” A vezérlés egy eszköz, rendszer vagy szolgáltatás kihasználtsága vagy viselkedése menedzselésének a folyamata.

12 Az ITIL ‚Monitor Control Loop’

13 Az ITIL ‚Monitor Control Loop’ LAMP rendszer EC2-n HTTP szintű: -Válaszidő -Áteresztőképesség -Hibaráták HTTP szintű: -Válaszidő -Áteresztőképesség -Hibaráták -CloudWatch -top, iostat, netstat, … -mysqladmin -… -CloudWatch -top, iostat, netstat, … -mysqladmin -…

14 Az ITIL ‚Monitor Control Loop’ Pl. szolgáltatás- leállítás, mentés, új DB VM -Válaszidő leromlott… -… és a DB VM „steal time”-ja túl magas -Válaszidő leromlott… -… és a DB VM „steal time”-ja túl magas

15 Monitorozás és egyéb folyamatok  Érezhető a kapcsolat egyéb folyamatokkal o Kapacitástervezés o Eseménykezelés o Konfiguráció-menedzsment o „Proaktív Probléma-Menedzsment” o …  De ezekkel itt, most nem foglalkozunk.

16 Rendszermonitorozás  A rendszer túl bonyolult o Ember nem látja át a teljes működését o Valami mindig történik benne… o Csak akkor értesülünk róla, ha a felhasználók nyaggatnak, hogy valami nem megy ($$$!) o Csak akkor vesszük észre, hogy baj van, ha már tényleg nagy baj van (jó lett volna előbb preventív jelleggel) o A rendszer teljesítményéről, kihasználtságáról nincs elképzelésünk Pedig ilyen adatok nélkül nehéz tervezni…

17 Rendszermonitorozás: állapotkép fenntartása  Infrastrukturális komponensek és szolgáltatások működőképességéről  Terhelésről, erőforrások kihasználtságáról  Topológiáról, konfigurációról o Kapcsolat a konfiguráció-menedzsmenttel!  (Elosztott) feladat-végrehajtás állapotáról  (Adat)biztonságról

18 Monitorozás típusai (ITIL)  Aktív vagy passzív o Eszköz/rendszer ismételt lekérdezése vs. generált események fogadása  Reaktív vagy proaktív o Reakció a hibák után vagy előtt o Nem mindenképp a monitorozás alá tartozik

19 Monitorozás típusai (ITIL)  Folyamatos vagy kivétel-alapú mérés o „Continuous vs. Exception-Based Measurement” o Folyamatos, valós idejű ellenőrzés vagy detektálás és jelentés „kivételes helyzetek” esetén o Aktív monitorozás: nem feltétlenül folyamatos

20 Adatgyűjtés

21 Adatgyűjtés megvalósítása  Jellegzetes követelmény: o A rendszerünk nagy, sok különálló elemből áll o Az adatokat hálózaton keresztül olvassuk le  A kulcselem az ágens o Kis beépülő komponens minden berendezésbe, aminek célja: adatszolgáltatás valamilyen (hálózati) interfészen értesítés különféle események bekövetkezéséről egyszerű beavatkozások elvégzése

22 Adatgyűjtés megvalósítása hardverben Berendezés pl.: Ethernet switch Ethernet keret kapcsoló logika Port Menedzsment processzor TCP/IP Ágens Belső (rejtett) ethernet port belső hardveres interfész (I 2 C, JTAG, PCI, GPIO) Állapotregiszterek Lásd még: IPMI, Intel vPro, IBM BladeCenter Management Module, …

23 Adatgyűjtés megvalósítása szoftverben I.  Jellemző alapesetek: o Olyan szoftver komponenst akarunk megfigyelni, ami nincs erre felkészítve Az ágens külön folyamat az operációs rendszeren Olyan hívásokat végezhet el, ami csak egy gépen futó folyamatok között lehetséges (de a belső adatszerkezetekhez többnyire nem férünk hozzá) Az operációs rendszer segítségével követi a megfigyelt folyamatot (futási állapot, létrehozott fájlok tartalma, erőforráshasználat, stb.) o Az ágens integrált része a szoftvernek

24 Adatgyűjtés megvalósítása szoftverben I. Operációs rendszer Alkalmazás vagy szerver Ágens Hálózaton nem kommunikáló komponens VAGY állapota nem kérdezhető le hálózatról Hálózaton nem kommunikáló komponens VAGY állapota nem kérdezhető le hálózatról Hálózat Lokális hozzáférést igénylő hívások Működés követése az operációs rendszer szolgáltatásai segítségével Ha fut a megfelelő PID-ű folyamat, akkor UP…

25 Adatgyűjtés megvalósítása szoftverben II.  Jellemző alapesetek: o Olyan szoftver komponenst akarunk megfigyelni, ami nincs erre felkészítve o Az ágens integrált része a szoftvernek Hozzáférünk a belső adatszerkezetekhez Közvetlenül végezhetünk függvényhívásokat Forráskód instrumentálás (mérő, adatgyűjtő hívások elhelyezése a forráskódban) lehetséges A lényeg: a belső mérési lehetőségeket kívülről is elérhetővé kell tenni

26 Hozzáférés belső adatszerkezethez Belső osztály + belső_attribútum1 + belső_attribútum2 + belső_attribútum1 + belső_attribútum2 + belső_metódus1 + belső_metódus2 + belső_metódus1 + belső_metódus2 Külső interfész + alkalmazás_metódus « implements » Belső adatszerkezet Kívülről nem elérhető Kívülről elérhető Ágens osztály + mérőszám1 + mérőszám2 + mérőszám1 + mérőszám2 + lekérdezés Ágens interfész + lekérdezés « implements »

27 Forráskód instrumentáció Belső osztály + belső_attribútum1 + belső_attribútum2 + belső_attribútum1 + belső_attribútum2 + belső_metódus1 + belső_metódus2 + belső_metódus1 + belső_metódus2 Külső interfész + alkalmazás_metódus « implements » Kivülről nem elérhető Kivülről elérhető Ágens osztály + mérőszám1 + mérőszám2 + mérőszám1 + mérőszám2 + lekérdezés + eseménykezelés + lekérdezés + eseménykezelés Ágens interfész + lekérdezés « implements » public void doBusinessMethod(IPerson payer) { IBankTransfer t = BankConnectionFactory.newTransfer(); t.setSource(payer); t.setDestination(me); t.setCurrency(Currencies.Dollar); t.setAmmount( ); try { t.execute(); } catch (Exception e) { e.printStackTrace(); // :-) } public void doBusinessMethod(IPerson payer) { IBankTransfer t = BankConnectionFactory.newTransfer(); t.setSource(payer); t.setDestination(me); t.setCurrency(Currencies.Dollar); t.setAmmount( ); try { t.execute(); } catch (Exception e) { e.printStackTrace(); // :-) } Agent.event(Events.MethodCalled); Agent.event(Events.MethodFail); Bővebben: felügyeletre tervezés előadás

28 Ágens lekérdezési interfész  Hogyan kérdezzük le az ágenstől a mért adatokat?  Jó lenne… o hálózaton keresztül o szabványos interfész, protokoll o Egységesen: gyártók, készülékek, szoftver/hardver Adatok széles skálájának támogatása o ha azt is le tudnánk kérdezni, hogy pontosan miket lehet lekérdezni az ágenstől Konfigurációmenedzsment: hasonlóság!

29 Jellegzetes alapfunkciók  Pillanatnyi értékek o Skalár mennyiség: CPU kihasználtság, RAM, tárhely telitettség, … o Diszkrét értékkészlet: Kiszolgáló-folyamat UP/DOWN/ERROR, …  Összegyűjtött mérési adatok o Skalár mennyiség (pl. kumulatív hálózati forgalom) o Napló bejegyzések  Értesítés eseményekről o Diszkrét állapotváltozás (ok  down) o Határérték túllépés (diszk telítettség >90%)

30 Ágens lekérdezési interfész  Ágens interfészek működési elv szerint o Pull – a központi adatgyűjtő kezdeményezi az ágensek lekérdezést o Push – az ágens kezdeményezi az adatok elküldését a feliratkozott adatgyűjtő központnak Ágens Adatgyűjtő

31 Szabványos protokollok SNMP RMON Netflow/IPFIX SFlow CMIP Syslog Netconf JMX CIM-XML WS-Management WSDM … …

32 „Ágens alapú” és „ágens nélküli” technológiák  Igazából nincs olyan, hogy ágens nélküli o Parancssoros belépés és értéklekérdezés: távoli hozzáférés kiszolgáló az „ágens” o Inkább: specializáltság alapján „Ágens nélküli” Dedikált ágenst igényel Telnet, SSH Soros port SNMP WMI WS-manSyslog Általános célú távoli hozzáférést használ Alapértelmezetten része a rendszernek Telepítést igénylő szabványos ágens ping Telepítést igénylő speciális ágens Munin-node Nagios Tivoli Monitoring Universal Agent WSDM

33 Szondázás  Szondázás - probing o Tipikusan „ágens nélküli”: nem „belenézni” akarunk a célrendszerbe, hanem a távolról elérhető szolgáltatását kipróbálni o A monitorozó rendszer hálózati kliens szerepben o Ilyenkor is kellhet ágens Szolgáltatás elérési pontról (Service Access Point) nézve akarunk képet kapni a szolgáltatásról  Mellékhatás: hibajelzés több elem hibájára!

34 Szondázás példa Külső web port forwarding chicago Belső web Monitorozó szerver Külső web szervere Távoli Ágens

35 Monitorozó rendszerek

36 Rendszermonitorozás részei Adatgyűjtés („folyamatos”) Pillanatnyi állapot tárolása Megjelenítés ( ( ( ) ) ) Riasztás Historikus adattárolás Beavatkozás

37 Monitorozó rendszer példa: Nagios  Nagios o Free, open source o o „Kevés” (<100) gépre javasolt o Főleg: állapot áttekintésére automatikus riasztásra  Tactical overview o Monitorozott szolgáltatások o Grafikus megjelenítés

38 Monitorozó rendszer példa: Nagios  Rendelkezésreállás és teljesítmény jelentés  Naplók és riasztások  Főleg aktív szondázás o kézi konfigurálás…  Saját ágens protokoll o Egyszerű, szöveges, bővíthető shell szkriptekkel o Támogat szabványos protokollokat is

39 Nagios: tactical overview

40 Nagios: tactical overview

41 Nagios: service detail

42 Egyéb megoldások?

43 Adatgyűjtéstől a diagnosztikáig: szondázás

44 … … Káosz Huh, sikerült helyrerakni… Túl lassú az !

45 Diagnosztika  Nem megy a webkiszolgáló. De miért nem? o Megfelelő megfigyelések kellenek  Adott hibahatás okának felderítéséhez mit figyeljünk? o Pl. egy ESX hoszt több száz valósidejű metrikát definiál magán + VM-ek metrikái o Egy operációs rendszer még bonyolultabb lehet  Hogyan következtessünk a hibaokra?

46 Diagnosztika  Hibaok-detektálás (fault detection): van-e hibahatást (failure) okozó jelenség a rendszerben  Hibaok-lokalizáció (fault localization): a hibahatást kiváltó pontos hibaokok meghatározása  Szondázás: olyan teszttranzakció, melynek kimenetele több komponens állapotától is függhet o Gondoljuk végig: VM-ben futó Apache-re wget távolról  I. Rish et al. (2005). Adaptive diagnosis in distributed systems. IEEE transactions on neural networks, 16(5),

47 Függőségek

48 (Kiterjesztett) függőségi mátrix Egyszeres hibaok- feltételezésnél a hibaaktivációs kombinációk Szonda futásának eredménye !!! Implicit tudás: -topológia-modell -Szolgáltatás-függőségi modell -(Egyszerű) hiba(terjedési) modell !!! Implicit tudás: -topológia-modell -Szolgáltatás-függőségi modell -(Egyszerű) hiba(terjedési) modell

49 Detektálás/lokalizálás  Minimális hibadetektáló szondahalmaz választása?

50 Detektálás/lokalizálás WSWS ASDBSRHWSHASHDBSNF pWS pAS pDBS pingR pingWS pingAS pingDBS

51 Detektálás/lokalizálás WSWS ASDBSRHWSHASHDBSNF pWS pAS pDBS pingR pingWS pingAS pingDBS

52 Detektálás/lokalizálás  Minimális hibadetektáló szondahalmaz választása? o Az a minimális szondahalmaz, amire minden oszlopösszeg > 0 o NP-nehéz  o == minimális halmazfedés („minimum set cover”) o De: igen jó heurisztikák

53 Detektálás/lokalizálás  Minimális hibalokalizáló szondahalmaz választása?

54 Detektálás/lokalizálás WSASDBSRHWSHASHDBSNF pWS pAS pDBS pingR pingWS pingAS pingDBS

55 Detektálás/lokalizálás WSASDBSRHWSHASHDBSNF pWS pAS pDBS pingR pingWS pingAS pingDBS

56 Detektálás/lokalizálás WSASDBSRHWSHASHDBSNF pWS pAS pDBS pingR pingWS pingAS pingDBS

57 Detektálás/lokalizálás WSASDBSRHWSHASHDBSNF pWS pAS pDBS pingR pingWS pingAS pingDBS

58 Detektálás/lokalizálás WSASDBSRHWSHASHDBSNF pWS pAS pDBS pingR pingWS pingAS pingDBS

59 Detektálás/lokalizálás WSASDBSRHWSHASHDBSNF pWS pAS pDBS pingR pingWS pingAS pingDBS

60 Detektálás/lokalizálás WSASDBSRHWSHASHDBSNF pWS pAS pDBS pingR pingWS pingAS pingDBS

61 Detektálás/lokalizálás WSASDBSRHWSHASHDBSNF pWS pAS pDBS pingR pingWS pingAS pingDBS Figyelem: ehhez kell az egyszeres hibaok feltételezés!

62 Detektálás/lokalizálás  Minimális hibalokalizáló szondahalmaz választása? o Az a minimális szondahalmaz, ahol minden hibaok-párt meg tudunk még különböztetni  páronként különböző oszlopok o NP-nehéz  o Szintén jó heurisztikák

63 Historikus adatok gyűjtése

64 Historikus adatgyűjtés  De jó lenne, ha… o Visszamenőleg látnánk, hogy mi történt o Látnánk a tendenciákat o Következtetéseket vonhatnánk le. Pl.: Mi van túlterhelve, mi nincs kihasználva (bővítés tervezése) Hogy néz ki, amikor 500 hallgató megrohanja a szervert Mennyi idő alatt sülnek meg a gépek, ha leáll a klímaberendezés (katasztrófa elhárítási terv) Nem kezdett-e el valami elfogyni/elhasználódni, amit majd cserélni, pótolni kéne? (Proaktív beavatkozás) Pl. szabad tárhely, UPS akkumulátorok, merevlemezek, nyomtató toner stb.

65 Historikus adatgyűjtés  Megoldás o Periodikusan (mondjuk percenként mintavételezve) tároljuk el a mért értékeket o Mi ezzel a baj? o Számoljunk utána: belefulladunk az adathalmazba o Biztos, hogy tudni akarjuk, hogy pontosan mi történt 1 éve 5 hónapja, 13 napja, 8 óra 13 perce? o Attól függ: Trend megállapításhoz: ilyen pontosan nem, de azért hozzávetőlegesen igen Konkrét esemény dokumentálásához: kell a nagy pontosság Van, amihez ez is kevés...

66 Historikus adatgyűjtés  Aggregáció o „Adattárházas” fogalom o Több adatot vonunk össze egyetlen értékbe (felbontás rontás, pl. átlagolással) o Mit veszítünk vele? Konkrét, rövid események lefutása Börsztösség o Mit lehet tenni ellene? külön archiválni kell az „érdekes” részeket -> eseménykorreláció Összevont MIN/MAX/AVG értéket tárolni 24 órás idősor Mintavételi periódus: 1min Összesen: 1440 érték 60 napos idősor Mintavételi periódus: 1 óra Összesen: 1440 érték 4 éves idősor (kb.) Mintavételi periódus: 1 nap Összesen: 1440 érték

67 Kitekintés: adatfelderítés és monitorozási konfiguráció tervezése

68 BigBlueButton

69 Rövid tranziens – hosszú kicsengés Exponenciális függvény – hibatárolási jelenség!

70 Erőforrásmetrikákkal korreláció Dstat metrika és QoS korrelációja: 0.94

71 Metrikák  dstat: Linux monitorozó eszköz o CPU, disk, paging, load, memory, network, processes, IO, swap,...  Unix load o „load number”: CPU-ra váró vagy azt használó folyamatok (ready queue/run queue) o 1/5/15 perces metrika: exponenciálisan súlyozott csúszóablakos átlag

72 Megfigyeléstől a menedzselésig  Nade miket mérjünk? o dstat –Tcdglmnprsy: önmagában több tucat metrika  Milyen felbontással?  Mi a diagnosztikai logika?  Mi a cél? o Post-mortem analízis? o Hibaok-megelőzés? o Detektálás adott időablakon belül? o Proaktív javítás? Inkább futásidejű, mint historikus Vizuális analízis + MI dimenzióredukció / változószelekció Vizuális analízis + MI dimenzióredukció / változószelekció Méréstechnika és méréselmélet