Incident Investigation module in Zabbix

Zabbix biedt de mogelijkheid om extra modules toe te voegen (of zelfs te ontwikkelen). Een van deze modules is de Incident Investigation-module van Monzphere, die gratis te gebruiken is!

Met deze module kan je inzicht krijgen in wanneer en hoe incidenten zich voordoen. De module genereert heatmaps (op welke dagen en tijdstippen komt een probleem het meest voor), biedt maandelijkse vergelijkingen en trends, bepaalt de impact op uw services (SLA) en maakt gebruik van de geplande onderhoudsperioden (maintenance periods).

Soms weet je al dat een probleem vaker voorkomt dan je zou willen. Je wil dan gedurende de gehele monitoringperiode de relevante statistieken kunnen inzien en duidelijk krijgen wanneer het probleem zich het meest voordoet.

Wanneer je deze module installeert en activeert, krijgt je een extra vergrootglas toegevoegd aan de probleemomschrijving. Klik op dit vergrootglas en je krijgt precies het overzicht dat je nodig hebt om te bepalen op welke tijdstippen het probleem zich het vaakst voordoet.

Naar mijn mening is dit een geweldige toevoeging is aan Zabbix (7.0.x) installaties om problemen in beeld te krijgen voordat ze een grote storing veroorzaken!

Installatie met enkele screenshots

Laten we eerst eens kijken hoe een lijst met recente problemen er uitziet zonder deze module geactiveerd:

Problems overzicht

Het installatieproces is vrij eenvoudig (en wordt ook uitgelegd in de eerder genoemde GitHub-repository). Kloon de GitHub-repository en kopieer de genoemde map naar /usr/share/zabbix/modules/ op jouw Zabbix-frontendserver (dit kan een andere server/VM/container zijn dan de Zabbix-server!).

1cp -r IncidentInvestigation /usr/share/zabbix/modules

Ga als Super Admin naar Beheer -> Algemeen -> Modules en scan de map opnieuw.

Problems overzicht

Zodra dit is gedaan, ziet je dat de Incident Investigation-module is toegevoegd, maar nog steeds is uitgeschakeld. Klik gewoon op ‘Enable’ en de module is klaar voor gebruik.

Module die aangezet kan worden

Ga vervolgens naar de ‘Problems’ pagina en je ziet de extra vergrootglasfunctie die is toegevoegd aan de probleemomschrijving:

Problems overzicht met Incident Investigation

Gebruik van het vergrootglas (Incident Investigation)

Omdat dit werkt voor metrics die je al hebt verzameld, biedt Incident Investigation direct alle functionaliteit, zelfs als je het maanden of jaren na de start van de monitoring met Zabbix hebt geïnstalleerd!

Voor dit voorbeeld open ik het probleem dat is gemeld door een Windows-agent:

Problem geopend mbv Incident Investigation

Hier is direct te zien op welk tijdstip van de dag (sinds de start van de monitoring van deze host) de problemen het vaakst zijn gemeld (tussen 14:00 en 15:00 uur op een dinsdag). We zien ook dat dit probleem ’s nachts is gemeld (op woensdag en donderdag), maar dit was tijdens een maintenance periode, te herkennen aan het steeksleutel-symbool.

Door naar beneden te scrollen, zie je meer informatie over dit specifieke probleem.

Meer informatie over het probleem

En natuurlijk kan je ook op verschillende items klikken voor meer informatie. Het is ook mogelijk om (in dit voorbeeld) op het rood gemarkeerde nummer 3 te klikken en te zien wanneer de problemen zich voordeden (hier wordt de weergave beperkt tot februari).

Wanneer waren de meeste problemen

Conclusie

De toevoeging van deze module geeft je met een paar klikken meer inzicht in problemen en wanneer deze zich voordoen. Dit helpt je bij het oplossen en zelfs voorkomen van problemen voordat ze tot een grote verstoring leiden!

Zabbix training

Wil je nog meer de diepte in met Zabbix, meld je dan aan voor een van onze Zabbix trainingen.

Gerelateerde posts