Makkelijke Metrics op RHEL10

In het verleden hebben we op dit kanaal al vaker gekeken naar het configureren van metrics, voornamelijk op Kubernetes platformen. In die gevallen was het vaak een eenvoudige setup met behulp van bijvoorbeeld een Operator, waardoor je met een paar klikken klaar was.

Nu is het tegenwoordig bijna net zo makkelijk om goede, robuuste, metrics te verzamelen van je “klassieke” systemen. De RHEL System Roles Ansible collection heeft een een role genaamd metrics die gebruikt kan worden om Performance Co-Pilot (PCP) te configureren om metrics te verzamelen, maar ook om een Valkey (of Redis op oudere systemen) te configureren om metrics van meerdere hosts te verzamelen, en een Grafana (inclusief dashboards en datasources) op te zetten.

Grafana Dashboards voor OpenShift User Workload Monitoring

Als je op OpenShift User Workload Monitoring hebt aangezet kunnen ontwikkelaars wel custom metrics laten ophalen en opslaan, en ze uitvragen via de OpenShift Web Console, maar complexere dashboards zijn (nog) niet in de console mogelijk.

Gelukkig is het wel mogelijk om via de community Grafana Operator deze metrics ook uit te vragen, en via dashboards inzichtelijk te maken. Wel loop je dan tegen het probleem aan dat als je dit via de reguliere instantie van Thanos Querier wilt doen het een alles-of-niks spel wordt: Of je hebt geen toegang tot metrics, of je mag bij alle metrics van het cluster en alle applicaties.

Ook dat laatste probleem kan opgelost, door de speciale tenancy poort van Thanos Querier te gebruiken, waarbij je per query metrics voor één namespace tegelijk mag opvragen, mits je rechten hebt op die namespace.