Monitoring: Gestoppte Container automatisch aus Silence-Check ausblenden #31

Closed
opened 2026-03-11 15:16:29 +00:00 by orbitalo · 1 comment
Owner

Problem

Wenn ein Container absichtlich gestoppt wird, meldet der Hausmeister-Bot trotzdem "Keine Logs seit 35+ Min" — weil der Silence-Check nicht weiß ob der Container läuft oder gestoppt ist.

Aktueller Workaround

Manueller Eintrag in SILENCE_IGNORED_HOSTS in monitor.py.

Gewünschtes Verhalten

Vor dem Silence-Alert automatisch prüfen ob der Host zu einem gestoppten Container gehört. Wenn ja → kein Alert.

Implementierung

  • In check_all(): Proxmox-Container-Liste laden
  • Mapping aufbauen: Container-Name → Status (running/stopped)
  • Loki-Host-Label mit Container-Namen abgleichen
  • Nur Alert wenn Container running aber trotzdem keine Logs
  • SILENCE_IGNORED_HOSTS bleibt als Fallback für Hosts ohne Proxmox-Mapping (z.B. ct-600-webcam)
## Problem Wenn ein Container absichtlich gestoppt wird, meldet der Hausmeister-Bot trotzdem "Keine Logs seit 35+ Min" — weil der Silence-Check nicht weiß ob der Container läuft oder gestoppt ist. ## Aktueller Workaround Manueller Eintrag in `SILENCE_IGNORED_HOSTS` in `monitor.py`. ## Gewünschtes Verhalten Vor dem Silence-Alert automatisch prüfen ob der Host zu einem gestoppten Container gehört. Wenn ja → kein Alert. ## Implementierung - In `check_all()`: Proxmox-Container-Liste laden - Mapping aufbauen: Container-Name → Status (running/stopped) - Loki-Host-Label mit Container-Namen abgleichen - Nur Alert wenn Container running aber trotzdem keine Logs - `SILENCE_IGNORED_HOSTS` bleibt als Fallback für Hosts ohne Proxmox-Mapping (z.B. ct-600-webcam)
Author
Owner

Implementiert in Commit 43ee006f:

  • monitor.py: Silence-Check baut jetzt ein running_names-Set aus dem Proxmox-Container-Status (der ohnehin schon in check_all() geladen wird)
  • Nur Hosts die in Proxmox als running gelistet sind, können einen Silence-Alert auslösen
  • Gestoppte Container, nicht erreichbare Hosts und Loki-only-Hosts werden automatisch ignoriert
  • SILENCE_IGNORED_HOSTS bleibt als manueller Override für laufende Container die strukturell keine Loki-Logs senden
Implementiert in Commit `43ee006f`: - `monitor.py`: Silence-Check baut jetzt ein `running_names`-Set aus dem Proxmox-Container-Status (der ohnehin schon in `check_all()` geladen wird) - Nur Hosts die in Proxmox als `running` gelistet sind, können einen Silence-Alert auslösen - Gestoppte Container, nicht erreichbare Hosts und Loki-only-Hosts werden automatisch ignoriert - `SILENCE_IGNORED_HOSTS` bleibt als manueller Override für laufende Container die strukturell keine Loki-Logs senden
Sign in to join this conversation.
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference: orbitalo/homelab-brain#31
No description provided.