Monitoring: Fehler-Schwelle X Errors/30 Min → Alert #30
Labels
No labels
flugscanner
fuenfvoracht
infrastruktur
jarvis
ki-tower
nice-to-have
prio-1
wartung
wordpress
No milestone
No project
No assignees
1 participant
Notifications
Due date
No due date set.
Dependencies
No dependencies set.
Reference: orbitalo/homelab-brain#30
Loading…
Add table
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Feature: Error-Rate-Alert
Wenn ein Host mehr als X Fehler-Zeilen innerhalb von 30 Minuten produziert → sofortiger Hausmeister-Alert.
Implementierung
loki_client.py: neue Funktioncheck_error_rate(threshold=20, minutes=30)count_over_time({host="X"} |~ "(?i)error" [30m])abfragenmonitor.py: incheck_all()aufrufenWarum nötig
Bei der WordPress 401-Welle (März 2026) produzierte der RSS-Manager >50 Fehler in 30 Minuten, ohne dass ein Alert ausgelöst wurde, weil der panic/fatal-Filter die HTTP-Fehler nicht erfasste.
Schwellenwert-Vorschlag
Implementiert in Commit
43ee006f:core/loki_client.py: Neue Funktioncheck_error_rate(minutes=30)mit host-spezifischen Schwellen (rss-manager: 15, wordpress-v2: 10, default: 25)monitor.py: Error-Rate-Check incheck_all()eingebaut, neue Cooldown-Kategorieerror_rate(1800s)telegram_bot.py: Periodischer Monitor-Loop alle 10 Min (statt nur manuell per/check)Nutzt Loki
count_over_timeinstant query pro Host — effizient und zuverlässig.