Cloud Fortgeschritten
Prometheus Alerting Rules¶
PrometheusAlertingSRE 3 Min. Lesezeit
Alert-Konfiguration in Prometheus. PrometheusRule, Alertmanager-Routing und Best Practices.
Alert-Regeln¶
apiVersion: monitoring.coreos.com/v1
kind: PrometheusRule
metadata:
name: app-alerts
spec:
groups:
- name: app.rules
rules:
- alert: HighErrorRate
expr: rate(http_requests_total{status=~"5.."}[5m]) / rate(http_requests_total[5m]) > 0.05
for: 5m
labels: {severity: critical}
annotations:
summary: "High error rate ({{ $value | humanizePercentage }})"
- alert: PodCrashLooping
expr: rate(kube_pod_container_status_restarts_total[15m]) > 0
for: 5m
labels: {severity: warning}
Alertmanager-Routing¶
route:
receiver: default
routes:
- match: {severity: critical}
receiver: pagerduty
- match: {severity: warning}
receiver: slack
receivers:
- name: slack
slack_configs:
- channel: '#alerts'
Zusammenfassung¶
Alerting auf Symptome (Fehlerrate, Latenz), nicht auf Ursachen (CPU). Setzen Sie korrekte Severity und Routing.
Brauchen Sie Hilfe bei der Implementierung?¶
Unser Team hat Erfahrung mit dem Entwurf und der Implementierung moderner Architekturen. Wir helfen Ihnen gerne.