DevOps Fortgeschritten
SRE — Four Golden Signals in der Praxis¶
SREGolden SignalsMonitoringObservability 5 min Lesezeit
Implementierung der Four Golden Signals: Latency, Traffic, Errors, Saturation mit PromQL-Abfragen und Alerting.
Vier Goldene Signale¶
- Latency — Verarbeitungszeit eines Requests
- Traffic — Volumen der Requests (RPS)
- Errors — Prozentsatz fehlgeschlagener Requests
- Saturation — wie ausgelastet das System ist (CPU, RAM, Disk, Connections)
PromQL-Implementierung¶
# Latency (p99)
histogram_quantile(0.99, sum by (le) (
rate(http_request_duration_seconds_bucket[5m])))
# Traffic
sum(rate(http_requests_total[5m]))
# Errors
sum(rate(http_requests_total{status=~"5.."}[5m]))
/ sum(rate(http_requests_total[5m])) * 100
# Saturation
1 - avg(rate(node_cpu_seconds_total{mode="idle"}[5m]))
Alerting Rules¶
groups:
- name: golden-signals
rules:
- alert: HighLatency
expr: histogram_quantile(0.99, sum by (le) (rate(http_request_duration_seconds_bucket[5m]))) > 1
for: 5m
labels:
severity: warning
- alert: HighErrorRate
expr: sum(rate(http_requests_total{status=~"5.."}[5m])) / sum(rate(http_requests_total[5m])) > 0.01
for: 2m
labels:
severity: critical
- alert: HighSaturation
expr: 1 - avg(rate(node_cpu_seconds_total{mode="idle"}[5m])) > 0.85
for: 10m
labels:
severity: warning
Zusammenfassung¶
Die Four Golden Signals sind das einfachste Framework für Service-Monitoring. Sie decken 90% der Anforderungen mit einem Minimum an Metriken ab.
Brauchen Sie Hilfe bei der Implementierung?¶
Unser Team hat Erfahrung mit dem Entwurf und der Implementierung moderner Architekturen. Wir helfen Ihnen gerne.