DevOps Fortgeschritten
Observability-Strategie — Metriken, Logs, Traces¶
ObservabilityMonitoringStrategySRE 5 min Lesezeit
Observability-Strategie für moderne Systeme. Drei Säulen, Korrelation, Tools und Implementierungsplan.
Drei Säulen¶
- Metriken — numerische Werte über die Zeit (Prometheus). Schnell, günstig, aggregiert.
- Logs — Textaufzeichnungen von Ereignissen (Loki, ELK). Detaillierter Kontext.
- Traces — der Weg eines Requests durch das System (Tempo, Jaeger). Cross-Service-Debugging.
Keine Säule allein reicht aus. Die Stärke liegt in der Korrelation.
Korrelation¶
Verbinden Sie die drei Säulen über gemeinsame Identifikatoren:
# In Grafana: Exemplars verknüpfen Metrik → Trace
# In Loki: trace_id-Label verknüpft Log → Trace
# In Tempo: service.name verknüpft Trace → Metriken
# Beispiel: strukturierter Log mit trace_id
{"level":"error","msg":"payment failed",
"trace_id":"abc123","span_id":"def456",
"service":"order-service","user_id":"u789"}
# LogQL → Tempo
{app="order-service"} | json | trace_id != ""
| line_format "{{.trace_id}}"
Implementierungsplan¶
- Phase 1: Metriken + Alerting (Prometheus + Alertmanager)
- Phase 2: Zentralisierte Logs (Loki + Promtail)
- Phase 3: Distributed Tracing (OTel + Tempo)
- Phase 4: Korrelation und Dashboards (Grafana)
- Phase 5: SLO/SLI + Error Budgets
Zusammenfassung¶
Implementieren Sie Ihre Observability-Strategie iterativ: zuerst Metriken, dann Logs, dann Traces. Die Korrelation zwischen den Säulen ist entscheidend für schnelles Debugging.
Brauchen Sie Hilfe bei der Implementierung?¶
Unser Team hat Erfahrung mit dem Entwurf und der Implementierung moderner Architekturen. Wir helfen Ihnen gerne.