DevOps Experte
Chaos Engineering — Fortgeschrittene Techniken¶
Chaos EngineeringLitmusChaos MeshResilience 6 Min. Lesezeit
Fortgeschrittene Chaos-Engineering-Experimente. Litmus, Chaos Mesh, Steady-State-Hypothese und Blast Radius.
Prinzipien¶
- Steady State definieren — wie sieht normales Verhalten aus?
- Hypothese formulieren
- Fehler injizieren — kontrolliert
- Beobachten — wurde die Hypothese bestätigt/widerlegt?
- Beheben — gefundene Schwachstellen reparieren
Litmus Chaos¶
apiVersion: litmuschaos.io/v1alpha1
kind: ChaosEngine
metadata:
name: pod-kill-test
spec:
appinfo:
appns: production
applabel: app=api-server
appkind: deployment
engineState: active
experiments:
- name: pod-delete
spec:
components:
env:
- name: TOTAL_CHAOS_DURATION
value: "60"
- name: CHAOS_INTERVAL
value: "10"
probe:
- name: check-api-health
type: httpProbe
httpProbe/inputs:
url: http://api-server.production/health
method:
get:
criteria: ==
responseCode: "200"
mode: Continuous
Chaos Mesh¶
apiVersion: chaos-mesh.org/v1alpha1
kind: NetworkChaos
metadata:
name: network-delay
spec:
action: delay
mode: all
selector:
namespaces: [production]
labelSelectors:
app: order-service
delay:
latency: "200ms"
jitter: "50ms"
duration: "5m"
Experimenttypen¶
- Pod-Ausfall — Pods killen/löschen
- Netzwerk — Latenz, Paketverlust, DNS-Ausfall
- Ressourcenstress — CPU, Arbeitsspeicher, Disk I/O
- Node Drain — Pod-Eviction
- AZ-Ausfall — Simulation eines Availability-Zone-Ausfalls
Zusammenfassung¶
Chaos Engineering deckt Schwachstellen auf, bevor ein Produktionsvorfall eintritt. Beginnen Sie einfach, steigern Sie schrittweise und haben Sie stets Abbruchkriterien.
Brauchen Sie Hilfe bei der Implementierung?¶
Unser Team hat Erfahrung mit dem Entwurf und der Implementierung moderner Architekturen. Wir helfen Ihnen gerne.