Zum Inhalt springen
_CORE
KI & Agentensysteme Unternehmensinformationssysteme Cloud & Platform Engineering Datenplattform & Integration Sicherheit & Compliance QA, Testing & Observability IoT, Automatisierung & Robotik Mobile & Digitale Produkte Banken & Finanzen Versicherungen Öffentliche Verwaltung Verteidigung & Sicherheit Gesundheitswesen Energie & Versorgung Telko & Medien Industrie & Fertigung Logistik & E-Commerce Retail & Treueprogramme
Referenzen Technologien Blog Know-how Tools
Über uns Zusammenarbeit Karriere
CS EN DE
Lassen Sie uns sprechen

Chaos Engineering — Fortgeschrittene Techniken

04. 09. 2025 1 Min. Lesezeit intermediate

DevOps Experte

Chaos Engineering — Fortgeschrittene Techniken

Chaos EngineeringLitmusChaos MeshResilience 6 Min. Lesezeit

Fortgeschrittene Chaos-Engineering-Experimente. Litmus, Chaos Mesh, Steady-State-Hypothese und Blast Radius.

Prinzipien

  1. Steady State definieren — wie sieht normales Verhalten aus?
  2. Hypothese formulieren
  3. Fehler injizieren — kontrolliert
  4. Beobachten — wurde die Hypothese bestätigt/widerlegt?
  5. Beheben — gefundene Schwachstellen reparieren

Litmus Chaos

apiVersion: litmuschaos.io/v1alpha1
kind: ChaosEngine
metadata:
  name: pod-kill-test
spec:
  appinfo:
    appns: production
    applabel: app=api-server
    appkind: deployment
  engineState: active
  experiments:
    - name: pod-delete
      spec:
        components:
          env:
            - name: TOTAL_CHAOS_DURATION
              value: "60"
            - name: CHAOS_INTERVAL
              value: "10"
        probe:
          - name: check-api-health
            type: httpProbe
            httpProbe/inputs:
              url: http://api-server.production/health
              method:
                get:
                  criteria: ==
                  responseCode: "200"
            mode: Continuous

Chaos Mesh

apiVersion: chaos-mesh.org/v1alpha1
kind: NetworkChaos
metadata:
  name: network-delay
spec:
  action: delay
  mode: all
  selector:
    namespaces: [production]
    labelSelectors:
      app: order-service
  delay:
    latency: "200ms"
    jitter: "50ms"
  duration: "5m"

Experimenttypen

  • Pod-Ausfall — Pods killen/löschen
  • Netzwerk — Latenz, Paketverlust, DNS-Ausfall
  • Ressourcenstress — CPU, Arbeitsspeicher, Disk I/O
  • Node Drain — Pod-Eviction
  • AZ-Ausfall — Simulation eines Availability-Zone-Ausfalls

Zusammenfassung

Chaos Engineering deckt Schwachstellen auf, bevor ein Produktionsvorfall eintritt. Beginnen Sie einfach, steigern Sie schrittweise und haben Sie stets Abbruchkriterien.

Brauchen Sie Hilfe bei der Implementierung?

Unser Team hat Erfahrung mit dem Entwurf und der Implementierung moderner Architekturen. Wir helfen Ihnen gerne.

Kostenlose Beratung

Teilen:

CORE SYSTEMS Team

Wir bauen Kernsysteme und KI-Agenten, die den Betrieb am Laufen halten. 15 Jahre Erfahrung mit Enterprise-IT.