DevOps Expert
Chaos Engineering — Pokročilé Techniky¶
Chaos EngineeringLitmusChaos MeshResilience 6 min čtení
Pokročilé chaos engineering experimenty. Litmus, Chaos Mesh, steady state hypothesis a blast radius.
Principy¶
- Definujte steady state — jak vypadá normální chování?
- Formulujte hypotézu
- Injectujte poruchu — kontrolovaně
- Pozorujte — potvrdila/vyvrátila se hypotéza?
- Opravte — fixněte nalezené slabiny
Litmus Chaos¶
apiVersion: litmuschaos.io/v1alpha1
kind: ChaosEngine
metadata:
name: pod-kill-test
spec:
appinfo:
appns: production
applabel: app=api-server
appkind: deployment
engineState: active
experiments:
- name: pod-delete
spec:
components:
env:
- name: TOTAL_CHAOS_DURATION
value: "60"
- name: CHAOS_INTERVAL
value: "10"
probe:
- name: check-api-health
type: httpProbe
httpProbe/inputs:
url: http://api-server.production/health
method:
get:
criteria: ==
responseCode: "200"
mode: Continuous
Chaos Mesh¶
apiVersion: chaos-mesh.org/v1alpha1
kind: NetworkChaos
metadata:
name: network-delay
spec:
action: delay
mode: all
selector:
namespaces: [production]
labelSelectors:
app: order-service
delay:
latency: "200ms"
jitter: "50ms"
duration: "5m"
Typy Experimentů¶
- Pod failure — kill/delete pody
- Network — latence, packet loss, DNS failure
- Resource stress — CPU, memory, disk I/O
- Node drain — evikce podů
- AZ failure — simulace výpadku availability zone
Shrnutí¶
Chaos engineering odhaluje slabiny dříve než produkční incident. Začněte jednoduše, stupňujte a vždy mějte abort kritéria.
Potřebujete pomoct s implementací?¶
Náš tým má zkušenosti s návrhem a implementací moderních architektur. Rádi vám pomůžeme.