Postmortem není o hledání viníků. Je o tom, aby se to nestalo znovu.
Blameless kultura¶
„Jan smazal databázi” → „Chyběla ochrana proti mazání produkční databáze.” Hledejte systémové příčiny, ne viníky.
Template¶
Incident: [název]¶
**Datum:** YYYY-MM-DD
**Severity:** Critical/Major/Minor
**Duration:** X hodin
**Impact:** Y uživatelů zasaženo, Z transakcí ztraceno
Timeline¶
HH:MM — Co se stalo
HH:MM — Alert fired
HH:MM — On-call notifikován
HH:MM — Příčina identifikována
HH:MM — Mitigace aplikována
HH:MM — Resolved
Root Cause¶
Detailní popis příčiny.
Contributing Factors¶
Co zhoršilo situaci?
Action Items¶
| Akce | Vlastník | Deadline | Priority |
|---|---|---|---|
| Přidat guard | Jan | 2 týdny | P1 |
| ## Klíčové otázky |
- Proč to detekce trvala tak dlouho?
- Proč neexistoval automatický rollback?
- Proč test nepokryl tento scénář?
- Měli jsme runbook? Pomohl?
Follow-up¶
Action items musí mít vlastníky a deadliny. Reviewujte plnění na týdenním standupu.
Pamatujte¶
Postmortem bez action items je jen příběh. Postmortem s follow-through je zlepšení.