Katastrophen passieren. Die Frage ist, wie schnell Sie sich erholen.
Definitionen¶
- ☐ RTO (Recovery Time Objective) pro Dienst definiert
- ☐ RPO (Recovery Point Objective) definiert
- ☐ Kritische Dienste identifiziert
- ☐ Abhaengigkeiten kartiert
Infrastruktur¶
- ☐ Multi-AZ/Multi-Region Deployment
- ☐ Datenbankreplikation (async/sync)
- ☐ Load Balancer Health Checks
- ☐ DNS-Failover (Route53/CloudFlare)
- ☐ CDN als Fallback
Daten¶
- ☐ Backup verifiziert und aktuell
- ☐ Point-in-Time Recovery funktionsfaehig
- ☐ Datenreplikations-Lag ueberwacht
Prozess¶
- ☐ DR-Runbook dokumentiert
- ☐ Kontaktliste aktuell
- ☐ Kommunikationsplan (intern + extern)
- ☐ Eskalationsverfahren klar
Testen¶
- ☐ Tabletop Exercise (Szenariodiskussion) quartalsweise
- ☐ Teilweiser Failover-Test alle 6 Monate
- ☐ Vollstaendiger DR-Test jaehrlich
- ☐ Chaos Engineering (optional)
Realitaet¶
Ein DR-Plan, der nicht getestet wurde, wird in der Produktion scheitern. Testen Sie regelmaessig.
drbusiness continuityinfrastructure