Ein DR-Plan ist ein Dokument, über das alle reden, aber nur wenige aktuell und getestet halten. Nach der Erfahrung mit einem Rechenzentrumsausfall haben wir beschlossen, DR ernst zu nehmen.
RPO und RTO¶
Prioritätssysteme: RPO unter 1 Minute, RTO unter 30 Minuten. Sekundäre Systeme: RPO unter 24 Stunden, RTO unter 8 Stunden. Interne Systeme: RPO/RTO unter 24 Stunden.
Szenarien¶
Festplattenausfall (RAID), Serverausfall (VMware HA), SAN-Ausfall (redundante Pfade), Rechenzentrumsausfall (DR-Standort), regionaler Ausfall (geo-verteilt).
Failover-Prozeduren¶
Schritt für Schritt. Wer ist verantwortlich, Kontaktdaten, erwartete Zeit. Geschrieben für einen Junior-Admin am Sonntagabend.
Tests¶
Monatlich: Tabletop-Übung. Vierteljährlich: Teiltest. Jährlich: vollständiger DR-Test. Dokumentiert mit Lessons Learned.
Pflege¶
Living Document in Confluence. Review nach jedem Incident und jeder Infrastrukturänderung. Gedruckte Kopie im Serverraum, USB-Kopie im Tresor.
Fazit¶
Ein DR-Plan ist eine Versicherung. Er ist der Unterschied zwischen einem 30-minütigen Ausfall und einer ganztägigen Katastrophe. Investieren Sie in Erstellung, Tests und Pflege. Ein ungetesteter Plan ist kein Plan.
Brauchen Sie Hilfe bei der Implementierung?
Unsere Experten helfen Ihnen bei Design, Implementierung und Betrieb. Von der Architektur bis zur Produktion.
Kontaktieren Sie uns