Přeskočit na obsah
_CORE
AI & Agentic Systems Core Informační Systémy Cloud & Platform Engineering Data Platforma & Integrace Security & Compliance QA, Testing & Observability IoT, Automatizace & Robotika Mobile & Digital Banky & Finance Pojišťovnictví Veřejná správa Obrana & Bezpečnost Zdravotnictví Energetika & Utility Telco & Média Průmysl & Výroba Logistika & E-commerce Retail & Loyalty
Reference Technologie Blog Know-how
Nástroje O nás Spolupráce Kariéra
Pojďme to probrat

SRE — Game Days

09. 02. 2026 1 min čtení intermediate

DevOps Pokročilý

SRE — Game Days

SREGame DayIncident ResponseChaos Engineering 5 min čtení

Simulované incidenty pro testování připravenosti týmu. Plánování, scénáře a lessons learned.

Co je Game Day

Game Day je kontrolovaná simulace incidentu. Testuje nejen systémy, ale hlavně lidi a procesy.

  • Testuje incident response postupy
  • Odhaluje mezery v runboocích
  • Buduje svalovou paměť pro reálné incidenty
  • Identifikuje single points of failure

Plánování

  1. Scope — co testujeme? (failover DB, ztráta AZ, DDoS)
  2. Blast radius — jaký dopad očekáváme?
  3. Abort criteria — kdy okamžitě zastavit
  4. Stakeholders — kdo ví, kdo neví
  5. Timeline — přesný plán injekcí
  6. Rollback plan — jak vrátit vše do normálu

Scénáře

  • Infrastructure: výpadek AZ, node failure, disk full, network partition
  • Application: memory leak, CPU spike, dependency timeout
  • Data: corrupted cache, stale data, replication lag
  • Security: compromised credentials, DDoS
  • Process: on-call unreachable, runbook outdated

Shrnutí

Game Days budují důvěru v systémy a procesy. Pravidelné simulace dramaticky zlepšují incident response time.

Potřebujete pomoct s implementací?

Náš tým má zkušenosti s návrhem a implementací moderních architektur. Rádi vám pomůžeme.

Nezávazná konzultace

Sdílet:

CORE SYSTEMS tým

Stavíme core systémy a AI agenty, které drží provoz. 15 let zkušeností s enterprise IT.