Kubernetes Cost Optimization: So sparen Sie 40–60 % bei der Cloud-Infrastruktur 2026¶
Kubernetes ist zum Standard für den Betrieb von Enterprise-Anwendungen geworden. Damit einher geht jedoch eine Herausforderung, die viele Teams unterschätzen: Die Kosten für Cloud-Infrastruktur steigen schneller als die Produktivität. Die CNCF-Umfrage 2026 zeigt, dass die durchschnittliche Organisation 35–50 % zu viel für Kubernetes-Infrastruktur bezahlt — allein aufgrund falsch konfigurierter Resource Requests, ungenutzter Compute-Kapazität und fehlender FinOps-Kultur.
Dieser Artikel ist ein praktischer Leitfaden zur Beseitigung dieser Verluste.
Wo das Geld verschwindet — Anatomie der Kubernetes-Verschwendung¶
Over-Provisioning von Resource Requests¶
Die größte Quelle der Verschwendung. Entwickler setzen requests und limits konservativ, weil niemand will, dass seine Anwendung OOMkilled wird. Das Ergebnis: Die durchschnittliche CPU-Auslastung im Cluster liegt typischerweise bei 15–25 %, Speicher bei 40–60 %.
# Typický "safe" setting od vývojáře
resources:
requests:
cpu: "500m" # Reálně aplikace používá 50m
memory: "512Mi" # Reálně 120Mi
limits:
cpu: "2000m"
memory: "2Gi"
Dieser Pod belegt einen Billing-Slot für 500m CPU und 512Mi RAM — obwohl 90 % davon nie genutzt werden.
Idle Namespaces und Zombie-Workloads¶
Development- und Staging-Umgebungen laufen 24/7, obwohl sie nur 8 Stunden am Tag aktiv sind. Vergessene Jobs, abgeschlossene CronJobs mit Historie, alte ReplicaSets — all das bezahlen Sie.
Suboptimale Instance-Typen¶
Einen speicherintensiven Workload auf einer compute-optimierten Instanz ausführen (oder umgekehrt) — Sie zahlen für Kapazität, die Sie nicht nutzen können.
Resource Optimization — konkrete Schritte¶
1. Goldilocks — automatische Resource-Request-Empfehlungen¶
Goldilocks analysiert die tatsächliche Nutzung über VPA und empfiehlt die richtigen Werte.
# Instalace
helm repo add fairwinds-stable https://charts.fairwinds.com/stable
helm install goldilocks fairwinds-stable/goldilocks \
--namespace goldilocks \
--create-namespace
# Označit namespace pro analýzu
kubectl label namespace production goldilocks.fairwinds.com/enabled=true
# Goldilocks dashboard
kubectl -n goldilocks port-forward svc/goldilocks-dashboard 8080:80
2. VPA im Empfehlungsmodus¶
3. HPA mit Custom Metriken¶
4. KEDA für Event-Driven Autoscaling¶
Scale-to-Zero ist entscheidend — ein Worker ohne Nachrichten = 0 Pods = 0 Kosten.
Node Optimization¶
Spot/Preemptible Instances mit Karpenter¶
Karpenter konsolidiert Nodes automatisch — wenn 3 Workloads auf 3 Nodes sitzen, packt es sie auf 1 Node um und fährt die übrigen 2 herunter.
FinOps — Kubecost und Kostentransparenz¶
Kubecost ermöglicht die Anzeige von Kosten pro Namespace, Deployment, Label oder Team — entscheidend für ein Chargeback-Modell.
Ergebnisse — reale Zahlen¶
| Optimierung | Typische Einsparung |
|---|---|
| Right-Sizing Requests (Goldilocks) | 20–30 % |
| Spot Instances (70 % der Workloads) | 60–70 % auf Compute |
| Scale-to-Zero für Dev/Staging | 40–60 % auf Nonprod |
| Karpenter Konsolidierung | 10–20 % |
| Bereinigung ungenutzter Ressourcen | 5–15 % |
| Gesamt | 40–60 % der Gesamtkosten |
Implementierungsplan¶
Woche 1–2: Transparenz — Kubecost oder OpenCost deployen, Cost Allocation Labels hinzufügen, Resource Utilization auditieren.
Woche 3–4: Quick Wins — Top 20 über-provisionierte Deployments right-sizen, Scale-to-Zero für Dev/Staging über Nacht aktivieren.
Monat 2: Automatisierung — Karpenter mit Spot Pool, HPA/KEDA für Schlüssel-Services.
Monat 3+: FinOps-Kultur — Chargeback-Reports pro Team, Kostenbudgets und Alerting, vierteljährliche Reviews.
Fazit¶
Kubernetes Cost Optimization ist keine einmalige Aktion — es ist ein kontinuierlicher Prozess. Beginnen Sie mit Transparenz (Kubecost), fahren Sie mit Right-Sizing fort (Goldilocks + VPA) und automatisieren Sie die Skalierung (HPA, KEDA, Karpenter). Das Ergebnis ist eine Infrastruktur, die mit Ihren Anforderungen wächst, nicht trotz ihnen.
CORE SYSTEMS hilft Enterprise-Organisationen bei der Implementierung von FinOps-Kultur und Kubernetes Cost Governance. Kontaktieren Sie uns für ein Audit Ihrer Infrastruktur.
Brauchen Sie Hilfe bei der Implementierung?
Unsere Experten helfen Ihnen bei Design, Implementierung und Betrieb. Von der Architektur bis zur Produktion.
Kontaktieren Sie uns