MLflow dient uns gut für Experiment Tracking, aber für End-to-End-ML-Pipelines brauchen wir mehr. Wir haben Kubeflow (Self-Hosted) und Vertex AI (Managed) getestet.
Kubeflow auf AKS¶
Eine Open-Source-ML-Plattform auf Kubernetes. Pipelines als DAGs, Jupyter Notebooks, Katib für Hyperparameter-Tuning, KFServing für Model Serving. Vorteil: volle Kontrolle. Nachteil: operativ aufwendig — ein Kubeflow-Upgrade ist wie das Upgrade eines kleinen Betriebssystems.
Vertex AI (GCP)¶
Eine Managed-ML-Plattform von Google. AutoML für Nicht-ML-Ingenieure, Custom Training Jobs, Managed Pipelines, Model Monitoring. Vorteil: Zero Ops. Nachteil: Vendor Lock-in, Kosten.
Unsere Entscheidung¶
Ein hybrider Ansatz: Kubeflow Pipelines für Custom Workloads auf AKS, Vertex AI AutoML für schnelle Prototypen und kleinere Projekte. MLflow als gemeinsamer Experiment Tracker über beide Plattformen hinweg.
Es gibt keine einzig richtige Plattform¶
Es hängt vom Team, Budget und den Anforderungen an Kontrolle vs. Einfachheit ab.
Brauchen Sie Hilfe bei der Implementierung?
Unsere Experten helfen Ihnen bei Design, Implementierung und Betrieb. Von der Architektur bis zur Produktion.
Kontaktieren Sie uns