Machine Learning ist keine Magie. Es ist Mathematik, Daten und viel Experimentieren. Wir teilen unsere Erfahrungen aus unseren ersten ML-Projekten.
scikit-learn für 80% der Probleme¶
Im Jahr 2020 haben Sie drei Hauptoptionen: scikit-learn (klassisches ML), TensorFlow (Deep Learning von Google) und PyTorch (Deep Learning von Facebook). In der Praxis werden 80% der Probleme durch klassische Algorithmen gelöst — Random Forest, XGBoost, logistische Regression. Deep Learning nur für NLP und Computer Vision.
Erstes Projekt: Churn-Vorhersage¶
Telekommunikationskunde, 500K Kunden, 47 Features, 18 Monate Historie. XGBoost gewann mit AUC 0.87. Wir verbrachten 70% der Zeit mit Daten — Bereinigung, Feature Engineering. Die größte Verbesserung kam durch bessere Features, nicht durch einen besseren Algorithmus.
Was uns überrascht hat¶
Produktions-Deployment ist schwer. Jupyter Notebook → Produktion mit Monitoring und Versionierung ist eine völlig andere Disziplin. Erklärbarkeit — der Kunde wollte nicht nur wissen „wer abwandert”, sondern „warum”. Wir haben SHAP zur Interpretation hinzugefügt.
ML ist keine Raketenwissenschaft — aber auch nicht trivial¶
scikit-learn, ein qualitativ hochwertiger Datensatz und Grundlagen der Statistik bringen Sie weit. Aber ein produktives ML-System ist komplex — darüber werden wir mehr schreiben.
Brauchen Sie Hilfe bei der Implementierung?
Unsere Experten helfen Ihnen bei Design, Implementierung und Betrieb. Von der Architektur bis zur Produktion.
Kontaktieren Sie uns