Produktive ML Systeme sind extrem dynamischen Bedingungen ausgesetzt: Anpassung der Geschäftsziele (KPIs), Weiterentwicklung existierender Prozesse und die ständige Veränderung der Daten in Produktivsystemen. Dementsprechend müssen auch ML Systeme weiterentwickelt und entsprechende Änderungen schnell, effizient und reibungslos integriert werden (neue Funktionalität, neue Versionen usw.).
Im Gegensatz zur bewährten DevOps Paradigmen (Continuous Integration & Continuous Delivery, CI/CD), testen und delivern viele ML Teams Modelle manuell, einhergehend mit langen und risikobehafteten Delivery Zyklen.
CD4ML beschreibt einen Ansatz, der gängige CI/CD Praktiken um ML spezifische Anforderungen erweitert: Code und Hyperparameter werden versioniert, der Prozess von Datenvalidierung bis zum Modell Deployment wird automatisiert und getestet sowie das Verhalten der Modelle in Produktion kontinuierlich überwacht.
Anhand eines realen Praxisbeispiels (Recommendation Engine) aus dem online & offline Brillenhandel wird uns Paul Rupprecht, Team Lead Machine Learning Projects & MLOps bei Merantix Momentum, die Vorteile von CD4ML projektbezogen erläutern.
Wir freuen uns auf den Austausch!