Les ingénieurs Machine Learning de cette organisation de services financiers conçoivent des pipelines ML prêts pour la production et intègrent des modèles dans des environnements informatiques existants afin de fournir des services d'IA automatisés. Le poste met l'accent sur le déploiement en production, le CI/CD avec GitLab, la containerisation (Docker/VM) et le développement Python avancé pour garantir que les modèles s'exécutent de manière fiable et sont surveillés en production.
La mission
L'équipe data engineering et IA maintient plusieurs services ML qui prennent en charge le scoring, la détection de fraude et les insights clients sur des workflows à grand volume en batch et en quasi-temps réel. Le paysage technique comprend du code de modèle basé sur Python, PostgreSQL pour le stockage de features et de métadonnées, des images conteneurisées pour le déploiement et des pipelines GitLab CI pour les tests automatisés et les releases. Assurer un versioning robuste des modèles et des données est une priorité afin que les modèles puissent être audités et réentraînés de manière prévisible.
Au quotidien, vous travaillez avec des data scientists, des analytics engineers et les équipes IT de production pour choisir la bonne approche de serving, implémenter l'ingestion de données et les pipelines de features, et packager les modèles pour le déploiement. Vous automatisez les tests et les pipelines CI/CD, aidez à configurer l'environnement de production et mettez en place la surveillance et des triggers de retraining afin que les modèles restent précis et opérationnels. La collaboration typique implique une équipe cross-fonctionnelle de data scientists et platform engineers et des handoffs réguliers vers le support production.
Vos responsabilités
- Implement production-grade ML pipelines that enable reproducible training, testing and deployment, focusing on reliability and traceability
- Integrate model serving with production infrastructure using containerization and infrastructure parameterisation
- Design and enforce model, code and data versioning workflows to support audits and automated retraining
- Build and maintain GitLab CI pipelines for unit, integration and regression testing of ML components
- Collaborate with data scientists to optimise model packaging and to apply model compression where needed for performance constraints
- Monitor deployed models and data quality, and implement automated retraining or alerting when performance degrades
Votre profil
Compétences essentielles
- Minimum 4 ans d'expérience professionnelle en machine learning engineering ou dans des rôles similaires
- Solides compétences en développement Python avec expérience du packaging et de la gestion des dépendances
- Expérience pratique de la containerisation et de la virtualisation (Docker, création d'images VM)
- Expérience concrète des pratiques CI/CD, en particulier GitLab CI pour les tests automatisés et les déploiements
- Bonne connaissance des pratiques et outils de gestion des versions du code, des modèles et des données
- Connaissance opérationnelle de PostgreSQL pour le stockage de features ou de métadonnées
- À l'aise dans des équipes agiles et pour traduire le travail des data scientists en livrables de production
Compétences souhaitées
- Expérience d'intégration avec des systèmes hétérogènes, incluant des plateformes legacy ou distribuées
- Connaissance des outils ETL/ELT et du traitement big-data (Spark)
- Familiarité avec les techniques de compression de modèles et le traitement des flux de données
- Expérience avec des outils de visualisation de données pour surveiller le comportement des modèles
Langues
- Anglais, C1 (obligatoire)
- Néerlandais, B1 (un plus)
- Français, B1 (un plus)
Formation
- Diplôme en Computer Science, Data Science, Engineering ou expérience professionnelle équivalente