Les ingénieurs Machine Learning de cette organisation de services financiers conçoivent des pipelines ML prêts pour la production et intègrent des modèles dans des environnements informatiques existants afin de fournir des services d'IA automatisés. Le poste met l'accent sur le déploiement en production, le CI/CD avec GitLab, la containerisation (Docker/VM) et le développement Python avancé pour garantir que les modèles s'exécutent de manière fiable et sont surveillés en production.

La mission

L'équipe data engineering et IA maintient plusieurs services ML qui prennent en charge le scoring, la détection de fraude et les insights clients sur des workflows à grand volume en batch et en quasi-temps réel. Le paysage technique comprend du code de modèle basé sur Python, PostgreSQL pour le stockage de features et de métadonnées, des images conteneurisées pour le déploiement et des pipelines GitLab CI pour les tests automatisés et les releases. Assurer un versioning robuste des modèles et des données est une priorité afin que les modèles puissent être audités et réentraînés de manière prévisible.

Au quotidien, vous travaillez avec des data scientists, des analytics engineers et les équipes IT de production pour choisir la bonne approche de serving, implémenter l'ingestion de données et les pipelines de features, et packager les modèles pour le déploiement. Vous automatisez les tests et les pipelines CI/CD, aidez à configurer l'environnement de production et mettez en place la surveillance et des triggers de retraining afin que les modèles restent précis et opérationnels. La collaboration typique implique une équipe cross-fonctionnelle de data scientists et platform engineers et des handoffs réguliers vers le support production.

Vos responsabilités

Implement production-grade ML pipelines that enable reproducible training, testing and deployment, focusing on reliability and traceability
Integrate model serving with production infrastructure using containerization and infrastructure parameterisation
Design and enforce model, code and data versioning workflows to support audits and automated retraining
Build and maintain GitLab CI pipelines for unit, integration and regression testing of ML components
Collaborate with data scientists to optimise model packaging and to apply model compression where needed for performance constraints
Monitor deployed models and data quality, and implement automated retraining or alerting when performance degrades

Votre profil

Compétences essentielles

Minimum 4 ans d'expérience professionnelle en machine learning engineering ou dans des rôles similaires
Solides compétences en développement Python avec expérience du packaging et de la gestion des dépendances
Expérience pratique de la containerisation et de la virtualisation (Docker, création d'images VM)
Expérience concrète des pratiques CI/CD, en particulier GitLab CI pour les tests automatisés et les déploiements
Bonne connaissance des pratiques et outils de gestion des versions du code, des modèles et des données
Connaissance opérationnelle de PostgreSQL pour le stockage de features ou de métadonnées
À l'aise dans des équipes agiles et pour traduire le travail des data scientists en livrables de production

Compétences souhaitées

Expérience d'intégration avec des systèmes hétérogènes, incluant des plateformes legacy ou distribuées
Connaissance des outils ETL/ELT et du traitement big-data (Spark)
Familiarité avec les techniques de compression de modèles et le traitement des flux de données
Expérience avec des outils de visualisation de données pour surveiller le comportement des modèles

Langues

Anglais, C1 (obligatoire)
Néerlandais, B1 (un plus)
Français, B1 (un plus)

Formation

Diplôme en Computer Science, Data Science, Engineering ou expérience professionnelle équivalente

Machine Learning Engineer

Postulez pour ce poste