- Conception d'un pipeline de données scalable sur GCP (Spark, Delta Lake, Cloud Composer)
- Infrastructure as code avec Terraform
- Automatisation des traitements, réduction des coûts d'exploitation
- Encadrement technique d'une équipe de 8 consultants en méthodologie Scrum
- Réalisation de POCs pour valider la scalabilité et la robustesse de l'architecture
- Création d'un référentiel utilisateur structuré en Golden Tables (refined) par type de données, intégrant les dimensions comportementales et d'identité des utilisateurs de la plateforme France Télévisions.
Parcours
- Dec 2022 - Aujourd'huiFrance Télévisions – Paris, FranceTech Lead Data Engineer
Déploiement d'une architecture data cloud pour le ciblage personnalisé dans le cadre des JO 2024. Référentiel utilisateur & Vue client unifiée 2.0 - Oct 2022 – Dec 2022Céline – LVMH, Paris, FranceData Engineer
Migration d'un entrepôt de données Oracle vers GCP pour répondre à des enjeux de scalabilité et de maintenabilité. Migration Oracle vers GCP- Développement de scripts d'ingestion de données fiables
- Déploiement d'une infrastructure cloud via Terraform
- Transformation et orchestration via SQLx et Dataform
- Technique de validation de l'architecture cible
- Oct 2021 – Oct 2022Stellantis – Paris, FranceData Engineer
Création d'une plateforme d'estimation de la valeur des véhicules en LLD, utilisée pour la vente et les campagnes marketing. Cotation véhicule LLD : un outil d'aide à la décision performant- Conception et développement de pipelines Spark pour le calcul de valeur marchande
- Animation des rituels Agile avec les équipes produit
- Coordination technique et recueil des besoins métier
- Contribution à l'architecture data et supervision des développements
- Oct 2018 – Oct 2021Banque PSA Finance – Sochaux, FranceData Scientist / Data Engineer
Classification des environnements applicatifs Classification des environnements applicatifs par machine learning semi-supervisé- Conception d'un moteur de classification basé sur des règles métiers et du machine learning
- Suivi du cycle de vie de plus de 200 environnements applicatifs
- Création d'un référentiel de Golden Data
- Cartographie complète du SI de la banque
- Modélisation via Archimate
- Constitution du référentiel dans Sparx Enterprise Architect
- Mars 2018 – Juin 2018CIDCO – Rimouski, CanadaStagiaire Data Scientist
Projet R&D sur l'optimisation de la trajectoire d'une sonde marine autonome en conditions difficiles. Optimisation de la trajectoire d'une sonde marine autonome- Développement de scripts embarqués en C++ pour traitement temps réel
- Déploiement sur Raspberry Pi et tests fonctionnels
- Intégration dans le système embarqué propriétaire du centre