Formations

  • 2018 – 2021 Diplôme d’ingénieur en informatique – UTBM, Belfort (France)
  • 2018 – DEC Informatique – Cégep de Matane (Canada) (échange académique)
  • 2016 – 2018 – DUT Informatique – IUT de Saint-Dié-des-Vosges (France)

Compétences techniques

  • Langages & développement : Python, Java, SQL, C++, Git, Docker, Airflow, Spark
  • Cloud et DataOps : GCP (BigQuery, Dataproc, GCS, Pub/Sub, IAM), Terraform, Hive, Kafka, Ranger
  • Data Engineering & BI : Dataform, Talend, Pentaho, Power BI, Oracle
  • Méthodologies : Agile Scrum, cadrage fonctionnel, gestion d’incidents, estimation de charge

Langues

  • Français : Langue maternelle
  • Anglais : B2 – Intermédiaire avancé
Parcours
  • Dec 2022 - Aujourd'hui
    France Télévisions – Paris, France
    Data Engineer Lead

    En tant que Lead Data Engineer au sein de la direction numérique de France Télévisions, j’ai piloté la conception et la mise en œuvre de solutions data stratégiques au service de la connaissance utilisateur et de l’unification des données à l’échelle du groupe.

    Réalisations clés

    • Création du Référentiel Utilisateur : Développement d’un socle unifié de gestion des informations et comportements utilisateurs, assurant une meilleure qualité de données et facilitant leur exploitation transverse.

    • Architecture DPaaS (Data Processing as a Service) : Conception de services de traitement de données massives en temps réel, en s’appuyant sur PySpark, Google Cloud Functions et Dataproc, pour répondre aux enjeux de scalabilité et de performance des Jeux Olympiques 2024.

    • Pipelines data robustes et scalables : Mise en place de flux automatisés de collecte, transformation et stockage des données via Spark, Delta Lake et Cloud Composer, garantissant la traçabilité et la résilience de l’ensemble des traitements.

    • Automatisation de l’infrastructure cloud : Industrialisation des déploiements à l’aide de Terraform, permettant une montée en charge fluide et une meilleure gouvernance de l’infrastructure GCP.

    • Encadrement d’équipe : Management technique d’une équipe de 6 consultants dans un cadre agile (Scrum), avec un focus sur l’excellence technique, la montée en compétences et la culture produit.

    • Prototypage et innovation : Réalisation de Proofs of Concept pour tester la robustesse et l’évolutivité des architectures avant leur généralisation.

    Environnement technique

    GCP, PySpark, Delta Lake, Terraform, Cloud Composer, IAM, Pub/Sub, Cloud Functions, Dataproc.

  • Oct 2022 - Dec 2022
    Céline – LVMH, Paris, France
    Data Engineer

    Participation à la migration de l’entrepôt de données de Céline (LVMH) d’Oracle vers Google Cloud Platform, avec pour objectif une meilleure scalabilité, maintenabilité et modernisation des traitements data.

    Réalisations clés

    • Scripts d’ingestion robustes : Développement de pipelines d’ingestion automatisés et fiables pour transférer les données d’Oracle vers GCP, tout en assurant la qualité et la conformité des jeux de données.

    • Infrastructure cloud automatisée : Déploiement de l’infrastructure nécessaire avec Terraform.

    • Transformation & orchestration : Implémentation des traitements de transformation de données et de leur orchestration via SQLx et Dataform, pour industrialiser les processus et garantir leur traçabilité.

    Environnement technique

    Oracle, GCP (GCS, IAM), Terraform, SQLx, Dataform

  • Mar 2022 - Sep 2022
    FDJ – Paris, France
    Data Engineer Lead / Data Steward

    Transformation d’un environnement Hadoop on-premise de type POC en une plateforme sécurisée et industrialisée, destinée à héberger des traitements critiques liés aux données des joueurs gagnants.

    • Analyse des besoins techniques et métiers pour formaliser les règles d’accès aux données
    • Mise en place de politiques d’accès granulaires via Apache Ranger (rôles, équipes, Service Accounts)
    • Développement d’un script Python pour automatiser la gestion des policies Ranger (approche IaC)
    • Accompagnement des équipes de développement dans la transition vers un modèle sécurisé
    • Maintien des traitements en production sans interruption de service durant la migration

    Stack technique : Hadoop, HDFS, Hive, Apache Ranger, Python

  • Oct 2021 - Mar 2022
    Stellantis – Paris, France
    Data Engineer Cloud

    Création d’une plateforme d’estimation de la valeur des véhicules en LLD, utilisée pour la vente et les campagnes marketing.

    • Conception et développement de pipelines Spark pour le calcul de valeur marchande
    • Animation des rituels Agile avec les équipes produit
    • Coordination technique et recueil des besoins métier
    • Contribution à l’architecture data et supervision des développements

    Stack technique : Spark, Java, Kafka, Hive, Yarn, Ranger, Kibana, Elasticsearch

  • Oct 2018 - Oct 2021
    Banque PSA Finance – Sochaux, France
    Data Scientist / Data Engineer

    Classification des environnements applicatifs

    • Conception d’un moteur de classification basé sur des règles métiers et du machine learning
    • Suivi du cycle de vie de plus de 200 environnements applicatifs
    • Création d’un référentiel de Golden Data Architecture d’entreprise (TOGAF)
    • Cartographie complète du SI de la banque
    • Modélisation via Archimate
    • Constitution du référentiel dans Sparx Enterprise Architect

    Stack technique : Python, Hive, Pandas, Scikit-learn, Jupyter, NLTK, Archimate, Sparx EA

  • Mar 2018 - Jun 2018
    CIDCO – Rimouski, Canada
    Stagiaire Data Scientist

    Projet R&D sur l’optimisation de la trajectoire d’une sonde marine autonome en conditions difficiles.

    • Développement de scripts embarqués en C++ pour traitement temps réel
    • Déploiement sur Raspberry Pi et tests fonctionnels
    • Intégration dans le système embarqué propriétaire du centre

    Stack technique : C++, Raspberry Pi, GitHub, XML, capteurs GPS