En tant que Lead Data Engineer au sein de la direction numérique de France Télévisions, j’ai piloté la conception et la mise en œuvre de solutions data stratégiques au service de la connaissance utilisateur et de l’unification des données à l’échelle du groupe.
Réalisations clés
-
Création du Référentiel Utilisateur : Développement d’un socle unifié de gestion des informations et comportements utilisateurs, assurant une meilleure qualité de données et facilitant leur exploitation transverse.
-
Architecture DPaaS (Data Processing as a Service) : Conception de services de traitement de données massives en temps réel, en s’appuyant sur PySpark, Google Cloud Functions et Dataproc, pour répondre aux enjeux de scalabilité et de performance des Jeux Olympiques 2024.
-
Pipelines data robustes et scalables : Mise en place de flux automatisés de collecte, transformation et stockage des données via Spark, Delta Lake et Cloud Composer, garantissant la traçabilité et la résilience de l’ensemble des traitements.
-
Automatisation de l’infrastructure cloud : Industrialisation des déploiements à l’aide de Terraform, permettant une montée en charge fluide et une meilleure gouvernance de l’infrastructure GCP.
-
Encadrement d’équipe : Management technique d’une équipe de 6 consultants dans un cadre agile (Scrum), avec un focus sur l’excellence technique, la montée en compétences et la culture produit.
-
Prototypage et innovation : Réalisation de Proofs of Concept pour tester la robustesse et l’évolutivité des architectures avant leur généralisation.
Environnement technique
GCP, PySpark, Delta Lake, Terraform, Cloud Composer, IAM, Pub/Sub, Cloud Functions, Dataproc.