Description

Senior Data Engineer avec 10 ans d’expérience, spécialisé dans la conception, l’optimisation et l’industrialisation de plateformes data cloud sur AWS et environnements Big Data.

J’interviens sur des projets critiques à forte volumétrie (banque, conformité, fraude, KYC) avec un objectif clair : fiabilité, performance, scalabilité, maîtrise des coûts et sécurisation du delivery en production.

🚀 Ce que je vous apporte concrètement

• Conception de pipelines batch & temps réel robustes (Spark, Databricks, Kafka, Python, Scala)

• Optimisation de traitements Spark et pipelines data (gains de performance ×2 à ×10)

• Mise en place de Data Lakes / Lakehouse AWS (Glue, S3, Airflow)

• Industrialisation et automatisation via CI/CD (GitLab) et Infrastructure as Code (Terraform)

• Amélioration de la qualité des données, monitoring, observabilité et data lineage

• Contribution à des architectures data cloud modernes et AI-ready

✨ Mon différenciateur

Double compétence technique et fonctionnelle (AMOA) : capacité à comprendre rapidement les enjeux métier, challenger l’existant et concevoir des solutions data robustes, maintenables et orientées production.

🎯 Mon approche

• Focus résultats rapide (Quick wins + vision long terme)

• Optimisation performance / coûts cloud (FinOps)

• Standards production-ready

• Forte capacité d’adaptation sur des environnements existants

• Communication fluide avec équipes techniques et métier

Industry field of expertise

Languages

French
Native or bilingual
English
Fluent

Workplace preferences

Can work on-site

Paris 17e Arrondissement (up to 50km)

My Money Bank
Cloud Data Engineer
BANKING AND INSURANCE
October 2022 - April 2026 (3 years and 6 months)
Paris, France
Contexte
Renforcement du dispositif de conformité bancaire par la mise en place de pipelines cloud robustes pour intégrer, contrôler et exposer les données de conformité dans un environnement AWS.

Travaux réalisés.
Lead technique de 2 consultants et référent technique pour les équipes offshores en Inde.
Participation à une première phase de modernisation Data Platform orientée Databricks / Spark sur AWS dans le cadre du rapprochement des systèmes HSBC France.
Développement et optimisation de pipelines Spark 3 pour traitements batch critiques et industrialisation Data Lake.
Contribution aux choix d’architecture et à l’évolution des plateformes data cloud dans un contexte de restructuration et d’harmonisation des standards techniques.
Mise en œuvre de pipelines ELT AWS Glue / Spark et orchestration Airflow sur les sujets conformité bancaire (KYC, LCB-FT, abus de marché).
Conception de composants serverless AWS (Lambda + Python) et APIs REST pour intégration et exposition des données.
Mise en place des bonnes pratiques DataOps : qualité des données, monitoring, gestion des rejets, CI/CD et observabilité.
Contribution à l’architecture Data Platform et à l’industrialisation des traitements cloud.
Environnement technique.
Cloud & Infrastructure : AWS (Lambda, S3, Glue, RDS, Athena), Docker, Terraform
Data & Intégration : Spark, Scala, Python, Java, Databricks, Airflow, Spring web, mockito, OpenAPI, FlyWay
DevOps & Monitoring : GitLab, Kibana, DataDog, Nexus, SonarQube
python AWS Spark Scala Databricks
RATP
Cloud Data Engineer
TRANSPORTATION
April 2023 - June 2023 (2 months)
Paris, France
Contexte
Projet de migration ETL visant à remplacer des traitements Talend par du code Python plus maintenable et performant, tout en préparant l'architecture cible des flux de données.

Travaux réalisés
Refonte des flux Talend en jobs Python performants.
Participation à la conception de l'architecture cible de migration ETL.
Optimisation des jobs existants et rationalisation des traitements.
Développement de pipelines conformes au modèle en étoile.
Collaboration avec les équipes projet sur les choix techniques.
Contribution à la fiabilisation des traitements de données.
Livrables : jobs Python, scripts de migration, documentation technique.
Environnement technique
Cloud & Infrastructure : AWS (S3, RDS, Athena), Snowflake, Airflow
Data & Intégration : Python 3.12, SnowSpark, Talend
DevOps & Monitoring : GitLab, CloudWatch
Snowflake python Talend AWS Gitlab
Société Générale
Développeur Big Data
BANKING AND INSURANCE
August 2021 - September 2022 (1 year and 1 month)
Paris, France
Contexte.
Projet MOSAIC (MOre Sécurity with Artificial intelegenCe), dédier à la lutte contre la fraude externe à l'aide des technologies Big Data et Machine Learning

Travaux réalisés.
Encadrement technique de 2 data engineer junior.
Développement de pipelines data batch et streaming (Spark, Kafka, Spark Streaming)
Transformation des données transactionnelles en datasets enrichis pour le machine learning
Participation à l’industrialisation des pipelines ML (feature engineering, scoring)
Migration de jobs Spark Python vers Scala et optimisation des performances
Développement et amélioration des traitements existants
Mise en place du monitoring et gestion des incidents en production
Collaboration avec data scientists et équipes métier.
Environnement technique.
Big Data Infrastructure : Hadoop, Cloudera, HBase, Hive
Data & Intégration : Spark 2.4, Scala, Python, Kafka, Talend, Bash Linux
DevOps & Monitoring : Git, Jenkins, kibana, Cloudera Manager
Hadoop Scala Spark python Apache Kafka

Check out Olivier's experience

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

Signup to reveal

Mastère Spécialisé BI et Analytics
EISTI
2018
Classé N° 1 des formations supérieures en BI et informatique décisionnel en France (source : - Gestion de projet décisionnel, BI en agile (scrum), V. - Concepts et outils ETL (SSIS, Informatica, DataStage)et DataViz(SAP BO, Qlik, Tableau, Power BI) - Gouvernance des données (MDM, qualité, RGPD etc...) - Technologies Big Data(Hadoop, HDFS, Spark, Scala, Hive...). - modèles de Maching learning
Master informatique Fondamentale
UY1
2013
Algorithmes(Algorithmique, complexité algorithmique, algorithmes avancés) Génie logiciel Programmation(java SE, java EE, PHP, C/C++, Bash, HTML, CSS, Pascal, Mathlab) Base de données avancées Systèmes d'exploitation et réseau

AWS Certified Cloud Practitioner
Amazon Web Services
https://www.credly.com/badges/cc8bd349-b179-467a-9265-f2c3c02fe755?source=linked_in_profile
AWS
AWS Certified Data Engineer - Associate
AWS
https://www.credly.com/badges/22441beb-1302-4e57-a5b7-016cbaacfc2a/linked_in_profile
AWS Lambda AWS RDS AWS Redshift AWS S3 AWS Athena AWS Glue AWS SNS AWS ECS AWS EC2 AWS SQS

Olivier's certifications are only visible to Malt Community members

Data Engineer

AI engineer

Olivier Kana

Senior Data Engineer | Spark | AWS | Data Platform

About Olivier

Experience

Contexte

Travaux réalisés.

Environnement technique.

Contexte

Travaux réalisés

Environnement technique

Contexte.

Travaux réalisés.

Environnement technique.

Recommendations

These freelancer profiles also match your criteria

Education

Certifications

Skill set

Categories