You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Olivier KanaOK

Olivier Kana

Senior Data Engineer | Spark | AWS | Data Platform

€650/day
Paris 17e Arrondissement, FR
8-15 years

Average response time: 1 hour

About Olivier

Senior Data Engineer avec 10 ans d’expérience, spécialisé dans la conception, l’optimisation et l’industrialisation de plateformes data cloud sur AWS et environnements Big Data.

J’interviens sur des projets critiques à forte volumétrie (banque, conformité, fraude, KYC) avec un objectif clair : fiabilité, performance, scalabilité, maîtrise des coûts et sécurisation du delivery en production.

🚀 Ce que je vous apporte concrètement

• Conception de pipelines batch & temps réel robustes (Spark, Databricks, Kafka, Python, Scala)
• Optimisation de traitements Spark et pipelines data (gains de performance ×2 à ×10)
• Mise en place de Data Lakes / Lakehouse AWS (Glue, S3, Airflow)
• Industrialisation et automatisation via CI/CD (GitLab) et Infrastructure as Code (Terraform)
• Amélioration de la qualité des données, monitoring, observabilité et data lineage
• Contribution à des architectures data cloud modernes et AI-ready

✨ Mon différenciateur

Double compétence technique et fonctionnelle (AMOA) : capacité à comprendre rapidement les enjeux métier, challenger l’existant et concevoir des solutions data robustes, maintenables et orientées production.

🎯 Mon approche

• Focus résultats rapide (Quick wins + vision long terme)
• Optimisation performance / coûts cloud (FinOps)
• Standards production-ready
• Forte capacité d’adaptation sur des environnements existants
• Communication fluide avec équipes techniques et métier
  • French

    Native or bilingual

  • English

    Fluent

Can work on-site
Paris 17e Arrondissement (up to 50km)

Experience

  • My Money Bank
    Cloud Data Engineer
    BANKING AND INSURANCE
    October 2022 - April 2026 (3 years and 6 months)
    Paris, France

    Contexte

    Renforcement du dispositif de conformité bancaire par la mise en place de pipelines cloud robustes pour intégrer, contrôler et exposer les données de conformité dans un environnement AWS.

    Travaux réalisés.

    • Lead technique de 2 consultants et référent technique pour les équipes offshores en Inde.
    • Participation à une première phase de modernisation Data Platform orientée Databricks / Spark sur AWS dans le cadre du rapprochement des systèmes HSBC France.
    • Développement et optimisation de pipelines Spark 3 pour traitements batch critiques et industrialisation Data Lake.
    • Contribution aux choix d’architecture et à l’évolution des plateformes data cloud dans un contexte de restructuration et d’harmonisation des standards techniques.
    • Mise en œuvre de pipelines ELT AWS Glue / Spark et orchestration Airflow sur les sujets conformité bancaire (KYC, LCB-FT, abus de marché).
    • Conception de composants serverless AWS (Lambda + Python) et APIs REST pour intégration et exposition des données.
    • Mise en place des bonnes pratiques DataOps : qualité des données, monitoring, gestion des rejets, CI/CD et observabilité.
    • Contribution à l’architecture Data Platform et à l’industrialisation des traitements cloud.

    Environnement technique.

    Cloud & Infrastructure : AWS (Lambda, S3, Glue, RDS, Athena), Docker, Terraform
    Data & Intégration : Spark, Scala, Python, Java, Databricks, Airflow, Spring web, mockito, OpenAPI, FlyWay
    DevOps & Monitoring : GitLab, Kibana, DataDog, Nexus, SonarQube
    python AWS Spark Scala Databricks
  • RATP
    Cloud Data Engineer
    TRANSPORTATION
    April 2023 - June 2023 (2 months)
    Paris, France

    Contexte

    Projet de migration ETL visant à remplacer des traitements Talend par du code Python plus maintenable et performant, tout en préparant l'architecture cible des flux de données.

    Travaux réalisés

    • Refonte des flux Talend en jobs Python performants.
    • Participation à la conception de l'architecture cible de migration ETL.
    • Optimisation des jobs existants et rationalisation des traitements.
    • Développement de pipelines conformes au modèle en étoile.
    • Collaboration avec les équipes projet sur les choix techniques.
    • Contribution à la fiabilisation des traitements de données.
    • Livrables : jobs Python, scripts de migration, documentation technique.

    Environnement technique

    Cloud & Infrastructure : AWS (S3, RDS, Athena), Snowflake, Airflow
    Data & Intégration : Python 3.12, SnowSpark, Talend
    DevOps & Monitoring : GitLab, CloudWatch
    Snowflake python Talend AWS Gitlab
  • Société Générale
    Développeur Big Data
    BANKING AND INSURANCE
    August 2021 - September 2022 (1 year and 1 month)
    Paris, France

    Contexte.

    Projet MOSAIC (MOre Sécurity with Artificial intelegenCe), dédier à la lutte contre la fraude externe à l'aide des technologies Big Data et Machine Learning

    Travaux réalisés.

    • Encadrement technique de 2 data engineer junior.
    • Développement de pipelines data batch et streaming (Spark, Kafka, Spark Streaming)
    • Transformation des données transactionnelles en datasets enrichis pour le machine learning
    • Participation à l’industrialisation des pipelines ML (feature engineering, scoring)
    • Migration de jobs Spark Python vers Scala et optimisation des performances
    • Développement et amélioration des traitements existants
    • Mise en place du monitoring et gestion des incidents en production
    • Collaboration avec data scientists et équipes métier.

    Environnement technique.

    Big Data Infrastructure : Hadoop, Cloudera, HBase, Hive
    Data & Intégration : Spark 2.4, Scala, Python, Kafka, Talend, Bash Linux
    DevOps & Monitoring : Git, Jenkins, kibana, Cloudera Manager
    Hadoop Scala Spark python Apache Kafka

Recommendations

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Mastère Spécialisé BI et Analytics
    EISTI
    2018
    Classé N° 1 des formations supérieures en BI et informatique décisionnel en France (source : - Gestion de projet décisionnel, BI en agile (scrum), V. - Concepts et outils ETL (SSIS, Informatica, DataStage)et DataViz(SAP BO, Qlik, Tableau, Power BI) - Gouvernance des données (MDM, qualité, RGPD etc...) - Technologies Big Data(Hadoop, HDFS, Spark, Scala, Hive...). - modèles de Maching learning
  • Master informatique Fondamentale
    UY1
    2013
    Algorithmes(Algorithmique, complexité algorithmique, algorithmes avancés) Génie logiciel Programmation(java SE, java EE, PHP, C/C++, Bash, HTML, CSS, Pascal, Mathlab) Base de données avancées Systèmes d'exploitation et réseau

Certifications

Skill set

Categories