Description

Je développe des solutions qui optimisent l'exploitation de vos données sur un pipeline efficace pour renforcer votre compétitivité.

Data Science

Traitement de données

— Python (poetry) / R

— ETL (Airflow, DBT, Fivetran)

— Data Analysis / EDA

— Stream (Beam, Dataflow, Kafka)

— Hadoop / Snowflake

— PySpark

Collection de données

— Data Engineering / UML

— Hadoop / Spark

— Web Scraping (Beautifulsoup, Selenium, Scrapy)

— LLM RAG / ChatGPT

LLM / ChatGPT API

— Prompt Engineering (CoT & Tool Calling)

— RAG (LangChain, LlamaIndex)

— Vector DB (FAISS, Chroma)

— Agents & Tool Use

— Guardrails, HPO & Monitoring

Prédiction & Classification

— Modélisation

— Modèles statistiques, IA & Machine Learning (50+ modèles)

— Deep Learning (Tensorflow)

— PyTorch, ScikitLearn

— Computer vision

— Time series

— NLP

Monitoring / Alerting

— Dashboards (PowerBI, Tableau, Looker, Shiny, Dash)

— Data visualisation

— ELK Stack

Développement produit

Prototypage

— UX/UI & Research (Figma, Adobe XD)

Développement

— Front (React, JS, HTML, SCSS)

— Back / APIs (Flask, FastAPI)

— Advanced SQL / NoSQL

— Automatisation (N8n, Make, Zapier)

Production

— CI/CD : GitHub, Jenkins, Serverless framework

— Cloud : GCP / AWS (Lambda, API gateway, S3, RDS)

— TensorFlow, PyTorch, MLflow, Scikit-learn

— Databricks, Dataiku,

— Docker, Kubernetes

— Cybersécurité (OWASP, ISO27001, EBIOS)

Expériences :

📊 Lead Data Scientist Senior (9 ans)
🔬 Chercheur en IA / Mathématiques
🏛️ Professeur en Data Science (Université Catholique de Lille)
🦄 Fondateur SaaS IA weeki.io (5 ans à Euratechnologies)

Éducation :

- Doctorant en Machine Learning

- Formé aux USA à NYC & Stanford 🇺🇸

Industry field of expertise

Languages

English
Native or bilingual
French
Native or bilingual
Greek
Native or bilingual

Workplace preferences

Can work on-site

Paris (up to 50km), Lille (up to 50km), Ferney-Voltaire (up to 50km), Thonon-les-Bains (up to 50km)

DECATHLON | TECHNOLOGY
Senior Data scientist for Supply Chain Forecast
RETAIL (LARGE RETAILERS)
January 2024 - January 2025 (1 year)
Paris, France
Lead Senior Data Scientist – Forecast & Supply Chain

Mission

Prévision de la demande, optimisation des stocks et réapprovisionnements.
Modèles adaptatifs aux variations saisonnières.

Équipe : 1 PM, 4 DS, 2 DA, 1 ML

Contexte

Retail, supply chain complexe, e-commerce, omnicanal
Modélisation robuste pour variabilité demande, comportement conso, contraintes appro

Objectifs

Forecast multi-échelles
Prévisions probabilistes (distributions, intervalles confiance)
Apprentissage incrémental (cutoffs)
Automatisation déploiement
Optimisation stocks, réduction ruptures

Technologies & Infra

Langages : Python (Pandas, Numpy, PySpark, Scikit-learn, TensorFlow)
Frameworks : FastAPI, Streamlit, Poetry
Cloud & Infra : Databricks, AWS S3, Git
Stockage & Pipeline : Colibra, Delta files, Parquet, Databricks JOBS template
Orchestration : Airflow
CI/CD & DevOps : GitHub Actions, Docker
ML Management : MLflow, Databricks
Monitoring & Viz : Tableau

Données & Pipelines

Centralisation sur Colibra / S3 / Parquet
Qualité données validée avant ingestion
Sources : historiques ventes, indicateurs éco, signaux externes

Transformations & Analyses
Clustering, saisonnalité, PCA, statistiques (Anova, X², T-test, F-Fisher)
Feature Engineering : lags, macroéconomie, KNN, clustering

Modélisation & Prédiction

Feature Selection : SelectKBest, Boruta, RFE, SFS, Random Forest Importance
Forecast ML : LightGBM, XGBoost, RandomForest, CatBoost, AdaBoost
Time Series : SARIMA, TFT, RNN, STL, ARIMA, Fourier, Poly Saisonnière
Optimisation : HPO (Optuna, HyperOpt)
Fonctions coût : RMSE, WAPE, MAE, Tweedie, Quantile Loss

Feature Importance

Locale : SHAP, LIME
Globale : Beta Coeffs, Friedman H, Permutation

Déploiement & Exploitation

API via FastAPI, UI via Streamlit, hébergé sur Databricks APP
Automatisation Airflow, monitoring erreurs/dérives
Alerte dérivations

Reporting & Visualisation

Dashboards Tableau
Backtesting comparatif
Scénarios
Databricks MLflow Forecast MLOps Data Pipeline
UPFUND
Senior Lead Datascientis for Real Estate
REAL ESTATE
January 2024 - January 2025 (1 year)
Paris, France
Machine Learning (ML) →

- Prédiction d'indicateurs immobiliers (commerces, appartements, maisons) à l'aide de modèles de Machine Learning, d'analyses géospatiales et prévision de séries temporelles.

Data Engineering (DE) & Data Analysis (DA) →

- Création de pipelines de données, prétraitement, analyse exploratoire (EDA)

Research & Development (R&D) →

- Identification et définition des problématiques de recherche, pour orienter les projets de manière structurée et scientifique. Définition des hypothèses de travail, avec production de synthèses des modèles utilisés.

Knowledge management (KM) →

- Création d'un état de l'art sur les statistiques spatiales, séries temporelles, prévisions et Machine Learning appliqué à l'immobilier.
- Centralisation, structuration et gestion des connaissances scientifiques, afin de tirer profit des savoirs et faciliter leur réutilisation.
Data Pipeline Analyse de données MLOps Machine learning Statistiques
UNIVERSITE CATHOLIQUE DE LILLE
👨‍🏫 Professor in Datascience / ML / Probability & Statistics 👨🏼‍🏫
BIOTECH
January 2023 - January 2025 (2 years)
Lille, France
Programme de cours – Professeur Vacataire en Mathématiques

Fondations
• 0.1 : Éléments de calcul et outils
• 0.2 : Épistémologie et théorie de la connaissance

Partie 1 – Théorie des systèmes
• 1.1 : Systèmes dynamiques
• 1.2 : Systèmes adaptatifs complexes

Partie 2 – Dynamique stochastique et probabilités
• 2.1 : Théorie de la mesure
• 2.2 : Théorie des probabilités
• 2.3 : Distributions de probabilité usuelles
• 2.4 : Statistiques asymptotiques
• 2.5 : Processus stochastiques et séries temporelles
• 2.6 : Géométrie de l'information

Partie 3 – Observation des données
• 3.1 : Statistiques descriptives
• 3.2 : Analyse exploratoire des données

Partie 4 – Inférence et théorie de l'estimation
• 4.1 : Estimation des paramètres
• 4.2 : Conception expérimentale, échantillonnage et tests d'hypothèses
• 4.4 : Arbres de décision et sélection de modèles
• 4.5 : Inférences bayésiennes

Partie 5 – Exemples de modèles linéaires et de régression
• 5.1 : Régression linéaire simple
• 5.2 : Régression linéaire multiple
• 5.3 : Autres méthodes de régression

Partie 6 – Autres exemples de modèles classiques
• 6.1 : Tests univariés usuels
• 6.2 : Tests multivariés usuels
• 6.3 : Statistiques non paramétriques

Partie 7 – Exemples de modèles non linéaires
• 7.1 : Modèles graphiques probabilistes
• 7.2 : Théorie de la percolation
• 7.3 : Statistiques spatiales
• 7.4 : Théorie des valeurs extrêmes
• 7.5 : Modélisation basée sur les agents
• 7.6 : Dynamique des réseaux

Technologies et outils utilisés :
MATLAB, R, Python, LaTeX, Jupyter Notebooks, SPSS, SAS, Excel, NumPy, SciPy, Pandas, Matplotlib, TensorFlow, PyTorch, Tableau, Power BI, SQL, GitHub.
Data science Analyse de données Inférence bayésienne Data Engineer

Check out Baptiste Marc's experience

Ceren D. and 11 other people have recommended Baptiste Marc

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

Signup to reveal

MASTER in MATHEMATICS and COMPUTER SCIENCE applied to COGNITIVE SCIENCE for BUSINESS
Lille University
2019
— Data Science with Python: Machine Learning — Probability — Statistical Linear Models & Regression — English M1 — Web — Computing for Neurocognitive Science — Digital development for Neuropsychology — Philosophy of Mind — Ergonomy & Product design — R programming — Non Parametric Statistics — SAS for datascience — E-marketing — Technology for Psychological Research M2 — Ethics & deontology — Functionnal Neuroscience — Emotionnal Process & Affective neuroscience — Neurocognition — Artificial Neural Networks — Programming for Experimental research — UX design / Product and Experience optimization
NEW YORK CITY DATA SCIENCE ACADEMY
New York Datascience Academy (NYCDSA)
2019
— Deep Learning — Statistical models — Hadoop — Spark — AWS — Datavizualizatiuon — Linux system — Advanced SQL — NoSQL — Web Scraping — Time Series Analysis — Reinforcement Learning — Computer Vision — Generalized Linear Models — Tree Methods — Support Vector Machines — Natural Language Processing — Code Optimization — Advanced Phyton — Advanced R

Check out Baptiste Marc's education

AI engineer

Baptiste Marc Moka

Senior Data Scientist / AI Engineer & Professor

About Baptiste Marc

Data Science

Développement produit

Experience

Recommendations

These freelancer profiles also match your criteria

Education

Skill set

Categories