About Baptiste Marc
Data Science
Développement produit
- 📊 Lead Data Scientist Senior (9 ans)
- 🔬 Chercheur en IA / Mathématiques
- 🏛️ Professeur en Data Science (Université Catholique de Lille)
- 🦄 Fondateur SaaS IA weeki.io (5 ans à Euratechnologies)
English
Native or bilingual
French
Native or bilingual
Greek
Native or bilingual
Experience
- DECATHLON | TECHNOLOGYSenior Data scientist for Supply Chain ForecastRETAIL (LARGE RETAILERS)January 2024 - January 2025 (1 year)Paris, FranceLead Senior Data Scientist – Forecast & Supply ChainMissionPrévision de la demande, optimisation des stocks et réapprovisionnements.Modèles adaptatifs aux variations saisonnières.Équipe : 1 PM, 4 DS, 2 DA, 1 MLContexteRetail, supply chain complexe, e-commerce, omnicanalModélisation robuste pour variabilité demande, comportement conso, contraintes approObjectifsForecast multi-échellesPrévisions probabilistes (distributions, intervalles confiance)Apprentissage incrémental (cutoffs)Automatisation déploiementOptimisation stocks, réduction rupturesTechnologies & InfraLangages : Python (Pandas, Numpy, PySpark, Scikit-learn, TensorFlow)Frameworks : FastAPI, Streamlit, PoetryCloud & Infra : Databricks, AWS S3, GitStockage & Pipeline : Colibra, Delta files, Parquet, Databricks JOBS templateOrchestration : AirflowCI/CD & DevOps : GitHub Actions, DockerML Management : MLflow, DatabricksMonitoring & Viz : TableauDonnées & PipelinesCentralisation sur Colibra / S3 / ParquetQualité données validée avant ingestionSources : historiques ventes, indicateurs éco, signaux externesTransformations & AnalysesClustering, saisonnalité, PCA, statistiques (Anova, X², T-test, F-Fisher)Feature Engineering : lags, macroéconomie, KNN, clusteringModélisation & PrédictionFeature Selection : SelectKBest, Boruta, RFE, SFS, Random Forest ImportanceForecast ML : LightGBM, XGBoost, RandomForest, CatBoost, AdaBoostTime Series : SARIMA, TFT, RNN, STL, ARIMA, Fourier, Poly SaisonnièreOptimisation : HPO (Optuna, HyperOpt)Fonctions coût : RMSE, WAPE, MAE, Tweedie, Quantile LossFeature ImportanceLocale : SHAP, LIMEGlobale : Beta Coeffs, Friedman H, PermutationDéploiement & ExploitationAPI via FastAPI, UI via Streamlit, hébergé sur Databricks APPAutomatisation Airflow, monitoring erreurs/dérivesAlerte dérivationsReporting & VisualisationDashboards TableauBacktesting comparatifScénarios
- UPFUNDSenior Lead Datascientis for Real EstateREAL ESTATEJanuary 2024 - January 2025 (1 year)Paris, FranceMachine Learning (ML) →- Prédiction d'indicateurs immobiliers (commerces, appartements, maisons) à l'aide de modèles de Machine Learning, d'analyses géospatiales et prévision de séries temporelles.Data Engineering (DE) & Data Analysis (DA) →- Création de pipelines de données, prétraitement, analyse exploratoire (EDA)Research & Development (R&D) →- Identification et définition des problématiques de recherche, pour orienter les projets de manière structurée et scientifique. Définition des hypothèses de travail, avec production de synthèses des modèles utilisés.Knowledge management (KM) →- Création d'un état de l'art sur les statistiques spatiales, séries temporelles, prévisions et Machine Learning appliqué à l'immobilier.- Centralisation, structuration et gestion des connaissances scientifiques, afin de tirer profit des savoirs et faciliter leur réutilisation.
- UNIVERSITE CATHOLIQUE DE LILLE👨🏫 Professor in Datascience / ML / Probability & Statistics 👨🏼🏫BIOTECHJanuary 2023 - January 2025 (2 years)Lille, FranceProgramme de cours – Professeur Vacataire en MathématiquesFondations• 0.1 : Éléments de calcul et outils• 0.2 : Épistémologie et théorie de la connaissancePartie 1 – Théorie des systèmes• 1.1 : Systèmes dynamiques• 1.2 : Systèmes adaptatifs complexesPartie 2 – Dynamique stochastique et probabilités• 2.1 : Théorie de la mesure• 2.2 : Théorie des probabilités• 2.3 : Distributions de probabilité usuelles• 2.4 : Statistiques asymptotiques• 2.5 : Processus stochastiques et séries temporelles• 2.6 : Géométrie de l'informationPartie 3 – Observation des données• 3.1 : Statistiques descriptives• 3.2 : Analyse exploratoire des donnéesPartie 4 – Inférence et théorie de l'estimation• 4.1 : Estimation des paramètres• 4.2 : Conception expérimentale, échantillonnage et tests d'hypothèses• 4.4 : Arbres de décision et sélection de modèles• 4.5 : Inférences bayésiennesPartie 5 – Exemples de modèles linéaires et de régression• 5.1 : Régression linéaire simple• 5.2 : Régression linéaire multiple• 5.3 : Autres méthodes de régressionPartie 6 – Autres exemples de modèles classiques• 6.1 : Tests univariés usuels• 6.2 : Tests multivariés usuels• 6.3 : Statistiques non paramétriquesPartie 7 – Exemples de modèles non linéaires• 7.1 : Modèles graphiques probabilistes• 7.2 : Théorie de la percolation• 7.3 : Statistiques spatiales• 7.4 : Théorie des valeurs extrêmes• 7.5 : Modélisation basée sur les agents• 7.6 : Dynamique des réseauxTechnologies et outils utilisés :MATLAB, R, Python, LaTeX, Jupyter Notebooks, SPSS, SAS, Excel, NumPy, SciPy, Pandas, Matplotlib, TensorFlow, PyTorch, Tableau, Power BI, SQL, GitHub.
Recommendations
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- MASTER in MATHEMATICS and COMPUTER SCIENCE applied to COGNITIVE SCIENCE for BUSINESSLille University2019— Data Science with Python: Machine Learning — Probability — Statistical Linear Models & Regression — English M1 — Web — Computing for Neurocognitive Science — Digital development for Neuropsychology — Philosophy of Mind — Ergonomy & Product design — R programming — Non Parametric Statistics — SAS for datascience — E-marketing — Technology for Psychological Research M2 — Ethics & deontology — Functionnal Neuroscience — Emotionnal Process & Affective neuroscience — Neurocognition — Artificial Neural Networks — Programming for Experimental research — UX design / Product and Experience optimization
- NEW YORK CITY DATA SCIENCE ACADEMYNew York Datascience Academy (NYCDSA)2019— Deep Learning — Statistical models — Hadoop — Spark — AWS — Datavizualizatiuon — Linux system — Advanced SQL — NoSQL — Web Scraping — Time Series Analysis — Reinforcement Learning — Computer Vision — Generalized Linear Models — Tree Methods — Support Vector Machines — Natural Language Processing — Code Optimization — Advanced Phyton — Advanced R