E-commerce – BottleNeck (Openclassroom)
Optimiser la gestion & nettoyez les données du stock d'une boutique
Fictif
|
01/02/2025 > 09/03/2025
Contexte
J’ai rejoint BottleNeck (fictif), marchand de vin, sur une mission pilotée par Nicolas (responsable des ventes) afin d’optimiser la gestion commerciale et le stock. Mon rôle a consisté à agréger les exports ERP, site web et table de liaison, à détecter et corriger les incohérences, puis à fournir des analyses et des recommandations au comité de direction.
Datasets
- Extraction ERP (CSV) : référence produit, prix d’achat, prix de vente, état du stock au 31 octobre (825 lignes x 6 colonnes)
- Extraction site Web (CSV) : SKU, quantités vendues du 1er au 31 octobre 2020, titres, catégories, disponibilité (1513 lignes x 29 colonnes)
- Table de liaison (CSV) : correspondance entre PRODUCT_ID ERP et SKU Web (825 lignes x 2 colonnes)
- Dataset agrégé final : 825 lignes × 35 colonnes, enrichi de colonnes de flag (valeurs négatives, vides, nombres d’erreurs)
Workflow
- Environnement Jupyter Notebook/Python (pandas, numpy, scipy) pour l’ETL et l’EDA.
- Fusion des trois sources par jointures ; détection et sommation des doublons sur TOTAL_SALES.
- Traitement des incohérences :
- Valeurs négatives converties en NaN et flaggées.
- Valeurs manquantes identifiées et comptabilisées.
- Résolution des SKU manquants par correspondance prix/disponibilité.
- Analyses univariées : distribution des prix, détection d’outliers (IQR, z‑score).
- Analyses multivariées : calcul du CA par produit, palmarès 20/80, rotation de stock (mois_disponibles), valorisation financière (STOCK_QUANTITY×PURCHASE_PRICE), taux de marge, corrélations (heatmap).
- Visualisations exploratoires intégrées au notebook pour appuyer les conclusions.
Insights
- 714 doublons initiaux, consolidés par règles métiers (sommation ou priorité).
- 36 outliers détectés via z‑score, 16 via IQR ; prix moyen 32,35 € (écart‑type 26,62).
- CA total : 154 623 € (hors outliers 146 028 €), top 20 articles couvrant 80 % du CA (59 % du catalogue Web).
- Valorisation des stocks : 298 628 € immobilisés pour 17 822 unités en stock.
- Taux de marge moyen par catégorie, identification de produits à marge négative.
- Corrélations : CA_par_article↔TOTAL_SALES (0,60), PRICE↔TOTAL_SALES (0,25), PRICE↔CA_par_article (0,33) ; volume plus déterminant que prix.
Business Impact
Grâce à ce travail, BottleNeck dispose désormais :
- D’un dataset fiable et traçable pour tout futur projet de visualisation.
- D’une compréhension précise des références stratégiques (20/80) pour optimiser portefeuille.
- De recommandations concrètes : ajuster les prix des best‑sellers, réduire progressivement ceux des stocks lents, corriger les SKU manquants et maintenir la qualité des données
- D’un protocole ETL reproductible pour garantir la fiabilité et la traçabilité des processus.





