E-commerce – BottleNeck (Openclassroom)

Optimiser la gestion & nettoyez les données 
du stock d'une boutique

Fictif

|

01/02/2025 > 09/03/2025


Contexte

J’ai rejoint BottleNeck (fictif), marchand de vin, sur une mission pilotée par Nicolas (responsable des ventes) afin d’optimiser la gestion commerciale et le stock. Mon rôle a consisté à agréger les exports ERP, site web et table de liaison, à détecter et corriger les incohérences, puis à fournir des analyses et des recommandations au comité de direction.

Datasets

  • Extraction ERP (CSV) : référence produit, prix d’achat, prix de vente, état du stock au 31 octobre (825 lignes x 6 colonnes)
  • Extraction site Web (CSV) : SKU, quantités vendues du 1er au 31 octobre 2020, titres, catégories, disponibilité (1513 lignes x 29 colonnes)
  • Table de liaison (CSV) : correspondance entre PRODUCT_ID ERP et SKU Web (825 lignes x 2 colonnes)
  • Dataset agrégé final : 825 lignes × 35 colonnes, enrichi de colonnes de flag (valeurs négatives, vides, nombres d’erreurs)

Workflow

  • Environnement Jupyter Notebook/Python (pandas, numpy, scipy) pour l’ETL et l’EDA.
  • Fusion des trois sources par jointures ; détection et sommation des doublons sur TOTAL_SALES.
  • Traitement des incohérences  :
    • Valeurs négatives converties en NaN et flaggées.
    • Valeurs manquantes identifiées et comptabilisées.
    • Résolution des SKU manquants par correspondance prix/disponibilité.
  • Analyses univariées : distribution des prix, détection d’outliers (IQR, z‑score).
  • Analyses multivariées : calcul du CA par produit, palmarès 20/80, rotation de stock (mois_disponibles), valorisation financière (STOCK_QUANTITY×PURCHASE_PRICE), taux de marge, corrélations (heatmap).
  • Visualisations exploratoires intégrées au notebook pour appuyer les conclusions.

Insights

  • 714 doublons initiaux, consolidés par règles métiers (sommation ou priorité).
  • 36 outliers détectés via z‑score, 16 via IQR ; prix moyen 32,35 € (écart‑type 26,62).
  • CA total : 154 623 € (hors outliers 146 028 €), top 20 articles couvrant 80 % du CA (59 % du catalogue Web).
  • Valorisation des stocks : 298 628 € immobilisés pour 17 822 unités en stock.
  • Taux de marge moyen par catégorie, identification de produits à marge négative.
  • Corrélations : CA_par_article↔TOTAL_SALES (0,60), PRICE↔TOTAL_SALES (0,25), PRICE↔CA_par_article (0,33) ; volume plus déterminant que prix.

Business Impact

Grâce à ce travail, BottleNeck dispose désormais  :

  • D’un dataset fiable et traçable pour tout futur projet de visualisation.
  • D’une compréhension précise des références stratégiques (20/80) pour optimiser portefeuille.
  • De recommandations concrètes : ajuster les prix des best‑sellers, réduire progressivement ceux des stocks lents, corriger les SKU manquants et maintenir la qualité des données
  • D’un protocole ETL reproductible pour garantir la fiabilité et la traçabilité des processus.

Links

Notebook (EDA)

Présentation