Assurance – ESN Data (Openclassroom)

Requêter une base de données avec SQL

Fictif

|

14/12/2024 > 30/12/2024


Contexte

J’ai réalisé ce projet pour ESN Data (fictif), dans le cadre de ma formation de Business Intelligence Analyst. L’objectif était de créer et gérer une base de données relationnelle afin d’analyser le marché des assurances habitation en France. J’ai aidé une entreprise d’assurance fictive à structurer ses données, charger un jeu de contrats et un référentiel géographique, puis à rédiger des requêtes SQL pour en extraire des indicateurs clés.

Datasets

  • CONTRAT.CSV – 30 335 contrats d’assurance habitation (11 attributs)
  • REGION.CSV – 38 916 paires département‑commune (7 attributs)

Workflow

  • Exploration et dictionnaire des données dans Excel (types, contraintes, descriptions).
  • Modélisation UML puis schéma relationnel via SQL Power Architect.
  • Import des CSV dans MySQL (nettoyage d’incohérences via VLOOKUP).
  • Rédaction de 12 requêtes SQL (SELECT, JOIN, agrégations, ORDER BY, fonctions AVG/COUNT).

Insights

  • 5 contrats avec les plus grandes surfaces : entre 559 m² et 815 m².
  • Cotisation mensuelle moyenne : 19 € par mois.
  • Répartition des valeurs déclarées : majorité  100 000 €.
  • Formules “Integral” en Pays de la Loire : 589 occurrences.
  • Maisons dans le département 71 : 48 contrats, équitablement répartis entre formules classique et intégrale.
  • Surface moyenne à Paris : 52 m².
  • Top 10 départements par cotisation moyenne : Paris (36 €), Hauts‑de‑Seine (26 €), Val‑de‑Marne (20 €), etc.
  • Commune la plus couverte : Paris.
  • Région la plus active : Île‑de‑France (14 177 contrats).

Ces résultats mettent en évidence la forte concentration des contrats en Île‑de‑France, les écarts de cotisation selon les zones géographiques et le profil des biens assurés.

Business Impact

Grâce à ce projet, j’ai développé une maîtrise opérationnelle de la conception de base de données et du requêtage SQL, compétences essentielles pour un BI Analyst. Les insights obtenus peuvent être exploités par l’assureur pour :

  • Prioriser des offres adaptées aux zones à forte cotisation (ex. Paris).
  • Ajuster les formules selon la répartition des valeurs déclarées.
  • Cibler des campagnes de prospection sur les communes sous‑couvertes.

En interne, ces livrables (schéma, code SQL, captures d’écran) serviront de référence pour des analyses futures et faciliteront la prise de décision business.

Links

Document technique

Liste des analyses

Méthodologie