Assurance – ESN Data (Openclassroom)

Collecter des données 
en respectant les normes RGPD

Fictif

|

31/12/2024 > 16/01/2025


Contexte

J’ai été missionnée par Dev’Immediat (fictif), un courtier en assurance automobile sanctionné par la CNIL pour non‑conformité RGPD. Clara Daucour (DG) et Jean‑Luc m’ont demandé  :

  • De formuler 5 recommandations de gestion de données CRM pour lever la sanction,
  • D’extraire et anonymiser entièrement les données CRM via SQL et Power Query,
  • De documenter chaque étape du processus d’anonymisation dans un rapport de 10 pages

Datasets

  • Base de données client initiale au format SQLite : une table « CRM_2022_complet » comportant 28 colonnes et 1 157 enregistrements clients.
  • Dictionnaire des données : un fichier décrivant pour chaque colonne son nom, son type de données (VARCHAR, INT, DATE, etc.) et sa description métier.
  • Extraction brute au format CSV : export de la table SQLite vers un fichier CSV de 1 157 lignes de données, utilisé comme source de travail dans Power Query.

Workflow

  • Rédaction des recommandations RGPD (2 pages PDF) en respectant les principes de finalité, minimisation, information, consentement et durée de conservation .
  • Extraction SQL depuis SQLite (SELECT * FROM CRM_2022_complet) puis export CSV.
  • Anonymisation et pré‑traitement dans Microsoft Power Query via code M  :
    • suppression des colonnes sensibles
    • génération d’un UUID
    • regroupement en tranches (revenus, devis, valeur résidence)
    • transformations d’adresses et dates
    • conversion d’attributs en catégories non‑identifiantes
  • Vérifications post‑anonymisation par requêtes SQL ciblées pour garantir unicité des UUID, absence de valeurs identifiantes (revenus arrondis, dates réduites mois/année, codes départementaux) et cohérence des tranches.

Insights

5 recommandations opérationnelles validées pour mise en place immédiate (finalités documentées, collecte minimisée, consentement tracé, information transparente, durées d’archivage).
Fichier CSV anonymisé prêt à l’usage pour l’équipe performance commerciale (UUID unique, 13 colonnes non sensibles, tranches standardisées).
Rapport détaillé (10 pages) explicité en 20 étapes Power Query et SQL pour assurer traçabilité et conformité.
Tests SQL montrant qu’aucune donnée personnelle ne peut être réidentifiée, répondant aux critères de la CNIL.

Business Impact

Grâce à ce projet, Dev’Immediat a pu  :

  • Obtenir la levée de la limitation CNIL en prouvant la conformité RGPD de ses processus,
  • Continuer son activité commerciale sur données anonymisées,
  • Disposer d’un protocole réutilisable pour de futures extractions et collectes de données en toute légalité.

Links

Recommandations

Données

Rapport

Présentation