DPE Électricité — Analyse & Simulation

0

0

Description

Contexte :

Ce projet a été réalisé dans le cadre :

  • Du défi public Enedis — Diagnostics de Performance Énergétique proposé sur la plateforme data.gouv

  • D’une formation professionnelle Data Scientist au sein de l’Icam

Objectif général : explorer les écarts entre les estimations conventionnelles du DPE et les consommations électriques réellement observées, à partir de données publiques massives.

Objectifs :

  • Comparer la consommation énergétique conventionnelle issue du DPE avec la consommation électrique réelle mesurée par Enedis

  • Quantifier les écarts selon les caractéristiques du bâti, les systèmes énergétiques et le contexte climatique

  • Développer un modèle de prédiction de consommation électrique basé uniquement sur les données descriptives du DPE

  • Mettre à disposition une application interactive de simulation et d’exploration

Données utilisées :

  • Données DPE (ADEME) — diagnostics énergétiques logement

  • Données Enedis — consommations électriques agrégées par adresse

  • Base Adresse Nationale (BAN) — géocodage et jointure spatiale

Méthodologie :

Collecte :

  • Téléchargement via APIs publiques paginées (ADEME, Enedis)

  • Requêtes commune par commune (code INSEE)

  • Écriture incrémentale en fichiers Parquet

  • Système de checkpoint pour reprise automatique

Ingestion & stockage :

  • Ingestion batch dans DuckDB

  • Gestion automatique du schéma évolutif

  • Consolidation en tables analytiques jointes

Préparation & enrichissement :

  • Nettoyage des valeurs aberrantes

  • Déduplication des DPE (diagnostic le plus récent)

  • Filtrage surfaces / consommations extrêmes

  • Géocodage BAN (~96 % des adresses)

  • Jointure spatiale DPE ↔ Enedis via id_ban

  • Feature engineering :

    • Type de chauffage principal

    • Typologies bâtimentaires

    • Agrégations statistiques

Modélisation :

Modèles testés :

  • Random Forest

  • XGBoost

  • LightGBM

  • CatBoost

Modèle retenu : Random Forest

Performances :

  • R² ≈ 0.78

  • MAE ≈ 8.8 kWh/m²/an

  • Conso réelle moyenne : ≈ 46 kWh/m²/an

Le modèle estime la consommation électrique attendue à partir :

  • Caractéristiques du bâti

  • Systèmes énergétiques

  • Zone climatique

  • Qualité d’information disponible

Application interactive :

Une application Streamlit a été développée pour permettre :

  • Exploration des écarts DPE vs réel

  • Simulateur de consommation électrique

Thématique
Environnement et énergie
Type
Application
Mots clés
opendatauniversity
Dernière mise à jour
9 février 2026
Date de création
9 février 2026

Vues

3 jeux de données associés

Il n'y a pas encore d'API associées