DPE Logements existants (depuis juillet 2021)
Métadonnées :
21K
4K
28
1

Contexte :
Ce projet a été réalisé dans le cadre :
Du défi public Enedis — Diagnostics de Performance Énergétique proposé sur la plateforme data.gouv
D’une formation professionnelle Data Scientist au sein de l’Icam
Objectif général : explorer les écarts entre les estimations conventionnelles du DPE et les consommations électriques réellement observées, à partir de données publiques massives.
Objectifs :
Comparer la consommation énergétique conventionnelle issue du DPE avec la consommation électrique réelle mesurée par Enedis
Quantifier les écarts selon les caractéristiques du bâti, les systèmes énergétiques et le contexte climatique
Développer un modèle de prédiction de consommation électrique basé uniquement sur les données descriptives du DPE
Mettre à disposition une application interactive de simulation et d’exploration
Données utilisées :
Données DPE (ADEME) — diagnostics énergétiques logement
Données Enedis — consommations électriques agrégées par adresse
Base Adresse Nationale (BAN) — géocodage et jointure spatiale
Méthodologie :
Collecte :
Téléchargement via APIs publiques paginées (ADEME, Enedis)
Requêtes commune par commune (code INSEE)
Écriture incrémentale en fichiers Parquet
Système de checkpoint pour reprise automatique
Ingestion & stockage :
Ingestion batch dans DuckDB
Gestion automatique du schéma évolutif
Consolidation en tables analytiques jointes
Préparation & enrichissement :
Nettoyage des valeurs aberrantes
Déduplication des DPE (diagnostic le plus récent)
Filtrage surfaces / consommations extrêmes
Géocodage BAN (~96 % des adresses)
Jointure spatiale DPE ↔ Enedis via id_ban
Feature engineering :
Type de chauffage principal
Typologies bâtimentaires
Agrégations statistiques
Modélisation :
Modèles testés :
Random Forest
XGBoost
LightGBM
CatBoost
Modèle retenu : Random Forest
Performances :
R² ≈ 0.78
MAE ≈ 8.8 kWh/m²/an
Conso réelle moyenne : ≈ 46 kWh/m²/an
Le modèle estime la consommation électrique attendue à partir :
Caractéristiques du bâti
Systèmes énergétiques
Zone climatique
Qualité d’information disponible
Application interactive :
Une application Streamlit a été développée pour permettre :
Exploration des écarts DPE vs réel
Simulateur de consommation électrique
Métadonnées :
21K
4K
28
1
Métadonnées :
27K
8K
13
2
Il n'y a pas encore d'API associées