
Développer un outil analytique qui combine les sorties de plusieurs modèles de prévisions climatiques futures pour identifier et cartographier les risques hygrométriques de précipitation extrême sur le territoire français, tout en évaluant la fiabilité de ces prévisions.
Ce projet a été réalisé dans le cadre du Hackathon "Le climat en données" par BEAUDELAIN Téo, LOISEAU Nicolas, PUIGPINOS Pierre.
Nos défis ciblés :
| Défi | Justification |
|---|---|
| Défi 2 : Territoires et vulnérabilités | Détail des risques hygrométriques des territoires |
| Défi 4 : Qualité des données | Confrontation et mise en lumière des différences entre modèles |
| Défi 7 : Diversité des données | Combinaison de plusieurs modèles prédictifs |
| Défi 8 : Visualisation des données | Restitution par des cartes qui superposent risque et fiabilité |
Comment fournir de nouvelles informations fiabilisées sur l'évolution des précipitations extrêmes à l'aide des modèles de prévision à l'échelle du territoire ?
Appuyer la prise de décision des décideurs locaux et identifier de nouvelles zones à risques en y associant :
un score de fiabilité inter-modèles explicite
une interprétation des données traduite en indicateurs et visualisations des évolutions des précipitations extrêmes.
Pour répondre à notre problématique, nous avons fourni deux axes d'investigation, nommés RRq99refD_Précipitation et RRq99_Fiabilité. Toutes les cartes indiqués sont dans le dossier compressé "cartes-resultats.zip" dans leurs axes respectifs.
RRq99refD_Précipitation : Météorologie Multi-Scénarios
Vue d'ensemble du sous-projet
Cet outil produit l'analyse de données de risques météorologiques de précipitation extrême sous différents scénarios de réchauffement climatique.
Guide d'Interprétation des Graphiques produits
Voici le détail de chaque graphique généré dans le dossier PLOTS.
1_Cartes_Comparatives.png (La Vue d'Ensemble) : Une planche de 4 cartes montrant l'intensité du risque pour chaque scénario (Historique vs +2°C vs +2.7°C vs +4°C).
2_Carte_Hotspots_Top20.png (Le "Worst Case") : Une carte unique focalisée sur le scénario extrême (+4°C). Elle calcule le Delta Absolu (Différence en jours entre +4°C et Aujourd'hui).
3_ECDF.png (Probabilités Cumulées) : La fonction de répartition empirique (Empirical Cumulative Distribution Function).
4_Carte_Pct_Change.png (L'Évolution Relative) : Une carte montrant l'augmentation en pourcentage (($\text{Futur} - \text{Actuel}$) / $\text{Actuel}$).
5_Gradient_Latitudinal.png (Analyse Nord-Sud) : Une courbe moyenne du risque en fonction de la latitude.
6_Boxplot_Deltas.png (Dispersion Statistique) : Des "boîtes à moustaches" montrent la distribution de l'augmentation du nombre de jours (Delta) par scénario.
Données de Sortie (Exports)
Le script génère un fichier clé pour la prise de décision dans le dossier RAPPORTS : TOP50_Zones_Critiques.csv
Il contient les coordonnées (Lat/Lon) et l'ID des 50 points ayant la plus forte augmentation absolue de jours de risque.
RRq99_Fiabilité : S’assurer de la qualité des données
Vue d'ensemble du sous-projet
Les modèles climatiques régionaux (notamment les projections TRACC sur l'indicateur RRq99) anticipent une modification significative de la répartition géographique des pluies extrêmes sur le territoire métropolitain. La problématique centrale de notre étude a été d'évaluer la robustesse et la crédibilité de ces projections. Notre approche méthodologique pour juger de cette fiabilité a consisté à comparer directement les sorties des modèles en affichant l'amplitude de la différence de prédiction entre deux trajectoires climatiques distinctes : +2°C et +4°C de réchauffement global.
Interprétation
L'analyse du scénario de réchauffement climatique +4°C par rapport au scénario +2°C ne confirme pas uniformément les tendances attendues.
Divergence Nord-Ouest : Contrairement à une attente d'amplification des tendances, la comparaison des deux scénarios révèle une tendance à la baisse de la fréquence ou de l'intensité des pluies extrêmes dans la zone Nord-Ouest.
Fiabilité Géographique Limitée : Dans le Sud de la France, région particulièrement sujette aux pluies extrêmes (épisodes méditerranéens/cévenols), la présence d'un bruit important dans les données indique un manque de fiabilité (ou une forte incertitude) du modèle sur ces zones géographiques clés.
Ces résultats rendent difficile la prévision d'une augmentation ou d'une diminution claire des pluies extrêmes. L'hétérogénéité et le bruit des signaux soulèvent de sérieuses questions quant à la fiabilité des modèles climatiques pour anticiper ces phénomènes météorologiques localisés et intenses dans les zones d'intérêt spécifiques.
Conclusion
Il est couramment admis que le réchauffement climatique pourrait intensifier les pluies extrêmes et les épisodes méditerranéens. Or, ce modèle spécifique ne soutient pas cette tendance générale. Au-delà des tendances elles-mêmes (augmentation ou diminution), la principale question qui se pose est celle de la robustesse et de la fiabilité des modèles pour représenter de manière crédible l'évolution de ces phénomènes localisés dans un climat changeant.
Quel usage est fait des données ? Que vous permettent-elles de faire ?
Nous avons choisi d'utiliser les données issues de TRACC 2023, acronyme de Trajectoire de Réchauffement de Référence pour l’Adaptation au Changement Climatique.
C'est une référence unique et reconnue par les politiques publiques françaises pour guider l'adaptation. En l'utilisant, nous nous assurons que notre travail repose sur un socle de modèles validés et cohérents. Il nous fournit un panel multi-modèles complet pour toutes les variables nécessaires, y compris les précipitations.
TRACC offre des jeux de données très lourds (séries temporelles) et des jeux de données plus légers (moyennes agrégées). Pour respecter les contraintes de temps et de puissance de calcul propres à ce hackathon, nous avons fait le choix stratégique d'utiliser les données plus légères, basées sur des moyennes ou des statistiques agrégées. Cela nous permet de calculer rapidement nos indicateurs de risque et de fiabilité sur des périodes de projection clés, sans sacrifier la validité de l'approche multi-modèles.
Nous avons pris quatre sous-dossiers de ce modèle, où chacun correspond à un scénario différent de réchauffement de température dans le temps.
Pour chaque sous-dossier, deux fichiers CSV ont été retenus :
RRq99 : Valeur du $99^\text{e}$ centile des précipitations quotidiennes.
RRq99refD : Nombre de jours avec des précipitations quotidiennes supérieures au $99^\text{e}$ centile des précipitations lors des jours pluvieux ($> 1 \text{mm}$) sur la période de référence.
De ces informations, nous avons produit deux bases de données qui sont intégrées dans un axe propre :
Axe RRq99_Fiabilité (fichiers RRq99) : Évaluer la fiabilité inter-modèle.
Axe RRq99refD_Précipitation (fichiers RRq99refD) : Évolution des précipitations selon les scénarios et identification des zones à risques.
Quelle est la méthode de création de la solution ?
Nous nous sommes basés sur des analyses statistiques classiques avec des librairies Python et Git pour partager et sauvegarder nos données.
Problématique
Analyser les précipitations extrêmes (RRq99) en France, produire des supports visuels d’aide à l’interprétation, et évaluer la fiabilité inter-modèle à partir de plusieurs scénarios climatiques.
Identification des scénarios et des données
Détection automatique des scénarios climatiques : Historique, $+2^\circ\text{C}$, $+2.7^\circ\text{C}$, $+4^\circ\text{C}$.
Source principale : TRACC 2023.
Import automatique des fichiers CSV pertinents et exclusion des fichiers auxiliaires.
AXE 1 — RRq99refD_Précipitation
(Analyse et visualisation des précipitations extrêmes)
Préparation / Nettoyage des données
Normalisation des coordonnées (Point, Latitude, Longitude).
Conversion des durées en jours.
Suppression des lignes invalides.
Fusion des scénarios (outer join) et imputation des valeurs manquantes.
Structuration analytique
Passage au format long.
Calcul :
des deltas absolus,
des variations relatives ($%$),
des profils latitudinaux,
des distributions cumulées (ECDF).
Visualisations
Cartes comparatives multi-scénarios (échelle colorimétrique verrouillée).
Hotspots ($+4^\circ\text{C}$ vs Historique).
Profils zonaux latitudinaux.
Boxplots de dispersion entre scénarios.
Indicateurs clés – RRq99refD_Précipitation
Classement des points les plus impactés.
Extraction du Top 50 des zones critiques.
Export structuré des tableaux et des figures.
AXE 2 — RRq99_Fiabilité
(Évaluation de la cohérence inter-modèle)
Contrôle qualité des données
Vérification des anomalies et valeurs incohérentes.
Harmonisation des formats.
Validation des imputations.
Analyse de fiabilité inter-modèle
Comparaison des écarts entre les différents modèles/scénarios.
Analyse de la variabilité spatiale des deltas.
Identification des zones robustes vs zones incertaines.
La solution permet d'identifier les zones les plus susceptibles d'être touchées par des précipitations extrêmes avec un niveau de confiance inter-modèles sur le territoire français.
Tout acteur intéressé par l'hygrométrie locale, son évolution et sa fiabilité est visé par notre problématique. Pour plus de précision et avoir une visualisation concrète, voici un tableau non exhaustif de différents acteurs pouvant être intéressés :
| Acteurs visés | Bénéfices |
|---|---|
| Collectivités Territoriales | Indicateur pour des investissements et une planification proactive (infrastructure de drainage, bassins de rétention, ...). |
| Entreprises saisonnières (ex: stations de ski) | S'appuyer sur la fiabilité et la visualisation combinée pour l'impact sur les besoins saisonniers. |
| Secteur Agricole | Choisir des cultures plus adaptées au nouveau régime de pluies (fréquence et intensité). |
| Compagnies d'Assurance et Banques | Meilleure évaluation des risques à long terme et des assurances à proposer localement. |
Les données ont été tirées du dépôt meteofrance-drias de data.gouv.
Plus précisément, les données utilisées de ce dépôt proviennent de /TRACC-2023/CSV\_wk\_03202/ :
Indicateurs-Absolue\_Centiles-Explore2-Climat\_Moyenne-20ans\_historical\_csv/
RRq99refD\_yr\_historical\_TIMEavg\_GEOxy\_FR-Metro\_EXPLORE2-2022\_MF-ADAMONT\_rcp85\_ENSmax.csv
RRq99\_yr\_historical\_TIMEavg\_GEOxy\_FR-Metro\_EXPLORE2-2022\_MF-ADAMONT\_rcp85\_ENSmax.csv
Indicateurs-Absolue\_Centiles-Explore2-Climat\_Moyenne-20ans\_RWL20\_csv/
RRq99refD\_yr\_RWL-20\_TIMEavg\_GEOxy\_FR-Metro\_EXPLORE2-2022\_MF-ADAMONT\_rcp85\_ENSmax.csv
RRq99\_yr\_RWL-20\_TIMEavg\_GEOxy\_FR-Metro\_EXPLORE2-2022\_MF-ADAMONT\_rcp85\_ENSmax.csv
Indicateurs-Absolue\_Centiles-Explore2-Climat\_Moyenne-20ans\_RWL27\_csv/
RRq99refD\_yr\_RWL-27\_TIMEavg\_GEOxy\_FR-Metro\_EXPLORE2-2022\_MF-ADAMONT\_rcp85\_ENSmax.csv
RRq99\_yr\_RWL-27\_TIMEavg\_GEOxy\_FR-Metro\_EXPLORE2-2022\_MF-ADAMONT\_rcp85\_ENSmax.csv
Indicateurs-Absolue\_Centiles-Explore2-Climat\_Moyenne-20ans\_RWL40\_csv/
RRq99refD\_yr\_RWL-40\_TIMEavg\_GEOxy\_FR-Metro\_EXPLORE2-2022\_MF-ADAMONT\_rcp85\_ENSmax.csv
RRq99\_yr\_RWL-40\_TIMEavg\_GEOxy\_FR-Metro\_EXPLORE2-2022\_MF-ADAMONT\_rcp85\_ENSmax.csv
Livrables & Dépôt de code
Les dossiers et fichiers produits dans le github seront aussi ajoutés dans un dossier compressé de ce rendu.
Non.
Consolider les différents fichiers : Arrondir et prétraiter certaines données pour normaliser les colonnes et les données. Certaines données de coordonnées n’étaient présentes que sur un seul fichier, d’autres n'étaient pas valides.
(Section vide dans l'original. Aucune correction nécessaire.)
Notre travail étant limité dans le temps du fait du cadre posé par le Hackathon "Le climat en données", nous avons aussi travaillé sur d'autres éléments et trouvé d'autres idées en relation avec notre problématique qui n'ont pas abouti mais qui peuvent être exploitées ultérieurement.
Déplacement des zones agricoles
Une de nos idées était de reprendre ces études statistiques pour démontrer le changement climatique qui déplacerait les zones de cultures les plus menacées ou amenées à se déplacer. En croisant nos données climatiques futures avec des informations agronomiques précises (exigences thermiques et hydriques des cultures, types de sols, topographie), il devient possible d'établir des cartes de vulnérabilité et de potentiel agricole.
Ceci est particulièrement pertinent pour des filières comme le vignoble. Nous pourrions ainsi délimiter les zones où les conditions climatiques futures (chaleur excessive et érosion due aux pluies intenses) rendront la culture du raisin non viable, tout en identifiant simultanément les nouveaux terroirs émergents situés plus au nord ou en altitude. Cette approche permet de transformer des statistiques climatiques en une feuille de route stratégique pour l'adaptation agricole.
Amélioration de la fiabilité inter-modèles
Une piste essentielle serait de renforcer la crédibilité des cartes produites en combinant plusieurs familles de modèles climatiques plutôt que de s’appuyer sur un seul. En intégrant des jeux de données issus de TRACC, EURO-CORDEX et CMIP6, puis en analysant leur dispersion, il devient possible de construire un véritable indice de fiabilité. Cette approche permettrait d’identifier clairement les zones où les modèles convergent fortement (zones robustes) et celles où, au contraire, les projections divergent (zones incertaines).
Par exemple, si dix modèles indiquent tous une hausse de 10 à 12 jours de pluie extrême, la confiance dans la prévision est élevée ; mais si certains annoncent $+2$ jours et d’autres $+25$, la zone doit être traitée différemment. Ce travail offrirait une lecture beaucoup plus rigoureuse et exploitable de l’information climatique.
Analyse avancée des incertitudes
Aujourd’hui, les cartes montrent surtout des valeurs moyennes, mais une équipe reprenant le projet pourrait enrichir profondément leur interprétation en intégrant des fourchettes de valeurs (minimum, maximum, médiane). Montrer ces marges d’incertitude permettrait d’éviter les mauvaises interprétations, notamment dans les zones où les modèles sont instables.
Par exemple, deux secteurs affichent $+12$ jours de pluie extrême à l’horizon 2050 : dans l’un, la fourchette va de $+11$ à $+14$ (faible incertitude), dans l’autre elle s’étend de $+3$ à $+21$ (forte incertitude). Ces deux situations n’ont rien de comparable, et les représenter clairement aiderait à distinguer les signaux fiables des signaux fragiles. L’objectif est de rendre visibles les limites des modèles afin de mieux hiérarchiser les risques.
Enrichissement des indicateurs hydrologiques
Le projet se concentre actuellement sur une mesure principale (RRq99), mais le risque hydrologique réel ne dépend pas uniquement des pluies extrêmes. Une équipe pourrait enrichir considérablement l’analyse en ajoutant d’autres indicateurs utilisés en climatologie, comme les jours $> 10 \text{mm}$ ou $> 20 \text{mm}$, la contribution des pluies les plus intenses (R95p et R99p) ou encore l’intensité moyenne des jours de pluie.
L’intérêt devient évident lorsqu’on considère que $50 \text{mm}$ tombant en milieu urbain peuvent provoquer une inondation rapide, alors que ces mêmes $50 \text{mm}$ seraient absorbés en zone forestière. En croisant les extrêmes de pluie avec l’occupation des sols ou la perméabilité, l’analyse passerait d’un simple constat météorologique à une évaluation plus fidèle du risque de ruissellement et d’inondation.
Création d’un outil interactif
Les cartes statiques sont utiles, mais une version interactive offrirait une valeur ajoutée importante. Un tableau de bord permettant de choisir un scénario, une année ou un indicateur rendrait la consultation beaucoup plus intuitive.
Un utilisateur pourrait, par exemple, cliquer sur une commune et obtenir immédiatement : le nombre de jours de pluie extrême prévu, l’évolution par rapport à aujourd’hui, et surtout le niveau de fiabilité associé. Une bascule “avant / après” permettant de comparer les scénarios $+2^\circ\text{C}$ et $+4^\circ\text{C}$ faciliterait également une lecture directe de l’évolution du risque. Ce type d’outil transforme l’analyse en un support d’aide à la décision réellement accessible.
Documentation et automatisation de la chaîne d’analyse
Pour qu’un groupe reprenne le projet facilement, une forte valeur ajoutée consiste à documenter chaque étape : importation des données, traitement, calcul des indices, production des cartes. Des scripts automatisés permettraient de régénérer l’ensemble des résultats en un seul lancement.
Un exemple concret serait un carnet Jupyter montrant pas à pas comment on part des fichiers bruts pour obtenir les cartes finales. Cela rendrait le projet non seulement reproductible, mais aussi adaptable à de nouveaux modèles ou à de futures données climatiques sans effort supplémentaire.
Métadonnées :
3K
820
1
0
Il n'y a pas d'autres réutilisations du même créateur.