Quelques exemples de croisements de données afin de lutter contre le changement climatique

Published on November 5, 2015

Les équipes d'Etalab ont travaillé sur quelques exemples de croisements de jeux de données climat afin de vous accompagner dans vos projets

La dernière étape du Climate Change Challenge arrive à grand pas ! A cette occasion, nous avons mis à votre disposition plus de 540 jeux de données autour du climat disponibles sur une page dédiée. Toutefois, conscient du volume important de données à analyser, nous avons décidé de vous donner un petit coup de pouce en vous proposant plusieurs suggestions de croisements de données afin de vous permettre d'alimenter vos projets.

Corrélations possibles entre les principaux jeux de données dans le cadre du C3 Challenge:

Ce CSV vient compléter les données brutes de l’inventaire forestier disponibles sur le site de l’IGN.

En reliant les 2 jeux de données par la variable « Point d’inventaire », on peut obtenir des informations sur la nature des sols et de l’environnement sur 65000 points géolocalisée. Ces indicateurs peuvent être visualisés ou peuvent venir enrichir d’autres données comme celles de la base Eider.

Les contours IRIS ou » Ilots Regroupés pour l’Information Statistique » permettent de découper le territoire Français en 16100 zones de 1800 à 5000 habitants. De nombreux indicateurs INSEE sont disponibles à cette échelle et peuvent être utilisés pour enrichir n’importe quelles données géolocalisées.

La base EIDER regroupe des indicateurs et données environnementales agrégées au niveau régional et national depuis 1985. Une multitude de sujets sont couverts: agriculture, air et émissions atmosphériques, déchets, eau, état de la flore de la faune et des écosystèmes terrestres et marins, forêt, littoral, nuisances sonores, occupation du territoire et paysages, sols, énergie, logement, transport, emplois environnementaux, territoire et population, économie et société, radioactivité, risques naturels et technologiques, tourisme. La couverture globale de ces données permet le croisement avec d’autres sources agrégées telles que les données de consommation énergétiques produites par RTE ou encore les données de modèles météo global de Météo France.

Le fichier geojson de vigicrue permet un aperçu en temps réel du niveau de vigilance crues sur tous les cours d’eau surveillés par le Service de Prévision des Crues (SPC). Des services géolocalisés peuvent être développés au dessus de ce flux de données en temps réel, tel que décrit sur le site Vigicrue

Les données des permis de construire peuvent être agrégées au niveau régional et reliées à divers indicateurs de la base EIDER comme ceux portant sur les risques naturels et technologiques ou sur le tourisme.

Elles peuvent être également enrichies par les données disponibles autour du découpage IRIS effectué par l’INSEE.

Les données de l’Irstea peuvent être reliées au données Vigicrue une fois ces dernières historisées ainsi qu’aux données Meteo France.

Les statistiques de l’énergie Pégase couvrent l’ensemble de la production, distribution et consommation d’énergie en France. Elles peuvent venir compléter les données publiées par RTE et ERDF.

Les données publiées par RTE fournissent une vision très précise de la consommation d’électricité agrégée chaque quart d’heure au niveau nationale. L’origine de l’électricité consommée est également détaillée ainsi que les pays de destination des exportations.

Les données ERDF peuvent venir compléter les données RTE pour donner une vision plus précise de la consommation d’électricité en France. La consommation par catégorie de clientèle est précisée, ainsi que les qualités de fourniture. Ces données peuvent servir à développer des indicateurs autour du réseau de distribution d’électricité en France.

Ces données publiées par l’ADEME comprennent pour chaque modèle de véhicule commercialisé en France les données de puissance, consommation et émissions de co2 et polluants. À la manière du jeu de données « Auto MPG » publié par l’UCI qu’il peut venir compléter, ce jeu de données peut être utilisé pour de multiples travaux de datasciences.

Datasets 10

Reuses 3