La liste des publications qui ont retenu notre attention le mois dernier.
Suivi des sorties — Septembre 2019

Vous lisez l’édition de septembre 2019 du suivi des sorties ; un article dans lequel nous partageons les publications qui ont retenues notre attention — qu’il s’agisse de jeux de données, de réutilisations, d'outils ou d’articles parus ailleurs sur le web.

Jeux de données à suivre

Les données des finances publiques locales de 2019

Que peut-on dire de la situation financière et de la gestion des collectivités territoriales françaises ? Chaque année, la Cour des comptes publie deux rapports sur les finances des collectivités locales. Le premier, publié en juin, est consacré à l’analyse financière de l’année précédente. Le second, publié en septembre, explore les perspectives financières des collectivités territoriales et questionne leur gestion. À l'occasion de la publication de ces rapports, la Cour des comptes publie également en open data les données utilisées pour réaliser son analyse. Ces données peuvent être réutilisées afin de mener des analyses complémentaires ou encore orienter la mise en oeuvre de politiques publiques.

Consulter le jeu de données relatif à l'année 2018

Consulter le jeu de données relatif à l'année 2019

Consulter le rapport relatif à l'année 2018

Consulter le rapport relatif à l'année 2019

Les données carroyées de l'INSEE

Afin d'apporter des informations statistiques sur une population dans un territoire donné, l'Institut National de la Statistique et des Etudes Economiques (Insee) procède au carroyage du territoire.

Qu'est-ce que le carroyage ? Le carroyage est une technique de quadrillage consistant à découper le territoire en carreaux pour y diffuser de l’information statistique à un niveau faiblement agrégé. Le maillage du territoire qui en résulte est plus ou moins fin selon la taille de carreau choisie. Les carreaux permettent de s’affranchir des limites administratives habituelles et peuvent être assemblés pour construire ou approcher n’importe quel zonage à façon.

Pour chaque carreau délimité par l'INSEE, 26 variables sur la structure par âge des individus, sur les caractéristiques des ménages et des logements et sur les revenus perçus au cours de l’année 2015 sont proposées. La mise à disposition de ces données est fondamentale pour les acteurs publics ou privés qui souhaitent analyser l'évolution démographique et économique du territoire, afin d'améliorer la mise en œuvre des politiques publiques ou proposer de nouveaux services.

Consulter les données

Les données d'achat de pesticides par code postal

Les déclarations d'achats de produits phytosanitaires par code postal ont été publiées en open data par le Système d'information sur l'eau (SIE).

Qu'est-ce qu'un produit phytosanitaire ? Les produits phytosanitaires servent à détruire des végétaux indésirables (herbicides), à protéger des plantes (fongicides, insecticides), à agir sur leurs processus vitaux sans être des substances nutritives (régulateurs de croissance) et à conserver les récoltes. Certains de ces produits sont dangereux et appartiennent aux catégories classées toxiques, très toxiques, cancérigènes, mutagènes, reprotoxiques et dangereuses pour l'environnement.

Compte-tenu du danger que peuvent représenter ces produits, les distributeurs agréés de produits phytosanitaires sont tenus de déclarer la quantité de produits vendus. Ce sont ces déclarations, stockées dans la Banque nationale des ventes de produits phytosanitaires (BNV-D), qui sont mises à disposition en open data. À partir de ces déclarations, les distributeurs agrées sont soumis au paiement d'une redevance pour pollution diffuse.

Consulter les données

L'annuaire des déchèteries et les tonnages des déchets ménagers assimilés

L'amélioration de la prévention, de la gestion et du recyclage des déchets est une composante clé d'une transition vers une économie circulaire, dont l'objectif est de produire des biens et des services de manière durable.

Afin de faciliter le tri des déchets et leur recyclage, l'Agence de l'Environnement et de la Maîtrise de l'Energie met à disposition l'annuaire détaillé des déchèteries situées en France et régions/départements d'outre-mer. Ces données pourront être réutilisées par des acteurs privés ou publics afin que des services d'accompagnement des usagers dans la gestion de leurs déchets soient proposés.

Consulter les données

La transition vers une économie circulaire s'appuie également sur la connaissance et la compréhension du volume de déchets collectés et traités. Pour ce faire, l'Agence de l'Environnement et de la Maîtrise de l'Energie publie en open data les tonnages des déchets ménagers assimilés (hors gravats) collectés en France et régions/départements d'outre-mer.

Consulter les données

Les données extraites du bulletin officiel des annonces des marchés publics

La commande publique représente près de 8% de notre PIB. Sa transparence et son ouverture à l'ensemble des citoyens est indispensable pour l'économie et l'innovation.

Le processus de passation de marché se compose de plusieurs étapes : la planification du marché, l'appel d'offre, l'attribution, le contrat et l'exécution du marché. Conformément à l'arrêté du 27 juillet 2018, les 70 000 acheteurs publics français sont tenus de publier les données d'attribution de leurs marchés publics, appelées données essentielles. Les données essentielles sont aujourd'hui consultables sur data.gouv.fr.

Pour autant, la publication des données relatives aux autres étapes du processus de marché est cruciale. La phase de lancement des appels d'offre l'est particulièrement, puisque les annonces de marchés publics sont diffusées durant cette étape. La mise en valeur de ces annonces est un élément clé de la démocratisation de l'accès aux marchés publics.

Une partie de ces annonces de marchés est publiée dans le bulletin officiel des annonces des marchés publics (BOAMP). En plus de publier les avis de concession ; les avis d’attribution et les contrats de partenariats public-privé (c'est-à-dires les données d'attribution de marché), le BOAMP met à disposition les avis d’appels publics à la concurrence (AAPC) nationaux et européens ainsi que les avis divers lancés par l’État autres organisations chargées d'une mission de service public. À noter que l'ensemble de ces publications couvre uniquement les marchés publics dont le montant est supérieur à 90 000e HT. En dessous de ce seuil, la publication des annonces de marché reste libre.

Afin de rendre accessible ces données dans un format aisément réutilisable par une machine, AuFilDuBoamp publie quotidiennement les données diffusées sur le site du BOAMP dans un format CSV.

Consulter les données

API mises à disposition

Les lieux et horaires des collectes de sang

Chaque jour, les besoins pour soigner les malades nécessitent plus de 10 000 dons de sang. Ces besoins sont quotidiens et ont fortement augmenté au cours des quinze dernières années. Afin d'organiser et de faciliter le prélèvement de sang sur des donneurs, l'Établissement français du sang (EFS) met à disposition une API qui référence l'ensemble des lieux de prélèvement de l'EFS ainsi que les horaires et dates des collectes qui y sont effectuées.

Consulter l'API

Le registre parcellaire graphique

Le Registre Parcellaire Graphique (RPG) est mis à disposition de manière annuelle par l'Institut National de l'Information Géographique et Forestière (IGN). Afin de faciliter l'accès à la base de données et d'automatiser son téléchargement, Christian Quest a développé une API qui permet de requêter rapidement les données.

Consulter l'API

Réutilisations

Les régions de France les plus exposées aux pesticides les plus toxiques

Les régions de France les plus exposées aux pesticides les plus toxiques

Quelles régions de France sont les plus exposées aux pesticides les plus toxiques ? Pour répondre à cette question, le journal Le Monde a réutilisé les données publiées en open data par le Système d’information sur l’eau, le ministère de l’agriculture et de l’alimentation et l'Agence nationale de sécurité sanitaire de l'alimentation, de l'environnement et du travail. À partir de ces données, Le Monde propose une carte qui permet de visualiser l'intensité du recours à des pesticides par commune.

Lire l'article

Data.pour.paris

La ville de Paris met à disposition de nombreuses données en open data sur ses infrastructures, ses évènements ou encore l'activité de ses habitants. Benjamin Tran Dinh a lancé data.pour.paris, un site qui exploite les données publiées afin de les rendre accessibles à tous. Ce mois-ci, il a notamment publié :

Outils

CSV Detective API

Plus de 20 000 fichiers CSV sont référencés ou stockés dans le catalogue de data.gouv.fr. Détecter si dans ces CSVs se trouve, par exemple un code SIRET, un code SIREN, un code postal ou un code de département, pourrait notamment permettre de relier rapidement des jeux de données en fonction de leurs colonnes, améliorer le moteur de recherche de data.gouv.fr, ou encore de proposer des jeux de données de référence afin de contextualiser les données.

À cette fin, l'outil CSV Detective API reprend CSV Detective, initialement développé par Etalab, l’améliore, lui ajoute une API et propose une version basée sur du machine learning, plus rapide et plus performante qu'un système classique de règles. L’interface Web est disponible sur csvdetective.etalab.studio.

Commentaires sur cet article.