Retour sur les activités de data.gouv.fr en 2020

Published on 15 de febrero de 2021

Découvrez les travaux réalisés en 2020 par l'équipe de data.gouv.fr !

Un record de fréquentation

Nous mettions en avant dans le bilan 2019 une audience et des usages en forte croissance. Ce mouvement s'est confirmé en 2020.
La fréquentation de data.gouv.fr a atteint un record absolu avec un pic au mois de novembre 2020 lors duquel la plateforme a accueilli 2 305 255 visiteurs uniques.

Ces chiffres s'expliquent en grande partie par l'intérêt du public pour les données relatives à la COVID-19 mises à disposition sur data.gouv.fr, comme en atteste le top 5 des jeux de données sur 2020 :

Les réutilisations les plus populaires concernent également la COVID-19. Les différentes applications permettant de mesurer un périmètre autour de soi pendant les périodes de confinement (1km, 20km, 100km) ont été particulièrement plébiscitées .

Les usages de la plateforme ont également connu une hausse importante. De nombreux jeux de données et réutilisations ont été publiés en 2020.

De nombreuses nouvelles données

Une année marquée par la crise sanitaire

Pour répondre aux exigences de transparence et de pilotage informé de la crise sanitaire, de nombreuses données relatives à l'épidémie ont été publiées.

Tout d'abord des données relatives aux tests et aux sites de prévelements ainsi que des données hospitalières, sur les hospitalisations, la situation en réanimation, les décès ou encore les transferts de patients.

Les indicateurs de suivis (taux d'incidence, de positivité, facteur de reproduction du virus...) sur lesquels les autorités s'appuient ont également été publiés.

Mais bien d'autres données ont été mises à disposition comme les données sur les aides aux entreprises (fonds de solidarité, activité partielle, report d'échéances fiscales...), des données relatives à la recherche ou encore les métriques d'utilisation de l'application TousAntiCovid.

Les territoires n'ont pas été en reste en publiant de nombreuses données sur les mesures de politiques publiques territoriales (aménagement cyclable temporaire ou distributeurs de gel hydroalcoolique par exemple) et sur l'impact du confinement (commerce restant ouvert par exemple).

L’effort d’ouverture des données relatives à l’épidémie de la Covid-19 se poursuit en 2021. Avec le lancement de la campagne de vaccination contre le virus, des efforts significatifs ont été réalisés pour apporter la plus grande transparence sur le dispositif. Sont ainsi publiées sur la plateforme des données publiques data.gouv.fr les données relatives aux vaccinations, aux prises de rendez-vous, aux livraisons des doses et aux stocks de doses en fonction des établissements.

Voir les principales données relatives au COVID-19 sur data.gouv.fr

Afin de rendre ces données accessibles et compréhensibles pour le plus grand nombre, les informations sont valorisées dans le tableau de bord Covid-19 publié sur gouvernement.fr. Il est possible d’y visualiser l’ensemble des indicateurs de suivi de l’épidémie, assurant ainsi la juste information du public.

Par ailleurs, ces données ont inspiré de très nombreuses réutilisations.

Néanmoins, de nombreux autres jeux de données ont été publiés sur data.gouv.fr en 2020.

Un tournant pour les données environnementales

De nombreux jeux de données relatifs à l'environnement ont été mis à disposition en 2020, en particulier grâce au travail de l'ADEME. Citons quelques-unes de ces bases de données emblématiques.

  • Tout d'abord des données sur la rénovation énergétique des bâtiments, avec la publication de la base des diagnostics de performance énergétique (DPE) qui renseigne sur la performance énergétique des logements et des bâtiments publics, en évaluant leur consommation d’énergie et leur impact en termes d’émissions de gaz à effet de serre.

  • Des données sur la pollution de l'air, ont également été misent à disposions via la base Carbone, base de donnée de référence sur les facteurs d'émissions, nécessaires à la réalisation d’un bilan d’émissions de gaz à effet de serre (GES) et plus généralement tout exercice de comptabilité carbone.

  • De nombreuses données sur la gestion des déchets ont également été ouvertes, notamment la base SINOE, relative aux traitements des déchets, qui permet d'accéder à un historique de 10 ans de données sur la gestion des déchets ménagers et assimilés (DMA) mais aussi la base SYDEREP sur les Filières à Responsabilité élargie des Producteurs qui comprend notamment la liste des sociétés inscrites, les quantités mises sur le marché ou encore les tonnages collectés.

  • L'ADEME a également publié en 2020 des données sur l'impact environnemental des produits avec la base Agribalyse qui est la base de données environnementale de référence sur les produits agricoles et alimentaires.

[

D'autres, producteurs de données, ont publié des données importantes sur l'environnement. Comme des données sur les risques naturels et l’aménagement du territoire publié par le CEREMA mais aussi de nouvelles données dans le secteur de l'énergie notamment grâce aux publications de l’Agence ORE qui permettent e visualiser la quantité d’électricité produite et consommée par gestionnaires de réseau de distribution d’électricité.

De nouveau producteurs de données

2020 a vu aussi l'arrivé sur data.gouv.fr de nouveaux producteurs de données comme France Compétences qui met à disposition les données du Répertoire National des Certifications Professionnelles (RNCP) ainsi que le Répertoire Spécifique (RS) ou encore l'Agence du Service Civique qui publie les données de l’enquête qui suit la fin d’une mission de service-civique.

Le moissonnage continue !

L'équipe de data.gouv.fr continu à développer de nouveaux moissonneurs et à accompagner les producteurs. Parmi les nombreux nouveaux portails moissonnés en 2020, citons celui de l’OFGL grâce auquel de nombreuses données relatives aux finances et à la gestion des collectivités locales françaises sont désormais disponible sur data.gouv.fr ainsi que celui la Caisse des Dépôts qui permet d'accéder à de nombreux jeux de données, sur des thèmes variés comme le logement notamment sur les logements sociaux, mais aussi sur les retraites et la solidarité ou encore l'investissement.

Une plateforme qui s'améliore en continu

De nombreuses évolutions et améliorations ont été apportées en 2020. Nous avons présenté les plus importantes dans un article dédié début octobre.

Découvrabilité des données

Pour faciliter la recherche et la découverte de jeux de données des efforts supplémentaires ont été entrepris en 2020 sur l'éditorialisation du portail. Nous avons notamment mis en place des pages inventaires qui référencent les jeux de données en lien avec un sujet précis (Covid-19, élections, comptes publics etc.) et sont ouvertes aux contributions de la communauté. Nous avons aussi amélioré notre système de recommandations qui permet de découvrir des données similaires à un jeu de donnée ou les réutilisations les plus pertinentes.

D'un autre côté, nous publions désormais sur le blog de data.gouv.fr un article mensuel de suivi des sorties dans lequel nous partageons les publications qui ont retenu notre attention qu’il s’agisse de jeux de données, de réutilisations, d’outils ou d’articles parus ailleurs sur le web ainsi que des articles thématiques sur des jeux de données emblématiques. Data.gouv.fr a également son infolettre qui propose un tour d’horizon de l’actualité de la plateforme et de l’open-data français tous les deux mois. S'inscrire à l'infolettre

Qualité des données

Afin de contribuer à l'amélioration de la qualité des données vous pouvez désormais proposez et découvrez des jeux de données qui répondent à un schéma de données en liant un schéma référencé sur schema.data.gouv.fr à une ressource sur data.gouv.fr.
Dans le même objectif, les guides open data d'Etalab ont été enrichis. Une nouvelle section « Lier les données à un référentiel » a été ajoutée au guide qualité des données d’Etalab.

Accès aux API

Par ailleurs, il est maintenant possible de découvrir les API publiques depuis data.gouv.fr. En effet il est possible de référencer une ou plusieurs APIs sur un même jeu de données. De la même manière, il est possible de lier un à plusieurs jeux de données à une API publiées sur api.gouv.fr.

La plateforme en soutien des événements d'Etalab

En 2020 plusieurs événements autour des données publiques ont pu s'appuyer sur data.gouv.fr.
Citons notamment le hackathon Datafin sur les données financières des collectivités locales ainsi que le hackathon Renovaction sur la rénovation énergétique des bâtiments.
Dans le cadre du Mois de l’innovation publique, l'équipe data.gouv.fr a également co-organisé avec l’association OpenDataFrance un webinaire sur l’open data dans les territoires.

Une plateforme reconnue à l'internationale

La France a conservé sa place sur le podium des pays leader en matière d'Open Data en Europe selon le l'Open Data Maturity Index de la Commission Européenne. La plateforme n'est pas pour rien dans ce bon résultat. En effet, la qualité du portail open data est une quatre dimension évaluée et la France a obtenu la première place dans cette dernière.

Une nouvelle feuille de route pour data.gouv.fr

Depuis le début de l’année 2020, Etalab, avec l’appui de l’équipe de la coopérative Datactivist, mène une réflexion pour comprendre les usages des différents acteurs et identifier les nouvelles grandes priorités. Cette réflexion aboutira sur une nouvelle feuille de route fondée sur les attentes exprimées par l’ensemble des acteurs de l’open data.

Ce travail s’appuie sur une multitude de sources : enquête auprès des usagers, analyse des métriques de la plateforme data.gouv.fr, entretiens avec des utilisateurs ou encore analyse comparative des solutions existantes.

Dans ce cadre, plusieurs ateliers thématiques ont été organisés avec l’équipe d'Etalab et certains acteurs de l’écosystème sur divers sujets comme la découvrabilité des données, leur qualité ou la mesure d'impact de l'ouverture de celles-ci.

Nous reviendrons sur les sorties de ces réflexions dans un article dédié.