L'essentiel sur les données de forte valeur

Publié le 20 octobre 2023

Faites le point sur les données de forte valeur !

Dans la lignée de la « Directive Open Data » (Directive 2019/1024), la Commission européenne a adopté un règlement d’exécution (2023/138) qui établit la liste des ensembles de données de forte valeur qui devront être mis à disposition gratuitement en vue de leur réutilisation pour juin 2024.

De quoi s’agit-il ? Comment doivent-elles être mises à disposition ? Nous vous proposons de faire le point.

Des données à fort potentiel pour la société, l’environnement et l’économie

La « Directive Open Data » (Directive 2019/1024) définit les données de forte valeur comme les « documents détenus par un organisme du secteur public, dont la réutilisation est associée à des bénéfices importants pour la société, l’environnement et l’économie ». Il s’agit alors de les mettre à disposition avec un minimum de restrictions légales et techniques afin d’augmenter leur potentiel de réutilisation et leur impact (amélioration des services publics, création de nouveaux services, pilotage des politiques publiques par la donnée, etc.).

Les ensembles de données de forte valeur se rapportent à six catégories thématiques, et beaucoup relèvent de thèmes de données INSPIRE :

  • Des données géospatiales : adresses, dénominations géographiques, unités administratives, etc. ;
  • Des données sur l’observation de la Terre et l’environnement : hydrographie, occupation des terres, sources d’énergie, altitude, air, climat, déchets, etc. ;
  • Des données météorologiques : observations mesurées par les stations météorologiques, observations validées (données climatiques), alertes météorologiques, modèles de données de prévision météorologique numérique, etc. ;
  • Des données statistiques, avec notamment des indicateurs démographiques et économiques : population, chômage, emploi, comptes nationaux, dépenses et recettes des administrations publiques, etc. ;
  • Des données sur les entreprises et les propriétés d’entreprises : informations d’identité des entreprises, documents et comptes des entreprises, etc. ;
  • Des données de mobilité : réseaux de transport et voies navigables intérieures.

La liste a été établie à l’issue d’ :

  • Une consultation avec un large éventail de parties prenantes représentant à la fois producteurs et réutilisateurs de données, à partir de laquelle a été dressée une « liste de souhait » préliminaire ;
  • Une analyse d’impact qui a notamment passé en revue la législation européenne pertinente, afin d’identifier parmi les champs de données déjà couverts, les jeux de données pouvant être considérés comme étant de forte valeur.

L’annexe du règlement d’exécution énumère la liste des données concernées et précise respectivement la granularité, la couverture géographique (si pertinent) et les attributs clés attendus.

Issues d’une démarche et d’objectifs analogues au service public de la donnée, les données de forte valeur s’en distinguent notamment par le champ des données concernées et les modalités de mise à disposition définies (fréquence de mise à jour, performance et disponibilité de la mise à disposition, etc.). Pour rappel, le service public de la donnée, créé en 2016 par la loi pour une République numérique, vise à mettre à disposition avec un haut niveau de qualité des jeux de données de référence qui présentent un fort impact économique et social. Ces jeux de données de référence sont aujourd’hui au nombre de neuf (cf. la page dédiée sur data.gouv.fr).

Des modalités de publication et de réutilisation harmonisées

Les données de forte valeur doivent toutes être mises à disposition :

  • Dans des formats ouverts et lisibles par machine ;
  • Au moyen d’API (dont les conditions d’utilisation et les critères de qualité de service doivent être publiés) et sous la forme d’un téléchargement en masse (le cas échéant) ;
  • Accompagnées d’une documentation publique, et avec une attention particulière accordée à la qualité des métadonnées ;
  • Aux conditions de la licence Creative Commons BY 4.0 ou de toute licence ouverte équivalente (comme la licence ouverte Etalab 2.0) ou moins restrictive, garantissant une réutilisation sans restriction.

Seules les données existantes ont vocation à être ouvertes, et les organisations publiques n’auront pas à produire de nouvelles données.

Prochaines étapes

Les producteurs de données concernés doivent désormais s’atteler à la publication des données qui n’ont pas encore été ouvertes avant juin 2024 et vérifier que toutes leurs données répondent aux spécifications établies dans l’annexe du règlement d’exécution. Ils peuvent, dans ce cadre, être accompagnés par leurs administrateurs ministériels des données, des algorithmes et des codes sources et par l’équipe de data.gouv.fr.

La liste complète des données de forte valeur et le suivi des ouvertures est disponible sur ouverture.data.gouv.fr.