Quel suivi des usages des données ouvertes ?

Published on April 14, 2022

Venez plonger au coeur des réutilisations de données ouvertes !

La réutilisation des données constitue l’un des principaux objectifs d’une politique d’ouverture des données publiques. Le référencement et l’étude de ces réutilisations sont donc essentiels pour mesurer l’impact de l’open data.

D’après le rapport “Pour une politique publique de la donnée, des algorithmes et des codes source” remis au Premier ministre par le député Eric Bothorel, « les acteurs publics ont aujourd’hui une faible connaissance des réutilisations permises [par les données ouvertes] » (p.7). Une réutilisation désigne communément l’exploitation de données ouvertes par des tiers, à d’autres fins que celle de la mission de service public pour laquelle elles ont été produites ou reçues. Elle peut prendre la forme d’une visualisation, d’une application, d’un article de presse, d’un papier de recherche, etc.

Le suivi des usages passe par leur mesure, au moyen de statistiques d’utilisation, mais implique également d’échanger avec les différentes parties prenantes pour une compréhension plus qualitative. Dans le cadre de ses travaux de mesure d’impact, notre équipe a donc entrepris d’interroger quelques producteurs de données et réutilisateurs. Nous vous proposons de vous partager les fruits de cette enquête.

Durant les cinq prochaines semaines, une série d’articles vous permettra de plonger au coeur des réutilisations de données ouvertes :

  • Quels enjeux autour de la connaissance des usages des données ouvertes ?
  • Comment suivre les usages ?
  • Quelle diversité d’usages ?
  • Quels exemples d’usage emblématiques ?

L’exploration démarre aujourd’hui avec une revue de quelques enjeux et bonnes pratiques autour du suivi des usages des données ouvertes. Ces différents enseignements ont été tirés de 8 entretiens réalisés avec des producteurs de données du service public de la donnée (SPD), considérés comme plus matures sur cette question. En effet, le service public de la donnée vise à mettre à disposition avec un haut niveau de qualité les jeux de données de référence qui présentent un fort impact économique et social. Ils sont alors beaucoup réutilisés pour créer de nouveaux produits et améliorer des services existants. Il ne s’agit pas ici de faire un bilan de ce service public de la donnée, mais de s’appuyer sur ce dernier pour exemple.

Sur le service public de la donnée, nos échanges avec les producteurs révèlent une attention et des efforts croissants pour appréhender les usages de leurs données ouvertes.

Pourquoi s’y intéressent-ils ? De quels leviers méthodologiques et techniques disposent-ils ? Quels sont leurs besoins en la matière ? Des réponses et des bonnes pratiques dans cet article.

Connaître les usages : pour quoi faire ?

Une analyse des usages permet aux producteurs sondés de développer une offre de données ouvertes plus pertinente, davantage adaptée à la demande. Deux mécanismes peuvent être à l’œuvre.

Améliorer la qualité des données

L’observation des utilisations faites et la remontée des besoins des réutilisateurs favorise tout d’abord l’amélioration de la qualité des données. En effet, pour une donnée, la notion de qualité (format, structure, contenu, mise à jour, métadonnées, documentation, etc.) dépend grandement de l’usage qui en est fait. Or, la qualité proposée, bien qu’adaptée aux utilisations internes à l’administration, peut être améliorée pour les usages nouveaux engendrés par l’ouverture. Pôle Emploi travaille ainsi étroitement avec la startup d’Etat DiagOriente pour améliorer le Répertoire Opérationnel des Métiers et des Emplois (ROME) en intégrant les retours des utilisateurs de l’outil (compétences pertinentes à retenir, celles qui sont renommées, jamais sélectionnées) et ses travaux de reformulation sémantique des compétences professionnelles.

Motiver la poursuite des efforts d’ouverture

De plus, la compréhension des usages permet de motiver la poursuite et le renforcement des efforts de mise à disposition. Les producteurs de données découvrent la valeur de leur travail de publication : les fichiers de gestion de l’administration qu’ils ouvrent deviennent un véritable matériel pour construire des services, des visualisations, des articles journalistiques, etc. “S’il y a des réutilisations qui demandent des téléchargements réguliers, nous pouvons anticiper les conséquences de ce type d’utilisation” indiquent les producteurs de la Base Sirene des entreprises. A un niveau plus stratégique, les producteurs de données peuvent aussi mobiliser cette connaissance sur les usages pour faire du reporting auprès de leur hiérarchie, démontrer le retour sur investissement des efforts déployés et ainsi justifier la poursuite du travail engagé. Les producteurs de la Base Sirene des entreprises valorisent par exemple en interne la forte consommation des données, à l’aide d’un bilan mensuel qui reprend le nombre de requêtes et les principaux réutilisateurs.

Comment suivre les usages des données ouvertes ?

Les administrations interrogées combinent approches quantitatives et qualitatives pour cerner les usages de leurs données ouvertes.

La plupart commencent par mesurer les volumes d’usage, en suivant les métriques des jeux de données publiés proposées par data.gouv.fr ou sur leur propre portail. Nombre de téléchargements, nombre de réutilisations, etc., sont autant de chiffres qui offrent un premier aperçu de l’utilisation des données.

Pour préciser cette analyse, certains producteurs engagent également un dialogue avec les réutilisateurs et investiguent la nature des réutilisations. Selon le niveau de maturité et les moyens disponibles, plusieurs leviers sont disponibles :

  • Réponses aux commentaires et aux questions soumis sur data.gouv.fr, notamment sur la qualité des données : il s’agit par exemple d’un canal d’échange privilégié pour les producteurs du Répertoire National des Associations (RNA) qui compte 344 discussions sur la plateforme ;
  • Suivi des réutilisations ajoutées sur data.gouv.fr et incitation au référencement : la Base Adresse Nationale (BAN) recense notamment 43 réutilisations référencées sur la plateforme ;
  • Enquêtes auprès des réutilisateurs : les producteurs du Code Officiel Géographique (COG) ont par exemple lancé en 2019 une enquête qui a permis d’évaluer la satisfaction générale des réutilisateurs et de faire remonter des besoins en termes d’interopérabilité et de fréquence de mise à jour. Les producteurs de la Base Sirene mènent actuellement une démarche similaire et sondent leurs réutilisateurs sur des questions de contenu, de format ou encore de documentation des données ;
  • Animation de communautés de réutilisateurs, à l’instar de l’Institut National de l’Information Géographique et Forestière (IGN) qui organise un certain nombre d’événements mettant à l’honneur les réutilisateurs. Il propose également des conférences, des webinaires de prise en main des différents services ainsi que des tutoriels d’accompagnement ;
  • Entretiens avec les principaux réutilisateurs.

Les producteurs sondés indiquent aujourd’hui manquer de temps pour suivre les usages. Les leviers les plus frugaux, comme les questions soumises sur data.gouv.fr, ne permettent de collecter pour l’instant que peu de retours de la part des réutilisateurs.

Quels besoins exprimés par les producteurs de données et quelles opportunités pour data.gouv.fr ?

Des pistes d’amélioration produit pourraient pallier certaines de ces problématiques et simplifier le suivi des usages.

Les producteurs de données interrogés plébiscitent ainsi, sur data.gouv.fr :

  • Des métriques sur les jeux de données publiés (nombre de consultations, nombre de téléchargements, nombre de réutilisations, etc.)
    • plus lisibles et accessibles
    • communiquées régulièrement sous la forme d’un rapport partageable
      Il s’agit d’un sujet sur lequel l’équipe de data.gouv.fr va travailler très prochainement.
  • Des réutilisations
    • signalées au moment du référencement (notification)
    • décrites de façon plus détaillée par les réutilisateurs : utilisation et traitement des données, service rendu, profil du réutilisateur, etc.
  • Un forum de discussion qui favorise davantage d’échanges avec les réutilisateurs

Les administrations sollicitent également un support méthodologique associé à de l’accompagnement : aide à l’animation de communauté de réutilisateurs, partage de bonnes pratiques sur le suivi des usages, organisation d’échanges entre pairs, etc.

Producteurs de données, vous avez d’autres questions ou demandes concernant le suivi des usages de vos données ouvertes ? N’hésitez pas à nous contacter.

Réutilisateurs, comme explicité dans cet article, le référencement de vos travaux permet la mise en place d’un cercle vertueux qui favorise le développement de l’open data (montée en qualité des données, nouvelles ouvertures, etc.). Contribuez en publiant vos réutilisations sur data.gouv.fr !

Nous vous donnons rendez-vous la semaine prochaine pour entrer dans le vif du sujet et commencer à découvrir des réutilisations de données ouvertes. Notre tour d’horizon commencera par une présentation des usages développés au sein de l’administration.