République
Française
Publié le 14 avril 2022
Venez plonger au coeur des réutilisations de données ouvertes !
La réutilisation des données constitue l’un des principaux objectifs d’une politique d’ouverture des données publiques. Le référencement et l’étude de ces réutilisations sont donc essentiels pour mesurer l’impact de l’open data.
D’après le rapport “Pour une politique publique de la donnée, des algorithmes et des codes source” remis au Premier ministre par le député Eric Bothorel, « les acteurs publics ont aujourd’hui une faible connaissance des réutilisations permises [par les données ouvertes] » (p.7). Une réutilisation désigne communément l’exploitation de données ouvertes par des tiers, à d’autres fins que celle de la mission de service public pour laquelle elles ont été produites ou reçues. Elle peut prendre la forme d’une visualisation, d’une application, d’un article de presse, d’un papier de recherche, etc.
Le suivi des usages passe par leur mesure, au moyen de statistiques d’utilisation, mais implique également d’échanger avec les différentes parties prenantes pour une compréhension plus qualitative. Dans le cadre de ses travaux de mesure d’impact, notre équipe a donc entrepris d’interroger quelques producteurs de données et réutilisateurs. Nous vous proposons de vous partager les fruits de cette enquête.
Durant les cinq prochaines semaines, une série d’articles vous permettra de plonger au coeur des réutilisations de données ouvertes :
L’exploration démarre aujourd’hui avec une revue de quelques enjeux et bonnes pratiques autour du suivi des usages des données ouvertes. Ces différents enseignements ont été tirés de 8 entretiens réalisés avec des producteurs de données du service public de la donnée (SPD), considérés comme plus matures sur cette question. En effet, le service public de la donnée vise à mettre à disposition avec un haut niveau de qualité les jeux de données de référence qui présentent un fort impact économique et social. Ils sont alors beaucoup réutilisés pour créer de nouveaux produits et améliorer des services existants. Il ne s’agit pas ici de faire un bilan de ce service public de la donnée, mais de s’appuyer sur ce dernier pour exemple.
Sur le service public de la donnée, nos échanges avec les producteurs révèlent une attention et des efforts croissants pour appréhender les usages de leurs données ouvertes.
Pourquoi s’y intéressent-ils ? De quels leviers méthodologiques et techniques disposent-ils ? Quels sont leurs besoins en la matière ? Des réponses et des bonnes pratiques dans cet article.
Une analyse des usages permet aux producteurs sondés de développer une offre de données ouvertes plus pertinente, davantage adaptée à la demande. Deux mécanismes peuvent être à l’œuvre.
L’observation des utilisations faites et la remontée des besoins des réutilisateurs favorise tout d’abord l’amélioration de la qualité des données. En effet, pour une donnée, la notion de qualité (format, structure, contenu, mise à jour, métadonnées, documentation, etc.) dépend grandement de l’usage qui en est fait. Or, la qualité proposée, bien qu’adaptée aux utilisations internes à l’administration, peut être améliorée pour les usages nouveaux engendrés par l’ouverture. Pôle Emploi travaille ainsi étroitement avec la startup d’Etat DiagOriente pour améliorer le Répertoire Opérationnel des Métiers et des Emplois (ROME) en intégrant les retours des utilisateurs de l’outil (compétences pertinentes à retenir, celles qui sont renommées, jamais sélectionnées) et ses travaux de reformulation sémantique des compétences professionnelles.
De plus, la compréhension des usages permet de motiver la poursuite et le renforcement des efforts de mise à disposition. Les producteurs de données découvrent la valeur de leur travail de publication : les fichiers de gestion de l’administration qu’ils ouvrent deviennent un véritable matériel pour construire des services, des visualisations, des articles journalistiques, etc. “S’il y a des réutilisations qui demandent des téléchargements réguliers, nous pouvons anticiper les conséquences de ce type d’utilisation” indiquent les producteurs de la Base Sirene des entreprises. A un niveau plus stratégique, les producteurs de données peuvent aussi mobiliser cette connaissance sur les usages pour faire du reporting auprès de leur hiérarchie, démontrer le retour sur investissement des efforts déployés et ainsi justifier la poursuite du travail engagé. Les producteurs de la Base Sirene des entreprises valorisent par exemple en interne la forte consommation des données, à l’aide d’un bilan mensuel qui reprend le nombre de requêtes et les principaux réutilisateurs.
Les administrations interrogées combinent approches quantitatives et qualitatives pour cerner les usages de leurs données ouvertes.
La plupart commencent par mesurer les volumes d’usage, en suivant les métriques des jeux de données publiés proposées par data.gouv.fr ou sur leur propre portail. Nombre de téléchargements, nombre de réutilisations, etc., sont autant de chiffres qui offrent un premier aperçu de l’utilisation des données.
Pour préciser cette analyse, certains producteurs engagent également un dialogue avec les réutilisateurs et investiguent la nature des réutilisations. Selon le niveau de maturité et les moyens disponibles, plusieurs leviers sont disponibles :
Les producteurs sondés indiquent aujourd’hui manquer de temps pour suivre les usages. Les leviers les plus frugaux, comme les questions soumises sur data.gouv.fr, ne permettent de collecter pour l’instant que peu de retours de la part des réutilisateurs.
Des pistes d’amélioration produit pourraient pallier certaines de ces problématiques et simplifier le suivi des usages.
Les producteurs de données interrogés plébiscitent ainsi, sur data.gouv.fr :
Les administrations sollicitent également un support méthodologique associé à de l’accompagnement : aide à l’animation de communauté de réutilisateurs, partage de bonnes pratiques sur le suivi des usages, organisation d’échanges entre pairs, etc.
Producteurs de données, vous avez d’autres questions ou demandes concernant le suivi des usages de vos données ouvertes ? N’hésitez pas à nous contacter.
Réutilisateurs, comme explicité dans cet article, le référencement de vos travaux permet la mise en place d’un cercle vertueux qui favorise le développement de l’open data (montée en qualité des données, nouvelles ouvertures, etc.). Contribuez en publiant vos réutilisations sur data.gouv.fr !
Nous vous donnons rendez-vous la semaine prochaine pour entrer dans le vif du sujet et commencer à découvrir des réutilisations de données ouvertes. Notre tour d’horizon commencera par une présentation des usages développés au sein de l’administration.