Refonte de la prévisualisation et de l’exploration des données

Publié le 7 novembre 2022

Pour faciliter l’exploitation des données, nous avons profondément revu la prévisualisation et l’exploration de données sur la plateforme. Nous attendons vos retours avec impatience !

A quoi sert la prévisualisation de données ?

La prévisualisation des données est importante, car elle permet de les visualiser sans avoir à les télécharger et permet aux réutilisateurs de se faire une idée du contenu et de la qualité d’un jeu de données avant de l’exploiter.

Une prévisualisation efficace des données permet également de pallier, dans une certaine mesure, le manque de documentation des données en permettant d’avoir accès à un aperçu des différents champs contenus dans le fichier.

Comment la prévisualisation a-t-elle évolué ?

La prévisualisation de certains fichiers tabulaires ainsi que certaines données géographiques est possible sur data.gouv.fr depuis 2018.

Exemple avec les données hospitalières relatives à l’épidémie de COVID-19 :

En mai 2021, nous vous présentions un prototype d’application pour permettre aux utilisateurs de rentrer plus en profondeur dans un jeu de données.

Nous sommes aujourd’hui enthousiastes de vous dévoiler le nouvel explorateur de données : explore.data.gouv.fr.

Celui-ci permet d’avoir un aperçu des données, d’en savoir plus sur les différentes colonnes, mais aussi par exemple de réaliser des filtres et des tris.

S’il s’agit pour le moment d’une application à part entière, vous pourrez à l’avenir trouver cette option sur les jeux de données tabulaires au niveau des fichiers d’un jeu de données.

Nous espérons que ce nouvel outil ne sera pas seulement utile pour les expertes et experts de la donnée mais à tous nos usagers.

Quelles fonctionnalités ?

Cet outil est plein de surprises.

Si un entier est détecté, nous proposons des opérations statistiques de base comme la moyenne, le min/max, l’écart type ainsi que la distribution.

Sur du texte on peut observer simplement les valeurs les plus fréquentes.

Si la valeur semble catégorielle l’affichage change pour simplifier la lecture.

Il est bien sûr possible de réaliser un tri croissant ou décroissant sur un champ.

Plusieurs façons de réaliser un filtre sont possibles en fonction du type de données détecté. Il est toujours possible de faire une recherche.

Plusieurs widgets sont disponibles lorsqu’une donnée pivot est identifiée. C’est le cas par exemple des codes communes ou départements grace au COG de l’Insee ou encore des adresses grâce à la BAN.

Un widget est également disponible sur les numéros SIRET et SIREN lorsque le champ est détecté et permet d’en savoir plus grâce à l’annuaire des entreprises.

Il est également possible de télécharger les données selon les filtres que vous avez appliqués.

Pour un aperçu dynamique des fonctionnalités rendez-vous sur ce fil Twitter.

Cette capacité d’analyser les données en détail ouvre un large champ de possibilité pour le futur de data.gouv.fr comme l’enrichissement automatique à partir de données pivots par exemple.
Nous attendons vos retours et suggestions pour améliorer cet outil et l’appropriation des données publiques 🤗

Vous pensez que la prévisualisation et l’exploration de données peuvent encore être améliorées ?
Donnez-nous votre avis.

Merci d’avance !