Le Forum

(portrait)

omala

omala a initié la discussion le :

Qualité des données

Bonjour,
Je pensais que les données devaient et pouvaient être comprises et réutilisables.... Pour ce fichier j'ai comme un gros doute !!!
Merci

La question concerne ce jeu de données :

6 réponses

(portrait)

Romain Tales

etalab

Bonjour,

Ce jeu de données concerne la liste des évènements culturels et des organismes producteurs d'événements en France et des grandes manifestations en France et à l'étranger pour l'année 2011.

Il s'agit d'un fichier csv que vous pouvez ouvrir avec un logiciel tableur, type Excel. Le séparateur est le point virgule, le jeu de caractères à sélectionner est : Unicode (UTF-8).

Les libellés des champs, indiqués dans la notice, sont :
Identifiant de l'organisme ; Nom de l'organisme ; Autre nom ; Type d'organisme ; Sous-type de l'organisme ; Adresse ; Nom du lieu ; Adresse ; Accès handicapés ; Classé au titre des Monuments historiques ; Date de classement du site ; Inscrit à l'inventaire supplémentaire des Monuments historiques ; Date d'inscription ; Élément classé ou inscrit ; Étendu de la protection ; Situé dans un espace protégé ; Intitulé de l'offre culturelle ; Nature de l'offre ; Liste des thèmes associés à l'offre ; Dates, horaires, conditions d'accès et lieu d'accueil de cette offre ; Liste des dates et tarifs de l'offre ; date début ; date fin.

Merci pour votre participation sur data.gouv.fr

(portrait)

omala

Bonjour,

Merci pour ces détails technique, mais je pensais plus au contenu même des données. Elles me semblent un brut de décoffrage pour être mises sur un site public, il y a des erreurs de code postaux, des codes insee manquants....

Bonne journée

(portrait)

rca

Bonjour,

(+1) concernant les remarques d'Omala.

J'ajouterai que la méthode de classement par thématique peut poser question. Par exemple les Eurockéennes de Belfort ont pour thème : Musique|Musique - Concerts|Musiques Rock, alors que Les vieilles charrues : Musique|Spectacle...

(portrait)

Romain Tales

etalab

Bonjour,

@Omala:

Il est arrivé que dans le cas d'homonymie sur les lieux, le mauvais code postal ait pu être saisi.

En ce qui concerne les codes Insee manquants, la mise à jour se fait de façon manuelle, et au fil de l'eau, ce qui explique que pour l'instant, ils soient incomplets.

@Rca:

La saisie peut être effectuée par l'organisme lui-même ou par les services du ministère.

Le classement dépend de la personne en charge de la saisie.

Une variable d'interprétation est donc possible.

Merci pour votre participation sur data.gouv.fr

(portrait)

Cyril

Bonjour,
Je travaille justement sur la qualité des données et notamment des expressions temporelles.
J'aimerai savoir quels sont les types de formulaires de saisie utilisés pour les horaires et dates, est-ce un champs libre ou bien est-il contraint et si oui de quelle manière ?
Merci d'avance.
Cyril.