Ce jeu de données est dérivé du jeu de données Demandes de valeurs foncières diffusé par la DGFiP.

Il propose un format alternatif, normalisé et enrichi.

Améliorations par rapport aux fichiers bruts

  • CSV avec séparateur virgule et encodage UTF-8
  • Mise à jour avec les données de référence les plus récentes (COG 2019, PCI 2019)
  • Renommage des colonnes pour un traitement informatique plus facile
  • Suppression des colonnes non fournies dans la diffusion DVF
  • Jointure avec les tables fournies en documentation
  • Normalisation des valeurs décimales (point comme séparateur décimal)
  • Normalisation des codes postaux (5 caractères)
  • Normalisation des codes INSEE
  • Libellés de communes riches (accentués)
  • Normalisation des codes voie (FANTOIR) (4 caractères)
  • Création d'un identifiant de parcelle compatible avec les fichiers cadastraux proposés par Etalab
  • Date de mutation au format ISO-8601
  • Géocodage latitude/longitude à la parcelle en coordonnées WGS-84
  • Fourniture des fichiers au département ou à la commune

Schéma

Pour la description étendue de la signification des champs, nous vous recommandons de consulter la notice officielle.

  • id_mutation : Identifiant de mutation (non stable, sert à grouper les lignes)
  • date_mutation : Date de la mutation au format ISO-8601 (YYYY-MM-DD)
  • numero_disposition : Numéro de disposition
  • valeur_fonciere : Valeur foncière (séparateur décimal = point)
  • adresse_numero : Numéro de l'adresse
  • adresse_suffixe : Suffixe du numéro de l'adresse (B, T, Q)
  • adresse_code_voie : Code FANTOIR de la voie (4 caractères)
  • adresse_nom_voie : Nom de la voie de l'adresse
  • code_postal : Code postal (5 caractères)
  • code_commune : Code commune INSEE (5 caractères)
  • nom_commune : Nom de la commune (accentué)
  • ancien_code_commune : Ancien code commune INSEE (si différent lors de la mutation)
  • ancien_nom_commune : Ancien nom de la commune (si différent lors de la mutation)
  • code_departement : Code département INSEE (2 ou 3 caractères)
  • id_parcelle : Identifiant de parcelle (14 caractères)
  • ancien_id_parcelle : Ancien identifiant de parcelle (si différent lors de la mutation)
  • numero_volume : Numéro de volume
  • lot_1_numero : Numéro du lot 1
  • lot_1_surface_carrez : Surface Carrez du lot 1
  • lot_2_numero : Numéro du lot 2
  • lot_2_surface_carrez : Surface Carrez du lot 2
  • lot_3_numero : Numéro du lot 3
  • lot_3_surface_carrez : Surface Carrez du lot 3
  • lot_4_numero : Numéro du lot 4
  • lot_4_surface_carrez : Surface Carrez du lot 4
  • lot_5_numero : Numéro du lot 5
  • lot_5_surface_carrez : Surface Carrez du lot 5
  • nombre_lots : Nombre de lots
  • code_type_local : Code de type de local
  • type_local : Libellé du type de local
  • surface_reelle_bati : Surface réelle du bâti
  • nombre_pieces_principales : Nombre de pièces principales
  • code_nature_culture : Code de nature de culture
  • nature_culture : Libellé de nature de culture
  • code_nature_culture_speciale : Code de nature de culture spéciale
  • nature_culture_speciale : Libellé de nature de culture spéciale
  • surface_terrain : Surface du terrain
  • longitude : Longitude du centre de la parcelle concernée (WGS-84)
  • latitude : Latitude du centre de la parcelle concernée (WGS-84)

Remarque relative au géocodage

Ce premier géocodage a été réalisé à partir de l'identifiant de parcelle cadastrale, par jointure avec le fichier des [parcelles cadastrales]. À ce stade c'est le millésime du 1er janvier 2019 qui a été utilisé.

Plusieurs lignes n'ont pas pu être géocodées par l'identifiant de parcelle n'est pas présent dans le millésime considéré. Cela peut provenir de deux raisons : soit on est dans une commune qui ne dispose pas d'un cadastre vectoriel, soit la parcelle considérée a été remaniée, et il sera possible à moyen terme de lui affecter des coordonnées.

Code source

Lien vers le dépôt de code source du script permettant de produire ces fichiers (licence MIT)

Historique

24/04/2019 : première livraison
25/04/2019 : rétablissement du numéro de disposition + corrections diverses (détails)
26/04/2019 : création de l'identifiant de mutation + corrections diverses (détails)
27/04/2019 : alignement sur le COG 2019 + corrections diverses (détails)

Resources

Community resources

You have built a more comprehensive database than those presented here? This is the time to share it!

Reuses

You reused these data and published an article, a computer graphics, or an application? It's time to let you know! Reference your work in just a few clicks and increase your visibility.

Discussions

Discussion between the organization and the community about this dataset.