GeoZones

Description

Référentiel géospatial et administratif simple.

Ce jeu de données est construit à partir du Code Officiel Géographique de l'INSEE, disponible via leur interface SparQL.

Modèle

Il y a deux types d'objets:

  • les niveaux
  • les zones

Zones

Le fichier Zones {année} (json) est construit à partir des données extraites du COG, et contient, pour toutes les échelles géographiques, les informations suivantes :

  • uri : URI de l'entité dans le graphe RDF de l'INSEE (exemple : "http://id.insee.fr/geo/arrondissement/6eeefa75-7352-48ee-884f-64783b8ca290"),
  • nom : nom de l'entité (exemple : "Lyon"),
  • codeINSEE : code INSEE de l'entité (exemple : "691"),
  • nomSansArticle : nom sans article de l'éntité (exemple : "Lyon"),
  • codeArticle : code de l'article de l'entité (exemple : "0"),
  • type : type de l'entité (exemple : "Arrondissement"),
  • is_deleted : booléen indiquant si l'entité a été administrativement supprimée (exemple : true),
  • level : niveau d'échelle de l'entité (exemple : "fr:arrondissement"),
  • _id : identifiant complet utilisé par data.gouv.fr (exemple : "fr:arrondissement:691")

Le fichier Zones pays uniquement {année} (json) est un échantillon du fichier global Zones {année} (json) qui ne contient que les pays.

Niveaux/Levels

Le fichier contient les différents niveaux d'échelles possible, avec les informations suivantes :

  • id : niveau d'échelle de l'entité, qui correspond au champ level du fichire Zones (exemple : "fr:region"),
  • label : appellation du niveau d'échelle (exemple : "French region"),
  • admin_level : code du niveau d'échelle (exemple : 40),
  • parents : niveau(x) d'échelle directement supérieur(s) (exemple : ["country"])

Construction

Ce jeu de données est construit à partir du COG de l'INSEE via un script python disponible ici.

Historique

  • 30/04/2015 : première version
  • 15/04/2016 : ajout des URL des blasons/drapeaux ainsi qu'un export utilisant msgpack afin de réduire la taille de l'archive générée
  • 19/04/2016 : version de correction fournissant un découpage plus fin des formes des communes
  • 09/06/2016 : version de correction ajoutant les parents pour les communes de Corse/DROM-COM et calculant la population pour les districts
  • 15/06/2017 : version incluant les données issues de GeoHisto et utilisant des GeoIDs, intègre les données 2017 (COG, OSM).
  • 28/08/2017 : Ajout de l'historique des EPCIs issue de GeoHisto.
  • 08/05/2019 : Passage au COG 2019, correction de bugs, ajout de la clé geonames, passage à Wikidata, les cantons et les iris ne sont plus exportés
  • 30/11/2023 : Les données sont issues du COG de l'INSEE à partir de leur interface SparQL

Archives

Niveaux/Levels

Ils permettent de modéliser les différents niveaux connus du référentiel et leur relations théoriques.
Leur nom est traductible.

Zones

Une zone est l'association d'un identifiant unique à polygone géographique, un niveau et un nom.
Il a moins un code unique pour le niveau.
Il peut avoir plusieurs identifiants connus, qui ne sont pas nécessairement uniques.

Le nom est optionnellement traductible (ex: Union européenne, Monde)

Les attributs suivant sont exportés dans le GeoJSON:

  • id : Un identifiant unique suivant la spécification GeoID
  • code : L'identifiant unique pour une date donnée de la zone pour son niveau
  • level : L'identifiant du niveau de rattachement
  • name : Le nom d'affichage de la zone en anglais (peut-être traduit)
  • population : La population approximative/estimée (optionnel)
  • area : L'aire estimée/approximative en km2 (optionnel)
  • wikidata : Le noeud Wikidata associé (optionnel)
  • wikipedia : Une référence vers Wikipedia (optionnel)
  • dbpedia : Une référence vers DBPedia (optionnel)
  • flag : Une référence vers le drapeau DBPedia (optionnel)
  • blazon : Une référence vers le blazon DBPedia (optionnel)
  • keys : un dictionnaire des différents code connus pour cette zone
  • parents : une liste non-ordonnée des identifiants des différents parents connus
  • ancestors : la liste des éventuels ancêtres
  • successors : la liste des éventuels successeurs
  • validity: une période de validité (objet ayant les attributs start/end) (optionnel)

Construction

Ce jeu de données est construit avec l'outil GeoZones
dont le code est publié sur Github.

Vous pouvez retrouver le détail des spécificités françaises sur le dépôt.

Améliorations futures possibles

Champs

  • Poids global = f(population, area, level)

Livrables

  • Différentes précisions
  • JSON localisés (en anglais seulement pour l'instant)
  • Traductions en JSON (comme alternative dur format PO/MO actuel)
  • Statistiques des niveaux (nombre de zones, couverture des attributs...)

Producteur

Dernière mise à jour

20 avril 2024

Licence

Open Data Commons Open Database License (ODbL)

Qualité des métadonnées
100.0/100

Il n'y a pas encore de ressources communautaires pour ce jeu de données.

Partagez vos ressources En savoir plus sur la communauté

Informations

Temporalité

Création

30 avril 2015

Fréquence

Ponctuelle

Couverture temporelle

01/01/1942 à 13/05/2019

Dernière mise à jour

20 avril 2024

Couverture spatiale

Couverture territoriale

Monde

Granularité de la couverture territoriale

Commune française

Actions

Intégrer sur votre site

Visites

7,2k

386 en avr. 2024

Téléchargements

1,9k

132 en avr. 2024

Réutilisations de ce jeu de données

1

Abonnés

15