GeoZones

Description

Référentiel géospatial et administratif simple.

Ce jeu de données est construit à partir du Code Officiel Géographique de l'INSEE, disponible via leur interface SparQL.

Modèle

Il y a deux types d'objets:

  • les niveaux
  • les zones

Zones

Le fichier Zones {année} (json) est construit à partir des données extraites du COG, et contient, pour toutes les échelles géographiques, les informations suivantes :

  • uri : URI de l'entité dans le graphe RDF de l'INSEE (exemple : "http://id.insee.fr/geo/arrondissement/6eeefa75-7352-48ee-884f-64783b8ca290"),
  • nom : nom de l'entité (exemple : "Lyon"),
  • codeINSEE : code INSEE de l'entité (exemple : "691"),
  • nomSansArticle : nom sans article de l'éntité (exemple : "Lyon"),
  • codeArticle : code de l'article de l'entité (exemple : "0"),
  • type : type de l'entité (exemple : "Arrondissement"),
  • is_deleted : booléen indiquant si l'entité a été administrativement supprimée (exemple : true),
  • level : niveau d'échelle de l'entité (exemple : "fr:arrondissement"),
  • _id : identifiant complet utilisé par data.gouv.fr (exemple : "fr:arrondissement:691")

Le fichier Zones pays uniquement {année} (json) est un échantillon du fichier global Zones {année} (json) qui ne contient que les pays.

Niveaux/Levels

Le fichier contient les différents niveaux d'échelles possible, avec les informations suivantes :

  • id : niveau d'échelle de l'entité, qui correspond au champ level du fichire Zones (exemple : "fr:region"),
  • label : appellation du niveau d'échelle (exemple : "French region"),
  • admin_level : code du niveau d'échelle (exemple : 40),
  • parents : niveau(x) d'échelle directement supérieur(s) (exemple : ["country"])

Construction

Ce jeu de données est construit à partir du COG de l'INSEE via un script python disponible ici.

Historique

  • 30/04/2015 : première version
  • 15/04/2016 : ajout des URL des blasons/drapeaux ainsi qu'un export utilisant msgpack afin de réduire la taille de l'archive générée
  • 19/04/2016 : version de correction fournissant un découpage plus fin des formes des communes
  • 09/06/2016 : version de correction ajoutant les parents pour les communes de Corse/DROM-COM et calculant la population pour les districts
  • 15/06/2017 : version incluant les données issues de GeoHisto et utilisant des GeoIDs, intègre les données 2017 (COG, OSM).
  • 28/08/2017 : Ajout de l'historique des EPCIs issue de GeoHisto.
  • 08/05/2019 : Passage au COG 2019, correction de bugs, ajout de la clé geonames, passage à Wikidata, les cantons et les iris ne sont plus exportés
  • 30/11/2023 : Les données sont issues du COG de l'INSEE à partir de leur interface SparQL

Archives

Niveaux/Levels

Ils permettent de modéliser les différents niveaux connus du référentiel et leur relations théoriques.
Leur nom est traductible.

Zones

Une zone est l'association d'un identifiant unique à polygone géographique, un niveau et un nom.
Il a moins un code unique pour le niveau.
Il peut avoir plusieurs identifiants connus, qui ne sont pas nécessairement uniques.

Le nom est optionnellement traductible (ex: Union européenne, Monde)

Les attributs suivant sont exportés dans le GeoJSON:

  • id : Un identifiant unique suivant la spécification GeoID
  • code : L'identifiant unique pour une date donnée de la zone pour son niveau
  • level : L'identifiant du niveau de rattachement
  • name : Le nom d'affichage de la zone en anglais (peut-être traduit)
  • population : La population approximative/estimée (optionnel)
  • area : L'aire estimée/approximative en km2 (optionnel)
  • wikidata : Le noeud Wikidata associé (optionnel)
  • wikipedia : Une référence vers Wikipedia (optionnel)
  • dbpedia : Une référence vers DBPedia (optionnel)
  • flag : Une référence vers le drapeau DBPedia (optionnel)
  • blazon : Une référence vers le blazon DBPedia (optionnel)
  • keys : un dictionnaire des différents code connus pour cette zone
  • parents : une liste non-ordonnée des identifiants des différents parents connus
  • ancestors : la liste des éventuels ancêtres
  • successors : la liste des éventuels successeurs
  • validity: une période de validité (objet ayant les attributs start/end) (optionnel)

Construction

Ce jeu de données est construit avec l'outil GeoZones
dont le code est publié sur Github.

Vous pouvez retrouver le détail des spécificités françaises sur le dépôt.

Améliorations futures possibles

Champs

  • Poids global = f(population, area, level)

Livrables

  • Différentes précisions
  • JSON localisés (en anglais seulement pour l'instant)
  • Traductions en JSON (comme alternative dur format PO/MO actuel)
  • Statistiques des niveaux (nombre de zones, couverture des attributs...)

Producer

Latest update

April 20, 2024

License

Open Data Commons Open Database License (ODbL)

Metadata quality
100.0/100

5 Reuses

There are no community resources for this dataset yet.

Share your resources Learn more about the community

Information

Temporality

Creation

April 30, 2015

Frequency

Punctual

Temporal coverage

1942/01/01 to 2019/05/13

Latest update

April 20, 2024

Spatial coverage

Territorial coverage

Monde

Territorial coverage granularity

French town

Actions

Embed

Statistics for the year

Views

7.3k

454 in Apr 2024

Downloads

2k

188 in Apr 2024

Reuses of this dataset

1

Followers

15