GeoZones

Description

Référentiel géospatial et administratif simple.

Ce jeu de données est construit à partir du Code Officiel Géographique de l'INSEE, disponible via leur interface SparQL.

Modèle

Il y a deux types d'objets:

  • les niveaux
  • les zones

Zones

Le fichier Zones {année} (json) est construit à partir des données extraites du COG, et contient, pour toutes les échelles géographiques, les informations suivantes :

  • uri : URI de l'entité dans le graphe RDF de l'INSEE (exemple : "http://id.insee.fr/geo/arrondissement/6eeefa75-7352-48ee-884f-64783b8ca290"),
  • nom : nom de l'entité (exemple : "Lyon"),
  • codeINSEE : code INSEE de l'entité (exemple : "691"),
  • nomSansArticle : nom sans article de l'éntité (exemple : "Lyon"),
  • codeArticle : code de l'article de l'entité (exemple : "0"),
  • type : type de l'entité (exemple : "Arrondissement"),
  • is_deleted : booléen indiquant si l'entité a été administrativement supprimée (exemple : true),
  • level : niveau d'échelle de l'entité (exemple : "fr:arrondissement"),
  • _id : identifiant complet utilisé par data.gouv.fr (exemple : "fr:arrondissement:691")

Le fichier Zones pays uniquement {année} (json) est un échantillon du fichier global Zones {année} (json) qui ne contient que les pays.

Niveaux/Levels

Le fichier contient les différents niveaux d'échelles possible, avec les informations suivantes :

  • id : niveau d'échelle de l'entité, qui correspond au champ level du fichire Zones (exemple : "fr:region"),
  • label : appellation du niveau d'échelle (exemple : "French region"),
  • admin_level : code du niveau d'échelle (exemple : 40),
  • parents : niveau(x) d'échelle directement supérieur(s) (exemple : ["country"])

Construction

Ce jeu de données est construit à partir du COG de l'INSEE via un script python disponible ici.

Historique

  • 30/04/2015 : première version
  • 15/04/2016 : ajout des URL des blasons/drapeaux ainsi qu'un export utilisant msgpack afin de réduire la taille de l'archive générée
  • 19/04/2016 : version de correction fournissant un découpage plus fin des formes des communes
  • 09/06/2016 : version de correction ajoutant les parents pour les communes de Corse/DROM-COM et calculant la population pour les districts
  • 15/06/2017 : version incluant les données issues de GeoHisto et utilisant des GeoIDs, intègre les données 2017 (COG, OSM).
  • 28/08/2017 : Ajout de l'historique des EPCIs issue de GeoHisto.
  • 08/05/2019 : Passage au COG 2019, correction de bugs, ajout de la clé geonames, passage à Wikidata, les cantons et les iris ne sont plus exportés
  • 30/11/2023 : Les données sont issues du COG de l'INSEE à partir de leur interface SparQL

Archives

Niveaux/Levels

Ils permettent de modéliser les différents niveaux connus du référentiel et leur relations théoriques.
Leur nom est traductible.

Zones

Une zone est l'association d'un identifiant unique à polygone géographique, un niveau et un nom.
Il a moins un code unique pour le niveau.
Il peut avoir plusieurs identifiants connus, qui ne sont pas nécessairement uniques.

Le nom est optionnellement traductible (ex: Union européenne, Monde)

Les attributs suivant sont exportés dans le GeoJSON:

  • id : Un identifiant unique suivant la spécification GeoID
  • code : L'identifiant unique pour une date donnée de la zone pour son niveau
  • level : L'identifiant du niveau de rattachement
  • name : Le nom d'affichage de la zone en anglais (peut-être traduit)
  • population : La population approximative/estimée (optionnel)
  • area : L'aire estimée/approximative en km2 (optionnel)
  • wikidata : Le noeud Wikidata associé (optionnel)
  • wikipedia : Une référence vers Wikipedia (optionnel)
  • dbpedia : Une référence vers DBPedia (optionnel)
  • flag : Une référence vers le drapeau DBPedia (optionnel)
  • blazon : Une référence vers le blazon DBPedia (optionnel)
  • keys : un dictionnaire des différents code connus pour cette zone
  • parents : une liste non-ordonnée des identifiants des différents parents connus
  • ancestors : la liste des éventuels ancêtres
  • successors : la liste des éventuels successeurs
  • validity: une période de validité (objet ayant les attributs start/end) (optionnel)

Construction

Ce jeu de données est construit avec l'outil GeoZones
dont le code est publié sur Github.

Vous pouvez retrouver le détail des spécificités françaises sur le dépôt.

Améliorations futures possibles

Champs

  • Poids global = f(population, area, level)

Livrables

  • Différentes précisions
  • JSON localisés (en anglais seulement pour l'instant)
  • Traductions en JSON (comme alternative dur format PO/MO actuel)
  • Statistiques des niveaux (nombre de zones, couverture des attributs...)
Producteur
Dernière mise à jour
2 décembre 2025

Vues

0

Téléchargements

0

Qualité des métadonnées:
Bon(100 %)
Votre question porte sur autre chose que ce jeu de données ? Visiter notre forum

8 discussions

disponibilté

Posté le 30 janvier 2024
Bonjour, Est-ce que ce jeu de données est maintenu et peut être utilisé ?
Posté le 31 janvier 2024
Bonjour Quentin, oui nous le maintenons. nous avons récemment changé sa structure et nous nous basons maintenant sur les experts trig2 de la base de connaissance Insee du Cog (avec quelques modifications à la marge) tu retrouveras donc dans le fichier les endpoint sparql de l INSEE. c'est ce fichier qui est utilisé sur datagouv pour récupérer la zone spatiale d'un jeu de données. Je vois que la description date, on va voir pour la modifier. Il a vocation à être mis à jour à chaque sortie de COG (et mode à jour INSEE de l'API Sparql).
Posté le 5 février 2024
Merci Geoffrey !

175 pays dans le Monde ?

Posté le 4 mai 2020
Bonjour, En analysant le dernier fichier des zones du Monde, nous nous sommes aperçu que vous fournissiez seulement 175 zones contre 255 avec d'autres sources. Pouvez-vous compléter votre jeu de données ? Merci
Posté le 4 mai 2020
Précision : il s'agit des contours de pays.

LICENCE ETALAB OU ODBL

Posté le 18 mars 2020
Bonjour, je voudrais comprendre sous quelle licence ces jeux de données sont publiées ? ETALAB ou ODbL, les deux sont indiquée (ETALAB producteur/OBdL informations) Cordialement MF
Posté le 18 mars 2020
Bonjour, Etalab est le producteur, qui a choisi de publier ces données sous la licence ODBL. Cordialement.
Posté le 18 mars 2020
merci Bonne journée

Problème avec certaines coordonnées

Posté le 5 janvier 2018
Bonjour, Dans certaines zones, des coordonnées ne respectent pas le norme WGS84, elles ne sont pas dans les limites minX=-180.0, maxX=180.0, minY=-90.0, maxY=90.0 et sont rejetées par certains outils qui vérifient la viabilité des données...

Problème d'encodage ?

Posté le 4 janvier 2018
J'ai du mal à comprendre quel est l'encodage des fichiers json (pour le millésime 2017, pas testé le 2016). En ouvrant via un driver GDAL (et R/sf), je me retrouve avec certains enregistrements dont l'encodage est correct, d'autres pour lequel il ne l'est pas. Exemple d'enregistrement avec un problème d'encodage : fr:arrondissement:021. À première vue, le problème d'encodage ne semblerait se poser que concernant les arrondissements.
Posté le 5 janvier 2018
Merci pour le report, j'ai consigné ce qui semble être un bug ici : https://github.com/etalab/geozones/issues/41

utilisation des scripts geozones

Posté le 4 octobre 2017
Bonjour, je tente de faire fonctionner vos scripts et j'obtiens des erreurs. Vous pouvez voir sur Github mon problème https://github.com/etalab/geozones/issues/39 . Merci de votre suivi

relation entre geozones et geohisto

Posté le 31 mai 2017
Bonjour, Ce jeu de données est très intéressant notamment car il contient la geométrie au format geojson de chaque zone. un autre jeu de données intéressant est geohisto (https://www.data.gouv.fr/fr/reuses/geohisto-historique-des-niveaux-administratifs-francais/). Est-ce qu'il est envisagé par Etalab d'avoir une relation entre ces deux jeux de données, c'est à dire rajouter l'aspect "historique" aux geozones ?
Posté le 31 mai 2017
Bonjour, C'est ce qui est en train d'être fait avec https://github.com/etalab/geozones/pull/22 L'historique récent des zones est réalisé en fonction des données disponibles sur OpenStreetMap.
Posté le 31 mai 2017
magnifique !!!

Utilisation des données

Posté le 3 novembre 2016
Bonjour J'ai du mal à comprendre le contenu des données. Je souhaiterais pouvoir tracer sur une carte des polygones correspondant aux départements ou au régions françaises. Est ce que le fichier zones.json contient ces informations ? Par exemple la liste des longitudes/latitudes des frontières des départements/régions. Merci Germain
Posté le 3 novembre 2016
Si je peux préciser, c'est les différents "levels" qu'il faudrait expliciter. Par exemple comment sont définis les villes ou département ?
Posté le 3 novembre 2016
Effectivement, c'est un manque dans la documentation, nous allons améliorer ça. Les niveaux correspondants sont détaillés dans le code: https://github.com/etalab/geozones/blob/master/france.py#L13-L18 La correspondance est: - ville: `fr/town` en passe d'être renommée `fr/commune` - epci: `fr/epci` - département: `fr/county` en passe d'être renommée `fr/departement` - région: `fr/region` - canton: `fr/canton` - arrondissement (au sens INSEE): `fr/disctrict` - iris (INSEE): `fr/iris` Un travail de francisation des niveaux français est en cours ici: https://github.com/etalab/geozones/pull/22