Référentiel de l’organisation administrative de l’État vectorisé

Description

Ce jeu de données contient une version traitée, structurée et vectorisée du Référentiel de l’organisation administrative de l’État, dont les données sont publiées par la DILA sur data.gouv et disponible sur lannuaire.service-public.fr.
Il regroupe les entités administratives françaises (ministères, préfectures, directions, services…) enrichies avec des informations hiérarchiques, des contacts, des missions, puis encodées pour permettre la recherche sémantique et l’intégration dans des projets d’intelligence artificielle (RAG, chatbots, etc.).

Contenu :
Chaque entrée du jeu de données représente une entité ou un service administratif, avec les informations suivantes :

  • Nom, type et mission,
  • Coordonnées (adresses, téléphones, emails, sites, horaires, réseaux sociaux…),
  • Informations hiérarchiques et organigramme,
  • Responsables identifiés,
  • URL de référence sur l’annuaire officiel,
  • Texte synthétique de description
  • Vecteur d’embedding (encodage sémantique du texte).

Format : Parquet (.parquet)
Langue : français

Accès au jeu de données ainsi qu'à sa description complète sur la plateforme Hugging Face :
👉 Consulter le dataset sur Hugging Face

Licence :
Licence Ouverte / Etalab 2.0

Source des données brutes :

Dernière mise à jour
27 mai 2025
Qualité des métadonnées:
Bon(89 %)
  • Couverture temporelle non renseignée

1 Fichier principal

Mis à jour le 26 mai 2025 parquet 12
1 Documentation

Mis à jour le 22 juin 2025 html 10