Service-public.fr - Annuaire de l’administration - Base de données locales vectorisée

Description

Ce jeu de données contient une version traitée, structurée et vectorisée de la Base de données locales de l'annuaire de l'administration, dont les données sont publiées par la DILA sur data.gouv et disponible sur lannuaire.service-public.fr.
Il référence plus de 63 000 guichets publics locaux (mairies, préfectures, CAF, services sociaux, antennes locales des ministères, etc.), avec des métadonnées complètes sur leurs coordonnées, horaires, modes de contact, et périmètres géographiques d’intervention.
Les données sont ensuite encodées pour permettre la recherche sémantique et l’intégration dans des projets d’intelligence artificielle (RAG, chatbots, etc.).

Contenu :
Chaque entrée du jeu de données représente un organisme administratif local, avec les informations suivantes :

  • Nom, type et mission,
  • Coordonnées (adresses, téléphones, emails, sites, horaires, réseaux sociaux…),
  • Informations hiérarchiques et organigramme,
  • Responsables identifiés,
  • URL de référence sur l’annuaire officiel,
  • Texte synthétique de description
  • Vecteur d’embedding (encodage sémantique du texte).

Format : Parquet (.parquet)

Langue : français

Accès au jeu de données ainsi qu'à sa description complète sur la plateforme Hugging Face :
👉 Consulter le dataset sur Hugging Face

Licence :
Licence Ouverte / Etalab 2.0

Source des données brutes :

Dernière mise à jour
3 décembre 2025

Vues

0

Téléchargements

0

Qualité des métadonnées:
Bon(89 %)
  • Couverture temporelle non renseignée

Il n'y a pas encore de ressources communautaires pour ce jeu de données.