République
Française
Ce jeu de données contient une version traitée, structurée et vectorisée des fiches pratiques publiées sur le site Service-Public.fr, le site officiel d'information et de démarches administratives.
Les contenus ont été extraits, nettoyés, structurés par sections, puis découpés (chunkés) et vectorisés pour permettre la recherche sémantique et l’intégration dans des projets basés d’intelligence artificielle (RAG, assistants, etc.).
Contenu :
Chaque entrée du jeu de données représente un fragment de texte cohérent issu d’une fiche, avec les informations suivantes :
Format : Parquet (.parquet)
Langue : français
Accès au jeu de données ainsi qu'à sa description complète sur la plateforme Hugging Face :
👉 Consulter le dataset sur Hugging Face
Licence :
Licence Ouverte / Etalab 2.0
Source des données brutes :
Couverture temporelle non renseignée