Ce jeu de données contient une version traitée, structurée et vectorisée de la législation et réglementation nationale française consolidée, publiée sur data.gouv.fr et disponibles dans leur version brute sur le portail open data de la DILA.
Le corpus regroupe l’ensemble des textes juridiques nationaux consolidés (lois, codes, décrets, arrêtés...) en vigueur ou bientôt abrogés.
Les données sont encodées pour permettre la recherche sémantique et leur intégration dans des projets d’intelligence artificielle (RAG, chatbots, etc.).
Contenu :
Chaque entrée du jeu de données représente un article ou une partie de texte consolidé, avec les informations suivantes :
Format : Parquet (.parquet)
Langue : français
Accès au jeu de données ainsi qu'à sa description complète sur la plateforme Hugging Face :
👉 Consulter le dataset sur Hugging Face
Licence :
Licence Ouverte / Etalab 2.0
Source des données brutes :
0
0
Couverture temporelle non renseignée