Les délibérations de la CNIL vectorisées

Description

Ce jeu de données contient une version traitée, structurée et vectorisée des délibérations et décisions officielles de la CNIL (Commission Nationale de l’Informatique et des Libertés).

Les délibérations sont couverts depuis 1979 et incluent des documents tels que des avis, des recommandations, des normes simplifiées, des autorisations générales ou encore des décisions formelles.
Les données brutes sont publiées sur data.gouv.fr, le portail open data de la DILA et disponibles également sur le site Legifrance.gouv.fr.

Les données sont encodées pour permettre la recherche sémantique et l’intégration dans des projets d’intelligence artificielle (RAG, chatbots, etc.).

Contenu :
Chaque entrée du jeu de données représente un extrait cohérent d’une délibération (ou décision) avec les informations suivantes :

  • Identifiants unique de morceau de donnée et du document source,
  • Nature de l’acte (délibération, décision, etc.),
  • Statut du document,
  • Nature de la délibération,
  • Titre court et titre complet de l’acte,
  • Numéro officiel et date de publication,
  • Contenu textuel extrait et structuré par blocs,
  • Texte formaté pour l’analyse sémantique,
  • Vecteur d’embedding (encodage sémantique du texte).

Format : Parquet (.parquet)

Langue : français

Accès au jeu de données ainsi qu'à sa description complète sur la plateforme Hugging Face :
👉 Consulter le dataset sur Hugging Face

Licence :
Licence Ouverte / Etalab 2.0

Source des données brutes :

Dernière mise à jour
20 janvier 2026

Vues

0

Téléchargements

0

Qualité des métadonnées:
Bon(89 %)
  • Couverture temporelle non renseignée

Il n'y a pas encore de ressources communautaires pour ce jeu de données.