Ce jeu de données contient une version vectorisée du catalogue des jeux de données publiés sur data.gouv.fr.
Uniquement les jeux de données ayant une description d'au minimum 100 caractères sont répertoriés dans ce jeu de données. Ceci afin de minimiser le bruit de jeux de données éventuellement incomplets.
Les contenus ont été retraités et vectorisés pour permettre la recherche sémantique et l’intégration dans des projets basés d’intelligence artificielle (RAG, assistants, moteur de recherche etc.).
Contenu :
Chaque entrée du jeu de données représente un jeu de données publié sur data.gouv.fr, avec les informations suivantes :
Format : Parquet (.parquet)
Langue : français
Accès au jeu de données ainsi qu'à sa description complète sur la plateforme Hugging Face :
👉 Consulter le dataset sur Hugging Face
Licence :
Licence Ouverte / Etalab 2.0
Source des données brutes :
0
0
Couverture temporelle non renseignée
Couverture spatiale non renseignée