Fiches pratiques Travail Emploi vectorisées

Description

Ce jeu de données contient une version traitée, structurée et vectorisée des fiches pratiques publiées sur le site officiel du Ministère du Travail et de l’Emploi . Les contenus ont été extraits, nettoyés, structurés par section, puis découpés (chunkés) et vectorisés pour permettre la recherche sémantique et l’intégration dans des projets d’intelligence artificielle (RAG, chatbots, etc.).

Contenu :
Chaque entrée du jeu de données représente un fragment de texte cohérent issu d’une fiche, avec les informations suivantes :

  • Titre de l’article,
  • Paragraphe d’introduction,
  • Texte extrait,
  • Métadonnées (identifiant, URL, date de publication, etc.),
  • Vecteur d’embedding (encodage sémantique du texte).

Format : Parquet (.parquet)
Langue : français

Accès au jeu de données ainsi qu'à sa description complete sur la plateforme Hugging Face :
👉 Consulter le dataset sur Hugging Face

Licence :
Licence Ouverte / Etalab 2.0

Source des données brutes :

Dernière mise à jour
28 décembre 2025

Vues

0

Téléchargements

0

Qualité des métadonnées:
Bon(89 %)
  • Couverture temporelle non renseignée

1 API

Il n'y a pas encore de réutilisations associées

Ajouter une réutilisation