Fiches pratiques Travail Emploi vectorisées

Description

Ce jeu de données contient une version traitée, structurée et vectorisée des fiches pratiques publiées sur le site officiel du Ministère du Travail et de l’Emploi . Les contenus ont été extraits, nettoyés, structurés par section, puis découpés (chunkés) et vectorisés pour permettre la recherche sémantique et l’intégration dans des projets d’intelligence artificielle (RAG, chatbots, etc.).

Contenu :
Chaque entrée du jeu de données représente un fragment de texte cohérent issu d’une fiche, avec les informations suivantes :

  • Titre de l’article,
  • Paragraphe d’introduction,
  • Texte extrait,
  • Métadonnées (identifiant, URL, date de publication, etc.),
  • Vecteur d’embedding (encodage sémantique du texte).

Format : Parquet (.parquet)
Langue : français

Accès au jeu de données ainsi qu'à sa description complete sur la plateforme Hugging Face :
👉 Consulter le dataset sur Hugging Face

Licence :
Licence Ouverte / Etalab 2.0

Source des données brutes :

Dernière mise à jour
27 mai 2025
Qualité des métadonnées:
Bon(89 %)
  • Couverture temporelle non renseignée

1 Fichier principal

Mis à jour le 26 mai 2025 parquet 6
1 Documentation

Mis à jour le 12 juin 2025 html 6