Fiches pratiques Travail Emploi vectorisées

Description

Ce jeu de données contient une version traitée, structurée et vectorisée des fiches pratiques publiées sur le site officiel du Ministère du Travail et de l’Emploi . Les contenus ont été extraits, nettoyés, structurés par section, puis découpés (chunkés) et vectorisés pour permettre la recherche sémantique et l’intégration dans des projets d’intelligence artificielle (RAG, chatbots, etc.).

Contenu :
Chaque entrée du jeu de données représente un fragment de texte cohérent issu d’une fiche, avec les informations suivantes :

  • Titre de l’article,
  • Paragraphe d’introduction,
  • Texte extrait,
  • Métadonnées (identifiant, URL, date de publication, etc.),
  • Vecteur d’embedding (encodage sémantique du texte).

Format : Parquet (.parquet)
Langue : français

Accès au jeu de données ainsi qu'à sa description complete sur la plateforme Hugging Face :
👉 Consulter le dataset sur Hugging Face

Licence :
Licence Ouverte / Etalab 2.0

Source des données brutes :

Dernière mise à jour
29 décembre 2025

Vues

0

Téléchargements

0

Qualité des métadonnées:
Bon(89 %)
  • Couverture temporelle non renseignée

Informations

Identifiant
6830a0bdcbad82b7876585bd

Temporalité

Création
23 mai 2025
Fréquence
Trimestrielle
Dernière mise à jour
29 décembre 2025

Couverture spatiale

Zones
France
Granularité de la couverture territoriale
Pays

Intégrer sur votre site