Inventaire des bases de données relatives à l'emploi

Mis à jour le 9 juillet 2021 — Licence Ouverte / Open Licence version 2.0

Etalab

Etalab est un département de la direction interministérielle du numérique (DINUM), dont les missions et l’organisation sont fixées par le décret du 30 Octobre 2019. Il coordonne notamment la conception et la mise en œuvre de la stratégie de l’État dans le domaine de la donnée. Ouverture (open…

60 jeux de données
36 réutilisations

Informations

Licence
Licence Ouverte / Open Licence version 2.0
ID
60d0b1ec79ce9438ee3fad3c

Temporalité

Fréquence
Sans régularité
Date de création
21 juin 2021
Dernière mise à jour de ressource
9 juillet 2021

Dimensions géographiques

Granularité de la couverture territoriale
Autre
Couverture territoriale
France

Intégrer sur votre site

URL stable

Description

Dans le cadre de ses missions, le département Etalab a réalisé un travail de recensement le plus complet possible des bases et jeux de données publiques existantes dans le domaine de l'emploi, et publie cet inventaire en open data. 161 bases de données de 26 gestionnaires ont été recensés.

Pour faciliter la découverte des données, une sélection des principales bases disponibles en format ouvert sur data.gouv.fr est également accessible ici. La liste n'est pas exhaustive et est ouverte aux contributions.

Méthodologie

Le travail de réalisation de l’inventaire a été fait gestionnaire après gestionnaire, en travaillant en priorité sur les gestionnaires principaux, et ceux pour lesquelles le réalisation d’un entretien était possible. Deux méthodologies différentes ont été suivies selon les gestionnaires :

  • Gestionnaires avec entretien : travail de recherche en chambre en amont de l’entretien, afin de lister l’ensemble des bases concernées, ainsi que l’ensemble des informations manquantes et questions à poser. L’entretien permet ensuite de valider la pertinence de chaque base identifiée, et d'obtenir les informations requises.
  • Gestionnaires sans entretiens (ces gestionnaires sont ceux qui produisent un nombre réduit de jeux de données) : Travail de recherche en chambre uniquement.

Des entretiens ont été réalisés avec les gestionnaires suivants :

  • Agence nationale pour l'amélioration des conditions de travail (ANACT) ;
  • Agence nationale de sécurité sanitaire de l'alimentation, de l'environnement et du travail (ANSES) ;
  • Caisse des Dépôts (CDC).

Limites

Une première limite réside dans la compréhension de l’origine des données de chaque jeu, ainsi de l’entité ou la/les personne(s) propriétaire des données. Cette information a généralement été obtenue à travers les entretiens réalisés. Les bases gérées par les gestionnaires que n'ont pas été contactés ont donc une probabilité d’erreur plus importante pour la partie « origine des données » et « propriétaire des données ».

Une autre limite rencontrée réside dans la compréhension de la notion de secret statistique rattaché aux enquêtes couvertes par Loi n° 51-711 du 7 juin 1951 sur l'obligation, la coordination et le secret en matière de statistiques. Les enquêtes concernées par cette loi sont des enquêtes avec informations à caractère personnel et identifiant. Par conséquent, aucune des enquêtes concernées ne sont publiables en l’état. En revanche, ces enquêtes servent en règle générale de base pour la construction d’indicateurs synthétiques et de séries chronologiques qui, eux, sont publiables et publiés. Cette distinction concerne plusieurs enquêtes présentes dans le périmètre de recherche. C’est par exemple le cas de la totalité des enquêtes de l'INSEE, ainsi que de plusieurs enquêtes de la DARES.

Ressources

Ce jeu de données contient trois ressources :

  • Une liste des gestionnaires des bases recensées ;
  • Un inventaire des bases de données ;
  • Un inventaire des publications et des études réalisées à partir des bases recensées.

Détails sur les métadonnées

Nous détaillons ci-dessous les quelques métadonnées notables

  • Thématique : Nous avons identifié quatre thématiques possibles, afin de réaliser un premier travail de catégorisation au sein même de l’inventaire.
    • Marché du travail : chômage et demandeurs d’emploi, retraite, offres d’emploi et recrutement, insertion et réorientation professionnelles, niveau d’activité, secteurs d’activité et branches professionnelles…
    • Caractéristiques de l’emploi du travailleur : contrat de travail, régime du travailleur, temps de travail et congés, salaires et indemnisations, postes et compétences…
    • Environnement de travail : conditions de travail, santé et prévention des risques professionnels (NB : cette catégorie n’apparait pas dans la page à publier car aucun jeu de donnée déjà publié sur data.gouv.fr n’a été retenu. Si des jeux intéressants venaient à être publiés, la catégorie pourrait être rajoutée)
    • Les droits et les aides liés à l’emploi : services proposés, formations et certifications, syndicats et associations, politiques publiques
  • Typologie : l’inventaire est composé de trois types de données :
    • Les données provenant de documents administratifs
    • Les données provenant d’enquêtes
    • Les données présentant un annuaire
  • Présence sur data.gouv.fr : sur ce champ, nous avons notifié si les bases étaient présentes ou non sur data.gouv.fr. Nous avons également notifié une présence partielle lorsque, par exemple, certains millésimes sont manquants sur data.gouv.fr.
  • Origine des données : dans ce champ, nous nous efforçons d’expliquer de manière synthétique le processus ayant abouti à la production des données, et de mentionner les acteurs impliqués.

Fichiers 3

Ressources communautaires 0

Vous avez construit une base de données plus complète que celles présentées ici ? C'est le moment de la partager !

Explorez les réutilisations de ce jeu de données.

Avez-vous utilisé ces données ? Référencez votre travail et augmentez votre visibilité.

Discussion entre l'organisation et la communauté à propos de ce jeu de données.