Inventaire des bases de données relatives à la santé
Description
Dans le cadre de ses missions, le département Etalab a réalisé un travail de recensement le plus complet possible des bases et jeux de données publiques existantes dans le domaine de la santé, et publie cet inventaire en open data. 172 bases de données de 79 gestionnaires ont été recensés.
Pour faciliter la découverte des données, une sélection des principales bases disponibles en format ouvert sur data.gouv.fr est également accessible ici. La liste n'est pas exhaustive et est ouverte aux contributions.
Méthodologie
Le travail de réalisation de l’inventaire a été fait gestionnaire après gestionnaire, en travaillant en priorité sur les gestionnaires principaux, et ceux pour lesquelles le réalisation d’un entretien était possible. Deux méthodologies différentes ont été suivies selon les gestionnaires :
- Gestionnaires avec entretien : travail de recherche en chambre en amont de l’entretien, afin de lister l’ensemble des bases concernées, ainsi que l’ensemble des informations manquantes et questions à poser. L’entretien permet ensuite de valider la pertinence de chaque base identifiée, et d'obtenir les informations requises.
- Gestionnaires sans entretiens (ces gestionnaires sont ceux qui produisent un nombre réduit de jeux de données) : Travail de recherche en chambre uniquement.
Des entretiens ont été réalisés avec les gestionnaires suivants :
- Agence technique de l'information sur l'hospitalisation (ATIH) ;
- Assistance Publique - Hôpitaux de Paris (AP-HP) ;
- Agence nationale de sécurité du médicament et des produits de santé (ANSM).
Limites
Une première limite réside dans la compréhension de l’origine des données de chaque jeu, ainsi de l’entité ou la/les personne(s) propriétaire des données. Cette information a généralement été obtenue à travers les entretiens réalisés. Les bases gérées par les gestionnaires que n'ont pas été contactés ont donc une probabilité d’erreur plus importante pour la partie « origine des données » et « propriétaire des données ».
Une autre limite rencontrée réside dans la compréhension de la notion de secret statistique rattaché aux enquêtes couvertes par Loi n° 51-711 du 7 juin 1951 sur l'obligation, la coordination et le secret en matière de statistiques. Les enquêtes concernées par cette loi sont des enquêtes avec informations à caractère personnel et identifiant. Par conséquent, aucune des enquêtes concernées ne sont publiables en l’état. En revanche, ces enquêtes servent en règle générale de base pour la construction d’indicateurs synthétiques et de séries chronologiques qui, eux, sont publiables et publiés. Cette distinction concerne plusieurs enquêtes présentes dans le périmètre de recherche.
Ressources
Ce jeu de données contient quatre ressources :
- Une liste des gestionnaires des bases recensées ;
- Un inventaire des bases de données ;
- Un inventaire des publications et des études réalisées à partir des bases recensées ;
- Une liste des thématiques groupées par catégorie.
Détails sur les métadonnées
Nous détaillons ci-dessous les quelques métadonnées notables
- Thématique : Nous avons identifié quatre thématiques possibles, afin de réaliser un premier travail de catégorisation au sein même de l’inventaire.
- Données de santé publique et épidémiologie : données sur les habitudes de vie, les inégalités de santé, l'épidémiologie, etc.
- Données sur les offres de soins : informations sur les infrastructures, les services proposés, le personnel, les honoraires, etc.
- Données sur les consommations de soins et dépenses : données sur les activités des établissements de santé, les consultations, les médicaments et dispositifs, etc.
- Données sur les performances et opérations : informations sur les performances financières, les performances opérationnelles, etc.
- Typologie : l’inventaire est composé de trois types de données :
- Les données provenant de documents administratifs
- Les données provenant d’enquêtes
- Les données présentant un annuaire
- Présence sur data.gouv.fr : sur ce champ, nous avons notifié si les bases étaient présentes ou non sur data.gouv.fr. Nous avons également notifié une présence partielle lorsque, par exemple, certains millésimes sont manquants sur data.gouv.fr.
- Origine des données : dans ce champ, nous nous efforçons d’expliquer de manière synthétique le processus ayant abouti à la production des données, et de mentionner les acteurs impliqués.
Producteur
Dernière mise à jour
5 août 2021
Licence
Licence Ouverte / Open Licence version 2.0
Qualité des métadonnées :
Description des données renseignée
Documentation des fichiers manquante
Licence renseignée
Fréquence de mise à jour respectée
Formats de fichiers standards
Couverture temporelle non renseignée
Couverture spatiale renseignée
Tous les fichiers sont disponibles
Qualité des métadonnées
Documentation des fichiers manquante
Couverture temporelle non renseignée
1 API
Il n'y a pas encore de réutilisation pour ce jeu de données.
Il n'y a pas encore de discussion pour ce jeu de données.
Il n'y a pas encore de ressources communautaires pour ce jeu de données.
Informations
Mots-clés
ID
60fad4f6535156fca3ee47cf
Temporalité
Création
23 juillet 2021
Fréquence
Sans régularité
Dernière mise à jour
5 août 2021
Couverture spatiale
Couverture territoriale
France
Granularité de la couverture territoriale
Autre
Actions
Intégrer sur votre site
Statistiques des 12 derniers mois
Visites
3,2k
Téléchargements
672
Réutilisations de ce jeu de données
0
Abonnés
9