Transparence-santé

Description

REFONTE DE TRANSPARENCE-SANTE

Depuis plusieurs mois, un travail de refonte de la base Transparence-Santé a été engagé par le Ministère des Solidarités et de la Santé (site de déclaration et site de publication destinée au grand public). L’équipe projet vous annonce que la nouvelle plateforme sera mise à disposition :

Début 2022.

En conséquence, à partir de cette date, les données qui seront disponibles sur Data.gouv.fr respecteront le nouveau modèle de données.
Pour plus d’information, merci de contacter l’équipe support : TRANSPARENCE-SANTE-SUPPORT@sante.gouv.fr


Attention : le jeu de données contient plus de 10 millions de lignes. Il convient de disposer d’un logiciel permettant d’afficher l’ensemble de ces lignes.


La base de données publique Transparence - Santé rend accessible l'ensemble des informations déclarées par les entreprises sur les liens qu'elles entretiennent avec les acteurs du secteur de la santé. Pilotée par le ministère chargé de la santé, cette initiative de transparence vise à préserver la nécessaire relation de confiance entre les citoyens, les usagers et les multiples acteurs du système de santé.

Conformément aux articles L. 1453-1 et L. 1453-2 du code de la santé publique, les entreprises produisant ou commercialisant des produits à finalité sanitaire, cosmétique ou sanitaire doivent rendre publics les conventions, les rémunérations et les avantages accordés aux différents acteurs intervenant dans le champ de la santé, notamment aux professionnels de santé.

Les informations mises à disposition sont issues de déclarations réalisées, deux fois par an, par les entreprises et publiées sur le site www.transparence.sante.gouv.fr. Elles contiennent des données à caractère personnel et à ce titre le réutilisateur est tenu de se conformer aux obligations prévues par la loi n° 78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés.

Les entreprises sont responsables de l’exactitude des contenus publiés.

La réutilisation des données issues de la base Transparence - Santé est soumise au respect de la licence de réutilisation de l’information.

La réutilisation des données est restreinte, elle doit être faite dans le respect de la finalité de la transparence des liens d’intérêts, ce qui exclut notamment une réutilisation à des fins strictement commerciales.

Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International (CC BY-NC-SA 4.0)

Par ailleurs, en cas de réutilisation des données donnant lieu à un traitement de données, le réutilisateur doit se conformer aux dispositions de la loi n° 78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés. Le réutilisateur doit aussi assurer la sécurité et la protection des seules données directement identifiantes contre l'indexation par des moteurs de recherche externes.

Le jeu de données contient les champs et les données que le public est autorisé à voir sur le site www.transparence-sante.gouv.fr à l’instant T, c’est-à-dire les déclarations publiées au moment de la date de la demande d’extraction sur le site data.gouv.fr et les tags des demandes de rectification sur ces déclarations.

Dernière mise à jour
2 septembre 2025

Vues

0

Téléchargements

0

Qualité des métadonnées:
Bon(67 %)
  • Documentation des fichiers manquante

  • Fréquence de mise à jour non respectée

  • Couverture temporelle non renseignée

Votre question porte sur autre chose que ce jeu de données ? Visiter notre forum

28 discussions

Site introuvable

Posté le 6 novembre 2024
Bonjour, Le serveur est introuvable. Le site a fermé ?

Données antérieures à 2019

Posté le 5 avril 2024
Bonjour, En comparant les données actuelles sur le site de transparence santé et une version antérieure des données téléchargée il y a plusieurs années, il semble que les données avant 2019 soient partielles. Est-ce normal ? Merci par avance,

Mise à jour quotidienne du dump Transparence Santé

Posté le 26 octobre 2022
Bonjour, Le dump de Transparence Santé en ressource communautaire est maintenant mis à jour automatiquement de façon quotidienne. Il résulte du scrap de l'api open-data soft en paginant l'url de téléchargement par mois (https://gitlab.has-sante.fr/has-sante/public/adex/-/blob/master/preprocessing/src/tasks/download_extract.py#L158). ⚠ Pour rappel, l'url de téléchargement en fichier principal ne permet pas de télécharger l'intégralité du jeu de donnée. C'est ce qui a motivé le dépôt de cette ressource communautaire.
Posté le 31 octobre 2022
Bonjour, J'ai voulu télécharger le dump mais j'obtiens une erreur comme quoi la clé spécifiée n'existe pas.
Posté le 1 novembre 2022
Bonjour, Désolé pour le problème technique et merci de l'avoir signalé. J'ai restoré la dernière version du dump le temps d'investiguer.

Possibilité de préfiltrage avant téléchargement méta données

Posté le 3 octobre 2022
Bonjour, Il me semble qu'il avait été communiqué qu'à l'avenir, après refonte du site en début 2022, il serait possible de pré filtrer le fichier public récapitulatif pour éviter de télécharger "le monstre" de plusieurs giga qui rend toute analyse extrêment compliqué. Des nouvelles sur cette avancée ou est-elle totalement enterrrée? Cdlt, Guillaume

Dumps declarations 2022-03-25

Posté le 25 mars 2022
Bonjour, J'ai ajouté un dump des déclarations de Transparence santé (nouvelle version) datant du 25/03/2022. Lors du dépôt sur data.gouv j'ai eu des erreurs 500, malgré tout les données sont visibles sur la page (en doublon désolé 🙏). Le dump a été obtenu en "paginant" par mois l'url de téléchargement. Le fichier décompressé fais 6.4GB.
Posté le 20 octobre 2022
Bonjour, En comparant avec les anciens fichiers séparés il me semble pourtant qu'il manque des millions de lignes! On peut le constater très simplement même sans avoir conserver les fichiers précédents. Il suffit de faire un vlookup sur les lignes rémunérations en utilisant comme référent de recherche la valeur de la ligne identifiant de la convention associée à la ligne rémunération. Beaucoup de ces de lignes de conventions n'apparaissent pas dans le fichier final! Hors il est impossible de soumettre une ligne rémunération sans avoir au préalable soumis la ligne convention associée. Pouvez-vous corriger le fichier? En l'espèce il ne sert à rien car aucune analyse pertinente ne peut être faite avec tant qu'il manquera autant de lignes. Merci d'avance Cdlt, Guillaume
Posté le 20 octobre 2022
Bonjour, Merci pour votre message, je vais regarder. Je n'ai pas remarqué ce problème sur https://adex.has-sante.fr. À noter que le dump sera bientôt mis à jour quotidiennement quand https://gitlab.has-sante.fr/has-sante/public/adex/-/merge_requests/108 sera fusionné.
Posté le 20 octobre 2022
Merci pour la réponse super rapide Timothée :) Si vous avez encore le jeu des 3 fichiers précédents ce sera surement une meilleure analyse car vous pourrez aussi trouver les lignes avantages manquantes (en tout cas chez moi) vu que pour celles-ci il est impossible de faire un vlookup directement sur le fichier comme pour les lignes rémunérations. Savez-vous si la possibilité de pré filtrer le fichier avant téléchargement sera éventuellement mise en place? Mes problèmes résultent peut-être de devoir utiliser des logiciels comme Power BI pour préfiltrer (éventuellement mal avec des pertes de données) avant toute analyse car le fichier est juste trop gros pour être ouvert directement dans Excel. Encore une fois merci pour la réponse super rapide! Bon courage Cdlt, Guillaume
Posté le 20 octobre 2022
Re bonjour, Je n'ai malheureusement plus les 3 fichiers de l'ancienne version. Je n'ai pas essayé mais à mon avis ouvrir le dump complet de 6Gb dans Excel ou PowerBi tel quel risque de ne pas bien se passer. Pour ce qui est des déclaration manquantes, il est normal que des anciens fichiers aient des déclarations supplémentaires, car les déclarations ne sont plus diffusées par Transparence Santé 5 ans après leur publication (sauf si convention toujours en cours). Par ailleurs vous pouvez utiliser les fonctionnalités d'Opendatasoft sur Transparence Santé directement pour préfiltrer les données, voire réaliser directement certaines analyses (lien https://www.transparence.sante.gouv.fr/explore/dataset/declarations/table/)
Posté le 20 octobre 2022
Merci beaucoup pour le dernier lien! Effectivement il semble qu'utiliser Power BI est l'explication aux lignes manquante. Par contre j'ai l'impression que l'on ne peut pas cumuler les filtres (par exemple sélectionner plusieurs entreprises pour extraire toutes leurs données d'un coup), à moins que j'ai manqué un épisode. En tout cas merci beaucoup Timothée pour l'aide ultra rapide!

Données indisponibles

Posté le 8 mars 2022
Bonjour, Les données sont indisponibles depuis maintenant 3 semaines (au moins depuis le 16 février). Nous (Euros For Docs) vous avons prévenus par mail (à TRANSPARENCE-SANTE-SUPPORT@sante.gouv.fr, comme indiqué dans la description), mais n'avons pas eu de réponse. J'essaye donc ici... Par ailleurs la nouvelle plateforme https://www.transparence.sante.gouv.fr/pages/accueil/ a d'énormes problèmes, comme si elle n'avait pas été testée convenablement. Quand prévoyez vous un retour à la normale? Merci, Luc Martinon

Transparence santé - Format des données

Posté le 14 février 2021
Bonjour, Les fichiers proposés sont proposés avec des séparateurs de champs ";" (point-virgule) mais certains champs (souvent les adresses) contiennent ce caractère ce qui interdit une lecture automatisé de l'ensemble des lignes. Vous serait-il possible de proposer un caractère séparateur qui ne soit présent dans aucun des champs, comme une tabulation, peut-être. Merci pour ce que vous pourrez faire Cordialement.
Posté le 16 février 2021
Bonjour, Les champs contenant des ";" semblent être entre double guillemets. Problème suivant (déjà signalé par un utilisateur) : il y a des retours à la ligne dans certains champs. ça ne simplifie vraiment pas la lecture ! Cordialement.
Posté le 20 février 2021
En fait, on peut poser des questions ... Merci !

Maintenance Site

Posté le 6 janvier 2021
Bonjour nous sommes le 6 Janvier 2021 - le site est annoncée en maintenance jusqu'au 13/04 rassurez nous svp :)
Posté le 6 janvier 2021
Le site de déclaration entreprise semble également en maintenance https://www.entreprises-transparence.sante.gouv.fr/ En attendant vous pouvez consulter les données (qui ne devraient plus évoluer...) sur https://eurosfordocs.fr
Posté le 6 janvier 2021
Merci Pierre-Alain je cherchais surtout les data avec les Maj
Posté le 6 janvier 2021
Les données évoluent très peu au jour le jour entre octobre et mars, ce sont essentiellement des corrections même si les entreprises peuvent déclarer au fil de l'eau (cf https://www.eurosfordocs.fr/data#transparence-sant-). J'espère que nous aurons vite des compléments d'information sur cette maintenance.
Posté le 8 janvier 2021
Bonjour, Est-il possible d'avoir le jeu de données ? le lien de téléchargement ne fonctionne pas.
Posté le 8 janvier 2021
En effet. Le service est revenu, mais pas l'export de données ! Une version des données nettoyées par eurosfordocs est ici https://www.eurosfordocs.fr/data#fichiers-nettoy-s (elles datent du 5 janvier du coup). Nous n'exposons pas les données sources, car nous n'en voyons pas l'intérêt jusqu'à présent...
Posté le 8 janvier 2021
Merci monsieur Jachiet pour ce retour rapide. Les données via le site sont intéressantes mais il est dommage de ne pas pouvoir faire de traitements dessus. Un Dataset sans les données c'est frustrant :). Est-ce un problème liés à la volumétrie ? Merci beaucoup pour le lien vers eurosfordocs, je ferais avec ça mais je préfère avoir accès aux sources directement. Bien cordialement, Xavier
Posté le 8 janvier 2021
Merci Pierre-Alain pour toutes ces infos Bonne journée à vous Marc

Mise à jour du fichier

Posté le 20 novembre 2020
Bonjour, La dernière mise à jour semble datée d'Octobre 2018. Il manque donc 2 ans de données. Quand comptez vous mettre à disposition les nouvelles données ? Merci

Rectification des données

Posté le 4 août 2020
Bonjour. Je suis professionnelle de santé. J'ai 2 lignes liées à plusieurs stages. J'ai été informé qu'elles pouvaient être supprimées. Comment faut-il faire ? Merci

Droit de rectification Transparence Santé

Posté le 15 décembre 2019
Bonjour, les déclarations me concernant sur transparence santé sont fausses. Je souhaite un droit d'acces et de rectification pour l'année 2018 Comment faire ? Tres cordialement JF Nicolas

Declaration transparence

Posté le 28 mai 2019
Bonjour, Je suis gérante d'une société de conseil stratégique et éopartion dans le domaine de la santé, je souhaiterais déclarer les rémunérations / hébergements etc. perçus à des professionnels de santé pour une opération réalisée sur le 1er trimestre . La date limite est bien le 30 juin? Avez vous un mode d'emploi ou un lien, je ne trouve pas ? Merci infiniment. Cordialement, Oriane NOiR

Format non valide - Sauts de lignes présents dans certains champs

Posté le 16 janvier 2019
Bonjour, Il semblerait que certains champs renseignés par les utilisateurs/entreprises contiennent des sauts de lignes (caractère invisible 'CRLF' généré en appuyant sur la touche ENTREE qui caractérise la fin d'une ligne) forcant la suite des données d'une même entrée/ligne à apparaître sur la ligne suivante. Cela cause un décalage des données et rend l'import en base de données impossible. Example: Dans le fichier "declaration_convention", dans la colonne "benef_objet_social", à la ligne 5587, le texte contient un saut de ligne ('CRLF'). Les données qui devaient donc se trouver dans les colonnes suivantes (après "benef_objet_social") se retrouvent à la ligne suivante dans des colonnes qui ne leurs courrespondent pas. Illustration: name_column_1; name_column_2; name_column_3; name_column_4; CRLF data___line___1; data___line___1; data___line___1; data___line___1; CRLF . . . data___line___7; data___li CRLF ne___7; data___line___7; data___line___7; CRLF data___line___8; data___line___8; data___line___8; data___line___8; CRLF data___line___9; data___line___9; data___line___9; data___line___9; CRLF Un recherche/remplace des CRLF n'est évidemment pas possible car nous devons garder les CRLF pour, en effet, caractériser la fin des lignes. Une validation du format des données lors de la saisie utilisateur est assez simple à mettre en place et empêcherait les problèmes de ce type par la suite. Je m'adresse à la communauté/équipe etalab pour savoir si vous avez réussi à contourner ce problème et comment? Cela m'aiderait grandement pour intégrer ces fichiers dans une base de données.

Jeux de données par années

Posté le 4 octobre 2018
Bonjour, Serait il possible de disposer des jeux de données par années, afin de travailler sur des fichiers plus courts et exploitables? Merci beaucoup Bien à vous.
Posté le 19 novembre 2018
Bonjour, Oui, c'est ce que nous prévoyions de réaliser. La MEP est prévue pour le 1er trimestre 2019.

Suggestion d'un nouveau mot-clé pour améliorer les métadonnées

Posté le 24 mai 2018
Bonjour, je vous propose ce nouveau mot-clé : "cadeaux"

Les fichiers pdf de Description et de License sont vide

Posté le 18 mai 2018
Pourriez-vous corriger ces erreurs ? Les fichiers n'étaient pas vide en novembre. Bien cordialement
Posté le 10 septembre 2018
Le pdf de Description et la licence sont toujours vides. Pourriez-vous les corriger ?
Posté le 11 septembre 2018
Bonjour, toutes nos excuses pour cette anomalie. La correction va bientôt passé en production. Equipe transparence-santé.
Posté le 11 septembre 2018
Merci !
Posté le 17 novembre 2018
Je me joins à cette discussion, la licence a bien été rajoutée mais ça n'est pas la licence homologuée par la direction interministérielle des systèmes d'information et de communication de l'Etat conformément à l'article D. 323-2-2 du code des relations entre le public et l'administration. Pourriez-vous mettre remplacer la version actuelle par celle qui est respecte la loi s'il vous plaît ? Bien cordialement,

De la base ministérielle Transparence santé, il a été question au colloque 2018 « sous- surmédicalisation, surdiagnostics et surtraitement »

Posté le 23 avril 2018
Voici le titre de ma communication orale le samedi 14 avril au colloque 2018 de Bobigny : « Comment les firmes pharmaceutiques profitent-elles des failles de conception et d’usage de la base de données Transparence Santé pour mieux dissimuler les liens qui les unissent aux professionnels de santé ? » Est-il possible de partager le fichier pdf de mon poster scientifique, car hélas, il y a vraiment beaucoup à dire ?

Pb pour ouvrir les fichiers

Posté le 10 avril 2018
Bonjour j'essai d'ouvrir les fichiers mais je n'y arrive pas. Excel (trop gros bien sûr), Access (idem), SQL (le process s'arrête. Trop gros aussi?). SVP, est ce que quelqu'un aurait une astuce? Merci d'avance,

Durée de l'opération de maintenance

Posté le 10 avril 2018
J'essaie d'accéder à la base transparence santé depuis hier. Savez vous combien de temps l'opération de maintenance va t elle durer ? N'est il pas possible d'uploader le fichier sur datagouv en backup ?
Posté le 13 avril 2018
Merci pour le chargement de la ressource. Du coup, je pense qu'il faut mettre à jour la description de la ressource :)

Mise à jour S2 2017

Posté le 23 mars 2018
Bonjour, La MAJ sur le site de transparence-santé pour le 2e semestre 2017 est en ligne. Savez-vous quand le dossier sera mis à jour sur data.gouv.fr ? Merci
Posté le 17 avril 2018
Bonjour, Du nouveau sur la mise à jour du fichier sur data.gouv ? Merci