Base de données synthétiques et exercices pratiques de ciblage d’une population d’étude et de pré-traitement de son extraction issue de la base principale du Système National des Données de Santé (SNDS)

Description
Description de la base de données :
Objectifs et finalités initiales de la base de données :

La mise à disposition de ce jeu de données synthétiques (données fictives) et de ces exercices sur la base principale du SNDS a pour objectif de renforcer les compétences des utilisateurs  pour cibler une population d’étude, pré-traiter les données et vérifier leur extraction.

Contexte de création :

Ce jeu de données synthétiques a été créé dans le cadre des travaux visant à déployer l’expertise dans le traitement des données de la base principale du SNDS. Créé par Jérôme Brocca, Chef de projet Données de santé à la Direction du Numérique (DNUM), il constitue la base d’exercices associés aux deux premiers modules “Savoir cibler une population d’étude dans la base principale du SNDS” et “Savoir pré-traiter et vérifier son extraction de la base principale du SNDS”.

Public cible :

Le jeu de données synthétiques s’adresse aux débutants, primo-accédants utilisateurs de la base principale du SNDS. 

Présentation des données :
  • Méthodologie de collecte et critères d’inclusion :

Ce jeu de données synthétiques a été généré sans extraction préalable de données source de la base principale du SNDS, uniquement en répliquant des données du SNDS à partir d’un code SAS par un expert qui maîtrise les règles “métier” de ces données. Ces données présentent la même structure que les données SNDS source (librairies, tables, variables, codage…), le contenu des variables et la cohérence des informations ressemblent à ce qui est réellement observé dans les données source.

Il contient :

- 1 092 sujets distincts ;

- des données de séjours hospitaliers du PMSI MCO sur la période 2022-2023 ;

- des données de remboursement de soins de ville (médicaments, consultations, procédures…), sur la période 01/01/2023-01/01/2025.

  • Choix des variables :

Le choix de création des tables et variables créées est lié aux cas d’usage dans lesquels l’utilisateur va chercher à :

  • Cibler sa population d’étude en :

    • comptabilisant le nombre de sujets ayant eu une délivrance d’antibiotiques en 2023
    • sélectionnant  des sujets diabétiques en 2023 à partir de leurs diagnostics hospitaliers et leur consommation de médicaments
  • Pré-traiter et vérifier son extraction en : 

    • calculant par type d’exécutant (PS/Etablissement), spécialité exécutant et prestation, le nombre d’actes de téléconsultation retrouvés dans le DCIR en 2023
    • recherchant le nombre de bénéficiaires ayant eu un séjour avec diabète en 2023

Cela nécessite la présence de données pseudonymisées relatives aux individus, aux séjours hospitaliers du PMSI MCO, et à des données de remboursement de soins de ville notamment en lien avec les médicaments.

  • Description détaillée de chaque champ :

Pour les deux ensembles d’exercices, les tables suivantes ont été générées :

- ER_BIO_F

- ER_CAM_F

- ER_ETE_F

- ER_PHA_F

- ER_PRS_F

- ER_TIP_F

- IR_BEN_R

- IR_PHA_R

- NT_LPP

- T_MCO22A

- T_MCO22B

- T_MCO22C

- T_MCO22D

- T_MCO22E

- T_MCO22UM

- T_MCO23A

- T_MCO23B

- T_MCO23C

- T_MCO23D

- T_MCO23E

- T_MCO23UM


Le détail de ces tables (variables, format) créées à l’identique des tables réelles est disponible dans le document Kwikly via ce lien.

  • Structure de la base et rationnel des fichiers :

Le détail de ces tables (variables, format) est disponible dans le document Kwikly via ce lien.

Instructions/pré-requis d’utilisation de la base :

Avoir accès au logiciel SAS pour lire et analyser les données SNDS synthétiques (possibilité d’accéder à une version gratuite de SAS - SAS OnDemand via ce lien). Une fiche explicative de la procédure à suivre pour accéder à SAS OnDemand et accéder au jeu de données synthétiques est fournie à l’utilisateur.

Dernière mise à jour :

28/05/2025.

Support :

Un support peut être apporté en sollicitant le HDH à l'adresse de messagerie suivante :
dir.guichet@health-data-hub.fr

Citation :

Pour citer la base de données, vous pouvez utiliser le DOI suivant : https://doi.org/10.60597/742a-7406

Dernière mise à jour
19 septembre 2025

Vues

0

Téléchargements

0

Qualité des métadonnées:
Bon(100 %)

Il n'y a pas encore d'API associées

Ajouter une API

Il n'y a pas encore de réutilisations associées

Ajouter une réutilisation