La mise à disposition de ce jeu de données synthétiques (données fictives) et de ces exercices sur la base principale du SNDS a pour objectif de renforcer les compétences des utilisateurs de la base principale du SNDS autour du ciblage d’une population d’étude.
Ce jeu de données synthétiques a été créé dans le cadre des travaux de déploiement de l’expertise dans le traitement des données de la base principale du SNDS. Créé par Jérôme Brocca, Chef de projet Données de santé à la Direction du Numérique (DNUM), il conclut le module “Savoir cibler une population d’étude dans la base principale du SNDS”.
Le jeu de données synthétiques s’adresse aux débutants, primo-accédants utilisateurs de la base principale du SNDS.
Ce jeu de données synthétiques a été généré sans extraction préalable de données source de la base principale du SNDS, uniquement en répliquant des données du SNDS à partir d’un code SAS par un expert qui maîtrise les règles “métier” de ces données. Ces données présentent la même structure que les données SNDS source (librairies, tables, variables, codage…), le contenu des variables et la cohérence des informations ressemblent à ce qui est réellement observé dans les données source.
Il contient :
- 1 092 sujets distincts ;
- des données de séjours hospitaliers du PMSI MCO sur la période 2022-2023 ;
- des données de remboursement de soins de ville (médicaments, consultations, procédures…), sur la période 01/01/2023-01/01/2025.
Le choix de création des tables et variables créées est lié aux cas d’usage dans lesquels on va chercher à :
- comptabiliser le nombre de sujets ayant eu une délivrance d’antibiotiques en 2023
- sélectionner des sujets diabétiques en 2023 à partir de leurs diagnostics hospitaliers et leur consommation de médicaments.
Cela nécessite donc la présence de données relatives aux individus, aux séjours hospitaliers du PMSI MCO, et à des données de remboursement de soins de ville notamment en lien avec les médicaments.
Pour les 2 exercices, les tables suivantes ont été générées :
- ER_BIO_F
- ER_CAM_F
- ER_ETE_F
- ER_PHA_F
- ER_PRS_F
- ER_TIP_F
- IR_BEN_R
- IR_PHA_R
- NT_LPP
- T_MCO22A
- T_MCO22B
- T_MCO22C
- T_MCO22D
- T_MCO22E
- T_MCO22UM
- T_MCO23A
- T_MCO23B
- T_MCO23C
- T_MCO23D
- T_MCO23E
- T_MCO23UM
Le détail de ces tables (variables, format) créées à l’identique des tables réelles est disponible dans le document Kwikly via ce lien.
Le détail de ces tables (variables, format) est disponible dans le document Kwikly via ce lien.
Avoir accès au logiciel SAS pour lire et analyser les données SNDS synthétiques (possibilité d’accéder à une version gratuite de SAS - SAS OnDemand via ce lien). Une fiche explicative de la procédure à suivre pour accéder à SAS OnDemand et accéder au jeu de données synthétiques est fournie à l’utilisateur.
28/05/2025.
Un support peut être apporté en sollicitant le HDH à l'adresse de messagerie suivante :
dir.guichet@health-data-hub.fr
Pour citer la base de données, vous pouvez utiliser le DOI suivant : https://doi.org/10.60597/742a-7406
0
0