La mise à disposition de ce jeu de données synthétiques (données fictives) et de ces exercices sur la base principale du SNDS a pour objectif de renforcer les compétences des utilisateurs pour cibler une population d’étude, pré-traiter les données et vérifier leur extraction.
Ce jeu de données synthétiques a été créé dans le cadre des travaux visant à déployer l’expertise dans le traitement des données de la base principale du SNDS. Créé par Jérôme Brocca, Chef de projet Données de santé à la Direction du Numérique (DNUM), il constitue la base d’exercices associés aux deux premiers modules “Savoir cibler une population d’étude dans la base principale du SNDS” et “Savoir pré-traiter et vérifier son extraction de la base principale du SNDS”.
Le jeu de données synthétiques s’adresse aux débutants, primo-accédants utilisateurs de la base principale du SNDS.
Ce jeu de données synthétiques a été généré sans extraction préalable de données source de la base principale du SNDS, uniquement en répliquant des données du SNDS à partir d’un code SAS par un expert qui maîtrise les règles “métier” de ces données. Ces données présentent la même structure que les données SNDS source (librairies, tables, variables, codage…), le contenu des variables et la cohérence des informations ressemblent à ce qui est réellement observé dans les données source.
Il contient :
- 1 092 sujets distincts ;
- des données de séjours hospitaliers du PMSI MCO sur la période 2022-2023 ;
- des données de remboursement de soins de ville (médicaments, consultations, procédures…), sur la période 01/01/2023-01/01/2025.
Le choix de création des tables et variables créées est lié aux cas d’usage dans lesquels l’utilisateur va chercher à :
Cibler sa population d’étude en :
Pré-traiter et vérifier son extraction en :
Cela nécessite la présence de données pseudonymisées relatives aux individus, aux séjours hospitaliers du PMSI MCO, et à des données de remboursement de soins de ville notamment en lien avec les médicaments.
Pour les deux ensembles d’exercices, les tables suivantes ont été générées :
- ER_BIO_F
- ER_CAM_F
- ER_ETE_F
- ER_PHA_F
- ER_PRS_F
- ER_TIP_F
- IR_BEN_R
- IR_PHA_R
- NT_LPP
- T_MCO22A
- T_MCO22B
- T_MCO22C
- T_MCO22D
- T_MCO22E
- T_MCO22UM
- T_MCO23A
- T_MCO23B
- T_MCO23C
- T_MCO23D
- T_MCO23E
- T_MCO23UM
Le détail de ces tables (variables, format) créées à l’identique des tables réelles est disponible dans le document Kwikly via ce lien.
Le détail de ces tables (variables, format) est disponible dans le document Kwikly via ce lien.
Avoir accès au logiciel SAS pour lire et analyser les données SNDS synthétiques (possibilité d’accéder à une version gratuite de SAS - SAS OnDemand via ce lien). Une fiche explicative de la procédure à suivre pour accéder à SAS OnDemand et accéder au jeu de données synthétiques est fournie à l’utilisateur.
28/05/2025.
Un support peut être apporté en sollicitant le HDH à l'adresse de messagerie suivante :
dir.guichet@health-data-hub.fr
Pour citer la base de données, vous pouvez utiliser le DOI suivant : https://doi.org/10.60597/742a-7406
0
0
Il n'y a pas encore de ressources communautaires pour ce jeu de données.