Données synthétiques - top diabète
Description
Description de la base de données :
- Objectifs et finalités initiales de la base de données :
Ce jeu de données synthétiques a été créé dans le cadre de la traduction et l’implémentation de l’algorithme utilisé par la CNAM pour construire le top diabète (lien de la fiche descriptive de l'algorithme).
Les versions Python et SAS adaptés par le HDH portent sur des données synthétiques pour les années 2018-2019 mais peuvent être étendues à d’autres années. Le programme source de la CNAM a été développé en SAS et tourne sur les données des années 2015 à 2019.
L’algorithme évoqué ci-dessus a pour objectif de cibler les personnes prises en charge pour un diabète dans la base principale du SNDS afin de créer le « Top Diabète » de la cartographie des pathologies créée et maintenue par la CNAM (version G8).
- Contexte de création :
La mise en œuvre de l'algorithme top diabète a nécessité la mobilisation des tables et variables synthétiques (fictives).
- Public cible :
Communauté data/SNDS.
- Résultats associés à la création de la base :
L'algorithme utilisé par la CNAM pour construire le top diabète : version source (CNAM), version Python et version SAS (HDH).
Présentation des données :
- Méthodologie de collecte et critères d’inclusion :
Ce jeu de données a été généré en utilisant le schéma des tables de la base principale du SNDS de l’année 2019.
Les programmes fonctionnent sur les données synthétiques du HDH avec quelques adaptations :
-la fusion de tables annuelles en une table unique pour ER_PRS_F, ER_ETE_F, ER_PHA_F,
-le renommage de NUM_ENQ en BEN_NIR_PSA,
-la conversion du format des dates en yymmdd10.
L’identification des patients repose sur le ciblage de médicaments spécifiques et/ou une ALD et/ou une hospitalisation en MCO.
Les algorithmes de la cartographie visent à maximiser la spécificité (et non la sensibilité), c'est-à-dire à s'assurer de l'absence de non-diabétiques parmi les patients ciblés. Les patients ayant moins de 3 délivrances de médicaments spécifiques, n'ayant pas l'ALD et n'ayant pas été hospitalisés dans les 5 ans pour le diabète ne sont pas retenus.
- Choix des variables :
La mise en œuvre de l'algorithme nécessite la mobilisation des tables et variables suivantes (l'historique requis est indiqué dans la case correspondante) :
Les programmes adaptés en SAS et Python tournent sur des données synthétiques des années 2018 et 2019. Le code source de la CNAM (en SAS) a été conçu pour fonctionner sur les données des années de 2015 à 2019.
Limites de ce jeu de données :
L'utilisation de données synthétiques, bien qu'utiles pour manipuler les données du SNDS, revêt des limites : l'absence de cohérence médicale, l'absence de mise à jour des évolutions annuelles, un schéma de tables évolutif qui peut être incomplet et imparfait.
Ce programme n'inclut pas l'analyse de l’estimation des postes des dépenses remboursées par l'Assurance Maladie.
L'algorithme repère les patients prévalents atteints de diabète sur une année donnée (2019). Il ne permet pas de déterminer la date exacte d'apparition du diabète dans la base.
Instructions/pré-requis d’utilisation de la base :
Plus d’informations sur l’utilisation de la base de données dans le cadre des programmes top diabète (CNAM) sur le dépôt GitLab des programmes (lien du dépôt GitLab).
Support :
Point de contact : dir.donnees-SNDS@health-data-hub.fr
Contribution :
Sur Gitlab (faire un ticket ou une merge-request)
Producteur
Dernière mise à jour
26 avril 2024
Licence
Licence Ouverte / Open Licence version 2.0
Qualité des métadonnées :
Description des données renseignée
Fichiers documentés
Licence renseignée
Fréquence de mise à jour respectée
Formats de fichiers standards
Couverture temporelle renseignée
Couverture spatiale renseignée
Tous les fichiers sont disponibles
Qualité des métadonnées
Il n'y a pas encore de réutilisation pour ce jeu de données.
Il n'y a pas encore de discussion pour ce jeu de données.
Il n'y a pas encore de ressources communautaires pour ce jeu de données.
Informations
Mots-clés
ID
662a7a37ee85069bfb9a666b
Temporalité
Création
25 avril 2024
Fréquence
Ponctuelle
Couverture temporelle
2018 à 2019
Dernière mise à jour
26 avril 2024
Couverture spatiale
Couverture territoriale
France
Granularité de la couverture territoriale
Pays
Actions
Intégrer sur votre site
Statistiques des 12 derniers mois
Visites
1,3k
Téléchargements
92
Réutilisations de ce jeu de données
0
Favoris
0