INSEEHOP : algorithme libre sous R d'appariement massif au fichier des personnes décédées

Description

Chers utilisateurs de la plateforme data.gouv.fr,

Nous sommes heureux de vous présenter notre algorithme open-source d'appariement massif sous R de bases massives de personnes au fichier des personnes décédées de l’INSEE. Initialement conçu pour la recherche médicale, et plus spécifiquement pour les entrepôts de données de santé, il peut être réemployer dans d'autre domaines.
Ce travail a été publié dans le JMIR Medical Informatics : https://medinform.jmir.org/2022/11/e36711
En complément des travaux préexistants, notre travail apporte notamment :

  • Une augmentation de la sensibilité et une diminution des biais de classement différentiels.
  • Une méthodologie d’évaluation moins biaisée, impliquant 3 entrepôts de données nationaux.
  • Une capacité à apparier plusieurs millions de patients, sur des configurations modestes ou puissantes.
  • Un package R en open source ( https://gitlab.com/ricdc/insee-deces ), ne nécessitant pas les droits administrateurs sur la machine.

Cette solution pouvant tourner de manière 100% locale, vous ne risquez pas non plus d'enfreindre la réglementation en envoyant les noms d’éventuels patients sur un serveur non validé hébergeur de données de santé.
Nous vous invitons à lire l'article original pour plus d'informations et pour éviter tout biais méthodologique lors de l'utilisation de cette famille d'algorithme. N'hésitez pas non plus à nous contacter pour de plus amples détails.

Bien cordialement,

Dr Vianney GUARDIOLLE

Thématique

Santé

Type

Application

Tags

  • appariement

  • chainage

  • clinical-data-warehouse

  • clinical-informatics

  • data-reuse

  • data-warehousing

  • dossier-patient

  • entrepot-de-donnee-de-sante

  • french-national-moratlity-database

  • genealogie

  • health

  • informatique-medicale

  • medical-informatics-applications

  • medical-record-linkage

  • open-data

  • record-linkage

  • reutilisation

  • sante

Date de création

24 mars 2023

Dernière mise à jour

26 avril 2024

1 jeu de données

Visites

1,5k

110 en avr. 2024

Favoris

0

Discussions

Il n'y a pas encore de discussion pour cette réutilisation.

Réutilisations du même créateur

Il n'y a pas d'autres réutilisations de ce créateur.