INSEEHOP : algorithme libre sous R d'appariement massif au fichier des personnes décédées

Description

Chers utilisateurs de la plateforme data.gouv.fr,

Nous sommes heureux de vous présenter notre algorithme open-source d'appariement massif sous R de bases massives de personnes au fichier des personnes décédées de l’INSEE. Initialement conçu pour la recherche médicale, et plus spécifiquement pour les entrepôts de données de santé, il peut être réemployer dans d'autre domaines.
Ce travail a été publié dans le JMIR Medical Informatics : https://medinform.jmir.org/2022/11/e36711
En complément des travaux préexistants, notre travail apporte notamment :

  • Une augmentation de la sensibilité et une diminution des biais de classement différentiels.
  • Une méthodologie d’évaluation moins biaisée, impliquant 3 entrepôts de données nationaux.
  • Une capacité à apparier plusieurs millions de patients, sur des configurations modestes ou puissantes.
  • Un package R en open source ( https://gitlab.com/ricdc/insee-deces ), ne nécessitant pas les droits administrateurs sur la machine.

Cette solution pouvant tourner de manière 100% locale, vous ne risquez pas non plus d'enfreindre la réglementation en envoyant les noms d’éventuels patients sur un serveur non validé hébergeur de données de santé.
Nous vous invitons à lire l'article original pour plus d'informations et pour éviter tout biais méthodologique lors de l'utilisation de cette famille d'algorithme. N'hésitez pas non plus à nous contacter pour de plus amples détails.

Bien cordialement,

Dr Vianney GUARDIOLLE

Topic

Health

Type

Application

Tags

  • appariement

  • chainage

  • clinical-data-warehouse

  • clinical-informatics

  • data-reuse

  • data-warehousing

  • dossier-patient

  • entrepot-de-donnee-de-sante

  • french-national-moratlity-database

  • genealogie

  • health

  • informatique-medicale

  • medical-informatics-applications

  • medical-record-linkage

  • open-data

  • record-linkage

  • reutilisation

  • sante

Creation date

March 24, 2023

Last update

April 26, 2024

1 used dataset

Statistics for the year

Views

1.5k

110 in Apr 2024

Followers

0

Discussions

There are no discussions for this reuse yet.

Reuses from the same creator

There are no other reuses from this creator.