Base nationale des décès dédoublonnée

Description

Cette base au format parquet agrège tous les décès depuis 1970, avec les retraitements suivants :

  • Suppression de doublons (environ 220 000),
  • Recodage simplifié du pays de naissance,
  • Création de vrais champs temporels de type date, permettant de calculer un âge au décès. Quand le jour manque, il est conventionnellement fixé à 15 ; quand le mois manque, le milieu de l’année est retenu ; création associée d’une variable indicatrice du caractère de flou des dates ;

  • Prise en compte de l'encodage variable des fichiers annuels (utf-8 pour les plus récents, iso-8859 pour les plus anciens) ;

  • Base triée pour un format parquet de compression optimisée.

Voir aussi le script de génération de cette base.

Dernière maj : 23 octobre 2025

Producteur
Dernière mise à jour
23 octobre 2025

Vues

0

depuis sept. 2025

+ 10 en déc. 2025

Téléchargements

0

depuis sept. 2025

+ 6 en déc. 2025

Qualité des métadonnées:
Bon(89 %)
  • Fréquence de mise à jour non respectée