Base nationale des décès dédoublonnée

Description

Cette base au format parquet agrège tous les décès depuis 1970, avec les retraitements suivants :

  • Suppression de doublons (environ 220 000),
  • Recodage simplifié du pays de naissance,
  • Création de vrais champs temporels de type date, permettant de calculer un âge au décès. Quand le jour manque, il est conventionnellement fixé à 15 ; quand le mois manque, le milieu de l’année est retenu ; création associée d’une variable indicatrice du caractère de flou des dates ;

  • Prise en compte de l'encodage variable des fichiers annuels (utf-8 pour les plus récents, iso-8859 pour les plus anciens) ;

  • Base triée pour un format parquet de compression optimisée.

Voir aussi le script de génération de cette base.

Dernière maj : 23 octobre 2025

Producteur
Dernière mise à jour
23 octobre 2025

Vues

0

Téléchargements

0

Qualité des métadonnées:
Bon(89 %)
  • Fréquence de mise à jour non respectée

1 fichier principal

Mis à jour le 23 octobre 2025 parquet (691,0 Mo)74