Guide d’utilisation des données du recensement de la population au format Parquet

4K

1

Votre question porte sur autre chose que cette réutilisation ? Visiter notre forum

1 discussion

Fichier à améliorer

Posté le 5 novembre 2023
Bonjour, je me félicite de votre initiative innovante de distribuer ces données au format parquet. J'ai toutefois remarqué une incohérence entre les données et le dictionnaire, à savoir les colonnes AGED et AGEREV sont typées en INTEGER dans le fichier parquet alors qu'elles devraient être en VARCHAR. C'est d'autant plus problématique que la présence de valeurs telles que 'Z' provoque un plantage des requêtes sur ces champs et qu'il faut donc exclure ces valeurs de toutes les requêtes pour simplement les lancer. Bien cordialement Guillaume Sueur