Guide d’utilisation des données du recensement de la population au format Parquet
Lino Galianapublié le 25 oct. 2023
3K
1

République
Française
2K
0
Le jeu de données des émissions de gaz à effet de serre territorialisé est un jeu de données idéal pour découvrir les manipulations de données usuelles. Associé aux autres informations communales, notamment les bases de données Filosofi de l'Insee, il est possible d'illustrer de nombreuses tâches classiques de data engineering.
Ce jeu de données est utilisé dans le cadre de plusieurs chapitres du cours Python pour la data science de l'ENSAE. Il sert d'exemple fil rouge pour illustrer la manipulation de données avec le package pandas:
Les codes utilisés dans ces chapitres, comme l'ensemble du contenu du site web pythonds.linogaliana.fr, sont open-source, disponibles sur Github
Métadonnées :
3K
2
3
Lino Galianapublié le 25 oct. 2023
3K
1