Découverte du package pandas (Python) illustrée avec données de l'ADEME

Description

Le jeu de données des émissions de gaz à effet de serre territorialisé est un jeu de données idéal pour découvrir les manipulations de données usuelles. Associé aux autres informations communales, notamment les bases de données Filosofi de l'Insee, il est possible d'illustrer de nombreuses tâches classiques de data engineering.

Ce jeu de données est utilisé dans le cadre de plusieurs chapitres du cours Python pour la data science de l'ENSAE. Il sert d'exemple fil rouge pour illustrer la manipulation de données avec le package pandas:

  • Un premier chapitre propose un tutoriel détaillé des opérations couramment menées par les data scientists. C'est l'occasion d'explorer quelques caractéristiques du jeu de données, notamment certaines statistiques agrégées
  • Un second chapitre présente une série d'exercices pédagogiques pour explorer de manière pédagogique la richesse du jeu de données fourni par l'ADEME lorsqu'il est associé à d'autres sources de données communales.

Les codes utilisés dans ces chapitres, comme l'ensemble du contenu du site web pythonds.linogaliana.fr, sont open-source, disponibles sur Github

Topic

Education and research

Type

Post

Tags

  • datascience

  • enseignement

  • pandas

  • python

Creation date

December 29, 2022

Last update

April 30, 2024

1 used dataset

Statistics for the year

Views

828

16 in Oct 2024

Followers

0

Discussions

There are no discussions for this reuse yet.

1 reuse from the same creator