Découverte du package pandas (Python) illustrée avec données de l'ADEME

Description

Le jeu de données des émissions de gaz à effet de serre territorialisé est un jeu de données idéal pour découvrir les manipulations de données usuelles. Associé aux autres informations communales, notamment les bases de données Filosofi de l'Insee, il est possible d'illustrer de nombreuses tâches classiques de data engineering.

Ce jeu de données est utilisé dans le cadre de plusieurs chapitres du cours Python pour la data science de l'ENSAE. Il sert d'exemple fil rouge pour illustrer la manipulation de données avec le package pandas:

  • Un premier chapitre propose un tutoriel détaillé des opérations couramment menées par les data scientists. C'est l'occasion d'explorer quelques caractéristiques du jeu de données, notamment certaines statistiques agrégées
  • Un second chapitre présente une série d'exercices pédagogiques pour explorer de manière pédagogique la richesse du jeu de données fourni par l'ADEME lorsqu'il est associé à d'autres sources de données communales.

Les codes utilisés dans ces chapitres, comme l'ensemble du contenu du site web pythonds.linogaliana.fr, sont open-source, disponibles sur Github

Thématique

Éducation et recherche

Type

Article de blog

Mots-clés

  • datascience

  • enseignement

  • pandas

  • python

Date de création

29 décembre 2022

Dernière mise à jour

30 avril 2024

1 jeu de données

Visites

836

20 en mai 2024

Favoris

0

Discussions

Il n'y a pas encore de discussion pour cette réutilisation.

1 réutilisation du même créateur