Découverte du package pandas (Python) illustrée avec données de l'ADEME

2K

0

Description

Le jeu de données des émissions de gaz à effet de serre territorialisé est un jeu de données idéal pour découvrir les manipulations de données usuelles. Associé aux autres informations communales, notamment les bases de données Filosofi de l'Insee, il est possible d'illustrer de nombreuses tâches classiques de data engineering.

Ce jeu de données est utilisé dans le cadre de plusieurs chapitres du cours Python pour la data science de l'ENSAE. Il sert d'exemple fil rouge pour illustrer la manipulation de données avec le package pandas:

  • Un premier chapitre propose un tutoriel détaillé des opérations couramment menées par les data scientists. C'est l'occasion d'explorer quelques caractéristiques du jeu de données, notamment certaines statistiques agrégées
  • Un second chapitre présente une série d'exercices pédagogiques pour explorer de manière pédagogique la richesse du jeu de données fourni par l'ADEME lorsqu'il est associé à d'autres sources de données communales.

Les codes utilisés dans ces chapitres, comme l'ensemble du contenu du site web pythonds.linogaliana.fr, sont open-source, disponibles sur Github

Thématique
Éducation et recherche
Type
Article de blog
Mots clés
datascienceenseignementpandaspython
Dernière mise à jour
30 avril 2024
Date de création
29 décembre 2022

1 jeu de données associé

Inventaire de gaz à effet de serre territorialisé

Mis à jour le 16 janv. 2025

Métadonnées :

À améliorer(56 %)

3K

2

3

Statistiques des 12 derniers mois

Mises à jour ce matin

Vues

1 réutilisation du même créateur