Découvrez les projets lauréats du Hackathon Données Ouvertes Météo-France : L'équipe TLS/La Dalle

Published on 29 de abril de 2024

Explorez en détail le projet arrivé 2e ex aequo au hackathon !

Les 8 et 9 avril derniers s’est tenu le Hackathon Données Ouvertes Météo-France, organisé par data.gouv.fr et Météo-France.

L’objectif : faciliter l’accès et la réutilisation des données publiques météorologiques et développer de nouveaux usages.

Pendant deux jours, 120 participantes et participants aux profils variés, regroupés en 22 équipes, ont développé des projets grâce aux données mises à disposition par Météo-France (notamment sur meteo.data.gouv.fr). La liste de l’ensemble des réalisations est disponible dans ce billet de blog.

Une série d’articles vous invite à découvrir plus en détail les projets désignés lauréats du hackathon. Après une présentation de l’équipe des Voyageurs du Climat, le tour d’horizon se poursuit avec le projet de l’équipe TLS : La Dalle, arrivée 2e ex aequo.

L’équipe TLS, composée de Sébastien Bourgeois (Data engineer), Maxime Pawlak (Développeur) et Thomas Sigward (Développeur front-end) entend pallier à une double difficulté :

  • celle de trouver et récupérer la donnée recherchée, dans le vaste ensemble que constituent les données publiques météorologiques et sans connaissance approfondie ;
  • celle de prendre en main ces données (compréhension des données, gestion des différents formats, etc.) et de les visualiser aisément.

Pour résoudre cette problématique, ils ont travaillé sur un outil qui permet de récupérer simplement la donnée juste nécessaire pour son usage, dans un format compréhensible (JSON ou CSV). Des briques ont été développées et l’outil est encore en cours de développement.

Il s’agit d’une application web, qui fonctionne de la manière suivante :

  1. Les données sont récupérées depuis meteo.data.gouv.fr (qui sont majoritairement aux formats .grib2 ou .csv.gz) ;
  2. Elles sont transformées au format parquet (via pandas, xarray ou gdal) puis téléversées dans data.gouv.fr ;
  3. L’application web consomme les données (grâce à duckdb) puis permet de créer la requête qui va consommer ces fichiers, et de les visualiser ;
  4. L’application propose le téléchargement du fichier généré aux formats intéropérables JSON et CSV.

Pour effectuer une recherche de données, trois méthodes existent :

  • Un formulaire qui propose d’entrer la période, la couverture géographique, les paramètres recherchés, etc. ;
  • Une recherche effectuée en langage naturel (à partir d’un modèle LLM) (cette partie n’a pas encore été développée dans l’outil) ;
  • Une requête SQL directement.

Pour leur preuve de concept, l’équipe TLS s’est concentrée sur les données du modèle AROME et celles des stations d’observation, ainsi que sur les paramètres Pluie, Vent, Température et Humidité.

Grâce à cet outil, toute personne (grand public, services publics, services privés, chercheurs, etc.) :

  • peut récupérer facilement les données qui l’intéresse (sans avoir à télécharger l’ensemble des données éparpillées et sans connaissance approfondie) ;
  • peut les visualiser et les exploiter directement, sans avoir à apprendre à manipuler chacun des formats de données météorologiques (grib2, netCDF, geotiff, etc.).

La Dalle s’inscrit ainsi comme un outil qui facilite la manipulation, la visualisation “grand public” et la réutilisation des données publiques météorologiques.

Plus de détails sur le projet (code, présentation, etc.) sont disponibles sur ce dépôt Github.

Nous vous tiendrons au courant des suites envisagées !

Pour toute question, retour ou commentaire, vous pouvez échanger avec l’équipe dans les discussions de la réutilisation publiée sur data.gouv.fr.