Je me réponds à moi-même !-) au sujet de mon espérance que la solution PARQUET de Maxime Pawlak soitn disponible sur la plateforme meteo.data.gouv.fr avec la même fréquence que les fichiers CSV.
En réalité la démarche est déjà commencée (je ne sais pas depuis quand).
Cela semblait une bonne nouvelle, mais certains manques et défauts rend leur utilisation impossible. La démarche n'est visiblement pas terminées.
- L’alternative PARQUET est « cachée ». Dans meteo.data Il faut cliquer sur le nom du fichier (et non sur le lien de téléchargement de l’archive CSV) puis sur « Téléchargement ».
- Le nom des fichiers PARQUET ne permet pas d’identifier leur contenu (par exemple « 11b4f6ca-71eb-4865-b0e8-2901c1e83295.parquet »). Il faut donc les renommer à la main ce qui est rédhibitoire pour une utilisation professionnelle courante.
- Certain fichiers PARQUET sont absents, pour les données de base que j’ai consultées :
o 6 minutes : Aucun fichier PARQUET pour les départements consultés (04, 13, 83, 84)
o Quotidien : Tous les fichiers PARQUET PREVIOUS sont manquants pour les départements consultés (04, 13, 83, 84)
o Mensuel : fichier PARQUET absent pour le fichier LATEST du 84 (parmi les départements consultés 04, 13, 83, 84)
- Les jeux de données PARQUET sont découpés en multiples fichiers, de la même façon que les fichiers CSV, ce qui ne se justifie plus pour ce format compact et rapide.
o On pourrait par exemple regrouper toutes les périodes d’un département,
o et même tous les départements et toutes les périodes pour les pas de temps les plus longs (au moins pour le MENSUEL).
- Aucune amélioration des inconvénients déjà identifiées par Maxime Pawlak dans sa solution développée rapidement pendant le hackathon. Le code de Maxime a donc été utilisé tel quel, alors que les modifications souhaitables sont très faciles.
o suppression des blancs inutiles de certains champs,
o NUM_POSTE en chaine de caractère et non en entier (départements 01 à 09....)
o Champ AAAAMMJJ converti en type date (puisque cette solution est un dataframe pandas)
@ Maxime Pawlak , donc la bonne nouvelle c'est que votre solution a été adoptée par Météo France !
Mais il reste du travail pour que ce soit utilisable sur la plateforme meteo.data
Je vais poster ce commentaire dans une discussion sur meteo.data, pour montrer à Météo-France que cette alternative sera appréciée.
Cordialement
Loïc Duffar