Les publications qui ont retenu notre attention le mois dernier
Suivi des sorties  - Février 2020

Vous lisez l'édition de février 2020 du suivi des sorties ; un article dans lequel nous partageons les publications qui ont retenu notre attention — qu'il s'agisse de jeux de données, de réutilisations, d'outils ou d'articles parus ailleurs sur le web.

Les jeux de données à suivre

Focus sur les données de santé

Compte tenu de l'actualité marquée par l'épidémie de coronavirus, nous reviendrons prochainement et plus en détail sur les données de santé dans un article dédié sur data.gouv.fr ainsi que dans le suivi des sorties du mois de mars. Les premières données consacrées au coronavirus publiées par Santé publique France sont disponibles sur data.gouv.fr :
Accéder aux données sur le coronavirus

Les indicateurs de qualité et de sécurité des soins par la Haute Autorité de Santé (HAS)

La HAS met à disposition des indicateurs de qualité et de sécurité des soins (IQSS). Ces indicateurs, développés et validés avec les professionnels de santé, les patients et les usagers permettent la comparaison inter-établissements. Ils sont utilisés comme outils d’amélioration de la qualité des soins et de la sécurité des patients dans les établissements de santé.

Voir le jeu de données de la HAS

Les données synthétiques du Système National des Données de Santé

Le « Health Data Hub », la plateforme d'exploitation des données de santé du gouvernement, a publié des données synthétiques du système national de santé (SNDS).

« Le Système National des Données de Santé (SNDS) est un entrepôt de données médico-administratives pseudonymisées couvrant l'ensemble de la population française et contenant l'ensemble des soins présentés au remboursement. »

Le SNDS centralise les données de l'assurance maladie, des hôpitaux, les causes médicales de décès ainsi que les données relatives au handicap. Le SNDS c'est plus de 3000 variables, et un flux annuel de :

  • 1,2 milliards de feuilles de soins
  • 11 millions de séjours hospitaliers
  • 500 millions d'actes
  • 450 To de données

Les données ouvertes du SNDS ont pour objectif de faciliter sa prise en main, la création d’exercices, ou le test de programmes exploitant cette base de donnée.

En savoir plus sur les données synthétiques du SNDS

Accéder à la documentation complète du SNDS

La base de données du «service médical rendu» 2020

Le « service médical rendu » (SMR) est une notion utilisée par la Haute autorité de santé (HAS) afin de proposer l'inscription d'un médicament sur la liste des spécialités remboursables. Il répond à la question suivante : « le médicament a-t-il suffisamment d'intérêt clinique pour être pris en charge par la solidarité nationale? ».

Le SMR prend en compte :

  • La gravité de l'affection
  • L'efficacité et les effets indésirables du médicament
  • Le caractère préventif, curatif, symptomatique du médicament
  • Sa place dans la stratégie thérapeutique, au regard des autres thérapeutiques disponibles
  • Son intérêt pour la santé publique

Les données incluent le niveau de SMR (insuffisant, modéré, important) en association avec le nom du médicament, la date de l'avis définitif et le motif de la demande.

Voir la base de donnée SMR 2020

Consulter la documentation sur le SMR

Les réutilisations à suivre

L'Agence française pour la biodiversité publie deux visualisations de données

  • l'une permet de visualiser l'évolution des ventes de produits phytosanitaires par département sur la période 2008-2018. Elle est issue d’une collaboration entre l’Office français de la biodiversité (OFB) et le service de la Donnée et des études statistiques (SDES) du Ministère de la Transition écologique et solidaire.

    Voir la visualisation

  • l'autre se base sur le référentiel des obstacles à l'écoulement (ROE) sur les cours d'eau de France fourni par le Service d'Information sur l'Eau. Le terme « obstacle à l’écoulement » désigne tout ouvrage construit dans le lit d’un cours d’eau et à l’origine d’une modification de l’écoulement des eaux de surface (seuils, ponts, barrages, etc.). Ces obstacles ont des impacts important en terme de circulation de la faune et des sédiments entre l'amont et l'aval des cours d'eau.

Voir à la visualisation complète

Les noms des navires

À partir des données de l'Agence Nationale des fréquences (ANFR), Matamix a analysé l'évolution des noms des navires en France et ainsi constaté la forte corrélation entre les sorties de films et les noms choisis pour nommer les navires !

Voir la réutilisation sur Twitter

Voir les données radiomaritimes de l'Agence nationale des fréquences (ANFR)

Les plaques du matrimoine

L'outil PlaquesDuMatrimoine, développé par Philippe Gambette dans le cadre du projet "Cité des Dames", vise à repérer les voies et les lieux d'une commune de France métropolitaine nommés d'après des femmes.

Il utilise les données de la base adresse nationale pour les noms de voies, d'Open Street Map pour les autres noms de lieux et de Wikidata pour les noms de personnes.

Voir l'outil "Les plaques du matrimoine"

MatchID : un outil pour explorer le fichier des personnes décédées de l'INSEE

Suite à la publication par l'INSEE du fichier des personnes décédées, Fabien Antoine a réalisé un service qui permet son exploration : MatchID.

Ce service a attiré dès sa création un large public et continue de susciter l'intérêt depuis l'amélioration des fonctionnalités de recherche.

Accéder au service MatchID

Voir le fichier des personnes décédées de l'INSEE

Les outils

Les données MeteoNet

Le Lab IA de MétéoFrance a mis à disposition les données météorologiques de la base MeteoNet afin d'en faciliter l'usage et l'exploration par les data scientists. Les données couvrent trois années, de 2016 à 2018 et deux zones géographiques : le quart nord-ouest et le quart sud-est de la France.

Voir le répertoire du projet sur Github

Voir toutes les données Météo France

Un package R pour traiter les données des accidents de la circulation

Baacker est un package R développé par Nicolas Rolandt pour accéder facilement aux données des accidents corporels de la circulation depuis R.

Voir le package sur Github

Evènement

La quatrième édition 2020 de l'Eurodatathon a été lancée le 19 février dernier. L'Eurodatathon est une compétition qui vise à valoriser les meilleures applications réalisées grâce à des données ouvertes, déclinée en quatre défis à découvrir sur le site de l'évènement.

Les candidatures sont à envoyer avant le 3 mai 2020, avec de nombreux prix à la clé !

Actualité juridique

Le point d'accès national aux données de transports dans le code des transports

La plateforme transport.data.gouv.fr est entrée dans le code des transports par le Décret n° 2020-183 du 28 février 2020) qui stipule que :

« Le site internet https://transport.data.gouv.fr constitue le point d'accès national [...] en ce qui concerne la mise à disposition, dans l'ensemble de l'Union, de services d'information sur les déplacements multimodaux. »

Voir le décret

Bonne pratique

Catalogue et statistiques d'utilisation des jeux de données proposés en open data

Le groupe BPCE a publié les statistiques d'utilisation de ses jeux de données publiés en open data : il est ainsi possible de connaître le nombre de téléchargements et d'appels API effectués sur l'ensemble du catalogue et de mesurer l'utilité des différents jeux de données. Le groupe BPCE met également à disposition une cartographie de l'ensemble de ses jeux de données ouverts.


Pour en savoir plus, retrouvez aussi la rétrospective complète d'Etalab pour 2019, notre article à l'occasion de l'Open data day 2020, toutes les sorties du mois ainsi que nos actualités sur le blog d'Etalab !


Comments about this post.