Chez Etalab, l'Open Data Day c'est toute l'année !

Cet article est un brouillon et ne sera pas visible par les autres utilisateurs
A l'occasion de la journée internationale "Open Data Day", découvrez une sélection de jeux de données et réutilisations récents qui ont marqué l'équipe d'Etalab et ses correspondants open data dans les ministères ! Vous avez aussi un témoignage à partager ? Racontez le nous sur Twitter à @datagouvfr !

Le choix de Clémentine, chargée de mission : l’ouverture des données électorales par bureau de vote

"Une ouverture inédite pour modéliser les tendances électorales "

Auparavant agrégées par communes, le ministère de l’Intérieur a ouvert les données des résultats des élections par bureau de vote depuis 1999. Leur ouverture à ce niveau de granularité est inédite et fait de la France l’un des pays les plus avancés sur le sujet. Cela correspond à l’un des engagements du plan d’action de la France pris dans le cadre du G8 ainsi qu’à l’un des critères de l’édition 2015 du classement Open Data Index. Les données des élections avaient déjà fait l’objet d’un open data camp, organisé avec à Sciences Po avec le CDSP (centre de données socio-politiques) et le ministère de l’Intérieur. Ce nouveau niveau de granularité devrait susciter encore plus de réutilisations par les citoyens, les start-ups et les chercheurs modélisant les tendances électorales. Le modèle prédictif de la start-up de stratégie électorale Liegey Muller Pons utilise notamment les résultats électoraux passés.


Le choix de Claire-Marie, responsable développement & politique : Open Elections, site de visualisation de données électorales ouvertes au Burkina Faso

"Au Burkina Faso, l'open data ouvre les élections présidentielles"

En novembre 2015, pour l'une des premières fois, les résultats d'une élection présidentielle n'ont pas été contestés au Burkina Faso... et l'open data y a contribué ! Grâce à www.burkina2015.bf, les citoyens burkinabés ont vu se colorer une carte du Burkina province par province, en fonction de la couleur politique du candidat arrivé en tête. Avec seulement 3 minutes de décalage, les données de la Commission électorale ont été visualisées par l'équipe gouvernementale Open Data Burkina Faso sur ce site, accessible sur web et mobile. Se rapprocher du temps réel et toucher les citoyens, deux objectifs ambitieux pour l'open data d'ici et d'ailleurs !


Le choix de Laure, directrice d'Etalab : les données de la consultation sur le projet de loi République Numérique

"Boucler la boucle des principes de gouvernement ouvert"

La large consultation menée il y a quelques mois autour du projet de loi pour une République numérique, présenté le 9 décembre 2015 en Conseil des ministres par Mme Axelle Lemaire, Secrétaire d’État chargée du numérique, fournit une illustration concrète de la mise en œuvre des principes du « gouvernement ouvert ». Cette démarche démontre comment un « processus métier » propre à l’action publique, celui de l’élaboration d’une loi, a été en plusieurs endroits (dès la définition des thèmes à traiter, lors la rédaction des articles, et jusque dans le débat parlementaire) nourri, augmenté, enrichi de la contribution des citoyens sous différentes formes.

Dès octobre 2014, une concertation nationale (« ambition numérique ») a été lancée par le Premier ministre et animée par le Conseil national du numérique. À l’issue de plusieurs mois, elle a permis de recueillir plus de 4000 contributions d’entreprises, d’administrations et de citoyens. Un projet de texte a ensuite été élaboré par le Gouvernement et soumis à consultation publique sur la plateforme www.republique-numerique.com, du 26 septembre au 18 octobre 2015. Cette plateforme a recueilli plus de 8 500 contributions et près de 150 000 votes, et le Gouvernement a apporté des réponses aux propositions les plus soutenues.

A l’issue de la concertation, les données de la plateforme de consultation ont été publiées en open data sur data.gouv.fr et un hackathon a été organisé. Grâce à la publication de ces données, des chercheurs, des sociologues, des représentants de la société civile et des innovateurs ont pu comprendre les dynamiques à l’œuvre pendant la consultation (qui a participé, comment les communautés se sont mobilisées, quels ont été les articles les plus soutenus ou débattus….), en tirer des enseignements et éclairer l’administration engagée dans cette ouverture inédite sur les résultats de cette démarche. Ces analyses ont été publiées, et partagées avec nos partenaires du Partenariat pour un Gouvernement Ouvert.


Le choix de Philippe, correspondant open data du ministère de l'Intérieur : les données de l'accidentologie en open data

"Les données emblématiques du ministère de l'intérieur"

Le ministère de l'Intérieur a ouvert depuis 2011 un nombre conséquent de données sur l'ensemble de ses domaines d'intervention : sécurité intérieure, routière, et protection des populations mais aussi élections (scrutins nationaux et locaux), libertés publiques (associations), collectivités territoriales... qui ont suscité de nombreuses réutilisations. Parmi les plus emblématiques figurent celles relatives à l'accidentologie. Le ministère de l'Intérieur propose, en effet, aux citoyens et à l'écosystème les bases de données, extraites du fichier BAAC, répertoriant l'intégralité des accidents corporels de la circulation intervenus durant une année précise en France métropolitaine ainsi que dans les départements d’Outre-mer (depuis 2012) avec une description simplifiée. Cela comprend des informations de localisation de l’accident, telles que renseignées ainsi que des informations concernant les caractéristiques de l’accident et son lieu, les véhicules impliqués et leurs victimes.


Le choix d'Henri, directeur interministériel du numérique et du système d'information et de communication de l’État : les bornes de recharge pour véhicules électriques

"Les données pour créer un marché"

Dans le cadre du plan industriel "bornes électriques de recharge", le préfet Vuibert eut la bonne idée de proposer que les aides financières de l’État à l'installation de bornes pour véhicules électriques soient conditionnées à la publication en open data des localisations et des caractéristiques des bornes. La raison ? Le marché du véhicule électrique a besoin, pour que les conducteurs partent en confiance, qu'ils puissent être certains de toujours savoir où recharger leurs véhicules. De manière intéressante, l’État reprenait ainsi, 110 ans après, le raisonnement de Michelin qui, en 1905, avait lancé son activité de cartographie pour permettre aux premiers automobilistes de savoir où réparer leurs véhicules. Tesla fut le premier producteur de données à venir déposer l'un de ces jeux, exploitant ainsi la dimension contributive de data.gouv.fr.


Le choix de Guillaume, chargé de mission : CartoPedago et Qui dit miam!, les applications qui simplifient l'école

"L'open data simplifie la vie des professeurs et des parents"

Finalistes au concours Data.connexions 6, les applications CartoPedago et Qui dit miam! cherchent à simplifier l’une la vie des professeurs, l’autre celle des parents. CartoPedago propose une application nourrie des données ouvertes sur les établissements culturels qui aide les enseignants à choisir leurs sorties scolaires plus facilement. Ils ont la possibilité de commenter et de noter les lieux, un outil facile d’usage et d’un grand secours dans cette tâche d’organisation chronophage et bénévole. Qui dit miam! utilise les données fournies par la cantine centrale de Toulouse pour une application mobile qui détaille les menus proposés chaque semaine dans les cantines en précisant la composition exacte et les allergènes potentiels. Ces premières initiatives témoignent du potentiel de l’ouverture des données pour des services autour des écoles.


Le choix d'Alexis, datascientist : l'ouverture osée et récompensée des données de la Cnaf

"Un pari réussi pour la Caisse nationale des allocations familiales"

La Caisse nationale des allocations familiales a entamé une démarche d'Open Data. Elle a ouvert son portail a l'été. Elle a aussi organisé un hackathon de deux jours début octobre. Dans le cadre de ce hackathon, elle a proposé des données anonymisées sur près de 12 millions de foyers allocataires. Plus encore, elle a proposé des données sur son activité : l'utilisation de son site web, le traitement des documents des allocataires, rendez-vous en agence, etc. En exposant sans retenue son activité et en organisant ce hackathon, la Cnaf a pu voir un écosystème créatif et innovant proposer, en seulement deux jours, des études, des designs et des concepts qui peuvent l'aider à s'améliorer encore. La Cnaf va incuber certains projet. A suivre et à poursuivre !


Le choix de Julien, data editor : BatiParis par Étienne Côme

"Découvrir Paris au travers des ages"

BatiParis est une carte interactive réalisée par Étienne Côme qui permet de visualiser les bâtiments parisiens selon leur date de construction. Elle permet ainsi de saisir l'extraordinaire expansion de la ville depuis les années 1800 et de constater l'importance des travaux entrepris entre 1851 et 1914 sous l'impulsion du baron Haussmann. Elle s'appuie sur les données ouvertes de l'APUR (Atelier parisien d'urbanisme) ainsi que sur celles des localisations des monuments historiques. Plus qu'une simple carte, c'est aussi un formidable outil pour les chercheurs et historiens intéressés par la question des évolutions urbaines.


Le choix de Romain, data hunter : la base de données des accidents corporels de la circulation mise à disposition par le ministère de l'Intérieur

« Les données des accidents corporels de la circulation au service d’un meilleur pilotage des politiques publiques »

Les bases de données, extraites du fichier BAAC, répertorient l'intégralité des accidents corporels de la circulation intervenus durant une année précise en France métropolitaine ainsi que les départements d’Outre-mer (Guadeloupe, Guyane, Martinique, La Réunion et Mayotte depuis 2012) avec une description simplifiée. Cela comprend des informations de localisation de l’accident, telles que renseignées ainsi que des informations concernant les caractéristiques de l’accident et son lieu, les véhicules impliqués et leurs victimes. La précision de ces données (latitude, longitude) ainsi que leur exhaustivité, permet à la puissance publique locale d’optimiser l’installation d’infrastructures routières en fonction des zones particulièrement accidentogènes. C’est l'un des premiers exemples concrets de politique publique pilotée par la donnée.


Le choix de Christophe, développeur : les barèmes du système social et fiscal français de l'Institut des politiques publiques

"Modéliser la législation socio-fiscale"

Ce jeu de données contient tout un ensemble de paramètres que l'on rencontre dans les articles de la législation socio-fiscale – en particulier les impôts et les prestations sociales. Je travaille sur le projet OpenFisca qui tend à modéliser la législation socio-fiscale sous forme de code source logiciel. Le projet OpenFisca a lui aussi recensé depuis plusieurs années un ensemble de paramètres de la législation socio-fiscale. Lorsque l'Institut des Politiques Publiques a publié ses fichiers de données en open data, le projet OpenFisca a pu entamer un processus de fusion des deux ensembles de paramètres, en commençant par convertir les fichiers Excel dans un format facilitant la réutilisation – le YAML. Ce processus de fusion illustre à merveille l'intérêt de l'open data et du logiciel libre : chacun apporte ce qu'il peut au pot commun, et en retire ce que les autres y ont apporté, sans rien enlever à personne, en tirant au passage tout le monde vers le haut.


Le choix de Christian, coordinateur du projet BAN : la Base Adresse Nationale

"Un choix classique mais incontournable"

D'abord, ce jeu de données fait partie des "pivots" essentiels et affiche à ce titre un nombre de réutilisations grandissant. Ces réutilisations se font soit par la mise à disposition des données brutes téléchargeables, mais aussi (voire même surtout) via l'API de géocodage qu'Etalab a développé et mis en service en avril 2015 sur adresse.data.gouv.fr. En 8 mois, 47 millions d'appels ont été faits sur cette API publique par de nombreux services en ligne (kelquartier, labonneboite, métromobilité à Grenoble, etc).

Ensuite, ce jeu de données nous sert au quotidien chez Etalab : pour des projets de datascience, pour ajouter des informations géographiques à certaines données, pour mener des travaux exploratoires comme le géocodage de listes électorales en vue de déterminer le périmètre de bureaux de votes, ou pour compléter des données ne comportant que des adresses sans position (par exemple l'annuaire des services publics nationaux).

Enfin, j'ai utilisé ce jeu de données dans différents projets récents lors de hackathons comme OpenSolarMap (crowdsourcing de l'orientation des pentes des toits) ou OpenEvacMap (crowdsourcing de plan d'évacuation qu'on lie aux adresses via la BAN et son API publique). Ce jeu de données et les API construites autour préfigurent une brique essentielle de l'infrastructure de donnée désormais indispensable au bon fonctionnement et à la réalisation de nombreux outils et applications tant dans la sphère publique qu'au delà. Ce jeu de données a son propre site dédié (adresse.data.gouv.fr), son propre compte twitter (@BaseAdresse)... et une communauté grandissante qui gravite autour.


Le choix de Simon, data editor : les indicateurs sanitaires proposés par Open Data Health

« De nouvelles sources de connaissance sur la santé quotidienne des Français »

Open Health propose en open data une série d’indicateurs sanitaires. L’originalité réside dans l’origine des données : cette société analyse chaque jour les tickets de caisse de 4000 pharmacies de ville.
Les principales épidémies, comme la grippe, sont déjà surveillées par le réseau Sentinelles de l’Inserm depuis le début des années 1980. Mais l’utilisation de nouvelles sources de données permet de suivre des phénomènes du quotidien comme l’incidence des poux ou les manifestations allergiques - ce qui n’était pas réalisé jusqu’à présent avec une telle granularité et en quasi-temps réel. Aujourd’hui l’open data cela concerne aussi les entreprises !


Vous avez aussi un témoignage à partager ? Racontez le nous sur Twitter à @datagouvfr !

Jeux de données 11

Indicateur Avancé Sanitaire IAS® - GASTRO-ENTERITE

L’objectif de l’IAS® Incidence de la gastro-entérite est de réaliser une surveillance syndromique de la gastro-entérite en France. La gastro-entérite est un syndrome pouvant avoir de nombreuses origines : bactérienne (consommation d'eau ou de nourriture contaminée par des bactéries), parasitaire…

Indicateur Avancé Sanitaire IAS® - SYNDROME GRIPPAL

L’objectif de l’Indicateur Avancé Sanitaire (IAS®) "Syndrome Grippal" est de contribuer à la surveillance des syndromes grippaux en France en apportant des informations complémentaires à celles du réseau Sentinelles. Cet indicateur a été validé par comparaison avec les données du réseau…

Bases de données annuelles des accidents corporels de la circulation routière - Années de 2005 à 2020

Pour chaque accident corporel (soit un accident survenu sur une voie ouverte à la circulation publique, impliquant au moins un véhicule et ayant fait au moins une victime ayant nécessité des soins), des saisies d’information décrivant l’accident sont effectuées par l’unité des forces de l’ordre…

Monuments Historiques : liste des Immeubles protégés au titre des Monuments Historiques

Liste des Immeubles protégés au titre des Monuments Historiques (total France en 2021 : 45 907 monuments). REF: référence (PAxxxx) ; ADRS : adresse (n° de la voie, type de voie, nom de la voie) ; AFFE : affectataire (utile pour les propriétés de l'Etat, mentionne le nom du ministère affectataire)…

Base Adresse Nationale (BAN)

La Base Adresse Nationale est l’une des neuf bases de données du service public des données de référence. Elle est la seule base de données d’adresses officiellement reconnue par l’administration. Service numérique d’usage partagé et infrastructure socle sur laquelle sont adossées de nombreuses…

Fichier consolidé des Bornes de Recharge pour Véhicules Électriques (IRVE)

Aménageurs, collectivités, producteurs de données : retrouvez ici la documentation complète pour référencer vos bornes. Contexte Dans le but de constituer un répertoire national des Infrastructures de recharge pour véhicules électriques (IRVE), ouvert et accessible à tous, les collectivités…

Barèmes IPP - système social et fiscal français

L’Institut des politiques publiques (IPP) s’est donné pour mission de rassembler l’ensemble de la législation des politiques publiques en France dans une perspective historique et scientifique. L’objectif est d’en faciliter l’évaluation, l’analyse et la diffusion. En premier lieu, ces barèmes…

Dépenses par prestation - National

Les résultats financiers sont issus des données comptables de la Cnaf. Ils sont décrits selon le type de prestation. Les prestations : PAJE - Prestation d'Accueil du Jeune Enfant - composante de la PAJE : Prime naissance adoption - composante de la PAJE : Allocation de base - composante de la PAJE…

Consultation sur le projet de loi République numérique

Les données proposées sont extraites de la plateforme web www.republique-numerique.fr utilisée pour la consultation sur le projet de loi République numérique, présenté par Axelle Lemaire, Secrétaire d’État chargée du numérique. Cette consultation s'est tenue du 26 septembre au 18 octobre 2015. Ces…

Elections départementales 2015 - Résultats par bureaux de vote

Résultats des élections départementales 2015, tours 1 et 2, par bureaux de vote Nota : le découpage communal, la nomenclature et les périmètres des bureaux de vote enregistrent des évolutions entre les différents scrutins

Election présidentielle 2012 – Résultats par bureaux de vote

Résultats de l’élection présidentielle 2012, tours 1 et 2, par bureaux de vote Nota : le découpage communal, la nomenclature et les périmètres des bureaux de vote enregistrent des évolutions entre les différents scrutins