Chez Etalab, l'Open Data Day c'est toute l'année !

Cet article est un brouillon et ne sera pas visible par les autres utilisateurs
A l'occasion de la journée internationale "Open Data Day", découvrez une sélection de jeux de données et réutilisations récents qui ont marqué l'équipe d'Etalab et ses correspondants open data dans les ministères ! Vous avez aussi un témoignage à partager ? Racontez le nous sur Twitter à @datagouvfr !

Le choix de Clémentine, chargée de mission : l’ouverture des données électorales par bureau de vote

"Une ouverture inédite pour modéliser les tendances électorales "

Auparavant agrégées par communes, le ministère de l’Intérieur a ouvert les données des résultats des élections par bureau de vote depuis 1999. Leur ouverture à ce niveau de granularité est inédite et fait de la France l’un des pays les plus avancés sur le sujet. Cela correspond à l’un des engagements du plan d’action de la France pris dans le cadre du G8 ainsi qu’à l’un des critères de l’édition 2015 du classement Open Data Index. Les données des élections avaient déjà fait l’objet d’un open data camp, organisé avec à Sciences Po avec le CDSP (centre de données socio-politiques) et le ministère de l’Intérieur. Ce nouveau niveau de granularité devrait susciter encore plus de réutilisations par les citoyens, les start-ups et les chercheurs modélisant les tendances électorales. Le modèle prédictif de la start-up de stratégie électorale Liegey Muller Pons utilise notamment les résultats électoraux passés.

LMP


Le choix de Claire-Marie, responsable développement & politique : Open Elections, site de visualisation de données électorales ouvertes au Burkina Faso

"Au Burkina Faso, l'open data ouvre les élections présidentielles"

En novembre 2015, pour l'une des premières fois, les résultats d'une élection présidentielle n'ont pas été contestés au Burkina Faso... et l'open data y a contribué ! Grâce à www.burkina2015.bf, les citoyens burkinabés ont vu se colorer une carte du Burkina province par province, en fonction de la couleur politique du candidat arrivé en tête. Avec seulement 3 minutes de décalage, les données de la Commission électorale ont été visualisées par l'équipe gouvernementale Open Data Burkina Faso sur ce site, accessible sur web et mobile. Se rapprocher du temps réel et toucher les citoyens, deux objectifs ambitieux pour l'open data d'ici et d'ailleurs !

OpenElections


Le choix de Laure, directrice d'Etalab : les données de la consultation sur le projet de loi République Numérique

"Boucler la boucle des principes de gouvernement ouvert"

La large consultation menée il y a quelques mois autour du projet de loi pour une République numérique, présenté le 9 décembre 2015 en Conseil des ministres par Mme Axelle Lemaire, Secrétaire d’État chargée du numérique, fournit une illustration concrète de la mise en œuvre des principes du « gouvernement ouvert ». Cette démarche démontre comment un « processus métier » propre à l’action publique, celui de l’élaboration d’une loi, a été en plusieurs endroits (dès la définition des thèmes à traiter, lors la rédaction des articles, et jusque dans le débat parlementaire) nourri, augmenté, enrichi de la contribution des citoyens sous différentes formes.

Dès octobre 2014, une concertation nationale (« ambition numérique ») a été lancée par le Premier ministre et animée par le Conseil national du numérique. À l’issue de plusieurs mois, elle a permis de recueillir plus de 4000 contributions d’entreprises, d’administrations et de citoyens. Un projet de texte a ensuite été élaboré par le Gouvernement et soumis à consultation publique sur la plateforme www.republique-numerique.com, du 26 septembre au 18 octobre 2015. Cette plateforme a recueilli plus de 8 500 contributions et près de 150 000 votes, et le Gouvernement a apporté des réponses aux propositions les plus soutenues.

A l’issue de la concertation, les données de la plateforme de consultation ont été publiées en open data sur data.gouv.fr et un hackathon a été organisé. Grâce à la publication de ces données, des chercheurs, des sociologues, des représentants de la société civile et des innovateurs ont pu comprendre les dynamiques à l’œuvre pendant la consultation (qui a participé, comment les communautés se sont mobilisées, quels ont été les articles les plus soutenus ou débattus….), en tirer des enseignements et éclairer l’administration engagée dans cette ouverture inédite sur les résultats de cette démarche. Ces analyses ont été publiées, et partagées avec nos partenaires du Partenariat pour un Gouvernement Ouvert.

HackRepNum


Le choix de Philippe, correspondant open data du ministère de l'Intérieur : les données de l'accidentologie en open data

"Les données emblématiques du ministère de l'intérieur"

Le ministère de l'Intérieur a ouvert depuis 2011 un nombre conséquent de données sur l'ensemble de ses domaines d'intervention : sécurité intérieure, routière, et protection des populations mais aussi élections (scrutins nationaux et locaux), libertés publiques (associations), collectivités territoriales... qui ont suscité de nombreuses réutilisations. Parmi les plus emblématiques figurent celles relatives à l'accidentologie. Le ministère de l'Intérieur propose, en effet, aux citoyens et à l'écosystème les bases de données, extraites du fichier BAAC, répertoriant l'intégralité des accidents corporels de la circulation intervenus durant une année précise en France métropolitaine ainsi que dans les départements d’Outre-mer (depuis 2012) avec une description simplifiée. Cela comprend des informations de localisation de l’accident, telles que renseignées ainsi que des informations concernant les caractéristiques de l’accident et son lieu, les véhicules impliqués et leurs victimes.

Intérieur


Le choix d'Henri, directeur interministériel du numérique et du système d'information et de communication de l’État : les bornes de recharge pour véhicules électriques

"Les données pour créer un marché"

Dans le cadre du plan industriel "bornes électriques de recharge", le préfet Vuibert eut la bonne idée de proposer que les aides financières de l’État à l'installation de bornes pour véhicules électriques soient conditionnées à la publication en open data des localisations et des caractéristiques des bornes. La raison ? Le marché du véhicule électrique a besoin, pour que les conducteurs partent en confiance, qu'ils puissent être certains de toujours savoir où recharger leurs véhicules. De manière intéressante, l’État reprenait ainsi, 110 ans après, le raisonnement de Michelin qui, en 1905, avait lancé son activité de cartographie pour permettre aux premiers automobilistes de savoir où réparer leurs véhicules. Tesla fut le premier producteur de données à venir déposer l'un de ces jeux, exploitant ainsi la dimension contributive de data.gouv.fr.

Bornes


Le choix de Guillaume, chargé de mission : CartoPedago et Qui dit miam!, les applications qui simplifient l'école

"L'open data simplifie la vie des professeurs et des parents"

Finalistes au concours Data.connexions 6, les applications CartoPedago et Qui dit miam! cherchent à simplifier l’une la vie des professeurs, l’autre celle des parents. CartoPedago propose une application nourrie des données ouvertes sur les établissements culturels qui aide les enseignants à choisir leurs sorties scolaires plus facilement. Ils ont la possibilité de commenter et de noter les lieux, un outil facile d’usage et d’un grand secours dans cette tâche d’organisation chronophage et bénévole. Qui dit miam! utilise les données fournies par la cantine centrale de Toulouse pour une application mobile qui détaille les menus proposés chaque semaine dans les cantines en précisant la composition exacte et les allergènes potentiels. Ces premières initiatives témoignent du potentiel de l’ouverture des données pour des services autour des écoles.

Qui dit miam


Le choix d'Alexis, datascientist : l'ouverture osée et récompensée des données de la Cnaf

"Un pari réussi pour la Caisse nationale des allocations familiales"

La Caisse nationale des allocations familiales a entamé une démarche d'Open Data. Elle a ouvert son portail a l'été. Elle a aussi organisé un hackathon de deux jours début octobre. Dans le cadre de ce hackathon, elle a proposé des données anonymisées sur près de 12 millions de foyers allocataires. Plus encore, elle a proposé des données sur son activité : l'utilisation de son site web, le traitement des documents des allocataires, rendez-vous en agence, etc. En exposant sans retenue son activité et en organisant ce hackathon, la Cnaf a pu voir un écosystème créatif et innovant proposer, en seulement deux jours, des études, des designs et des concepts qui peuvent l'aider à s'améliorer encore. La Cnaf va incuber certains projet. A suivre et à poursuivre !

Hackallocs


Le choix de Julien, data editor : BatiParis par Étienne Côme

"Découvrir Paris au travers des ages"

BatiParis est une carte interactive réalisée par Étienne Côme qui permet de visualiser les bâtiments parisiens selon leur date de construction. Elle permet ainsi de saisir l'extraordinaire expansion de la ville depuis les années 1800 et de constater l'importance des travaux entrepris entre 1851 et 1914 sous l'impulsion du baron Haussmann. Elle s'appuie sur les données ouvertes de l'APUR (Atelier parisien d'urbanisme) ainsi que sur celles des localisations des monuments historiques. Plus qu'une simple carte, c'est aussi un formidable outil pour les chercheurs et historiens intéressés par la question des évolutions urbaines.

BatiParis


Le choix de Romain, data hunter : la base de données des accidents corporels de la circulation mise à disposition par le ministère de l'Intérieur

« Les données des accidents corporels de la circulation au service d’un meilleur pilotage des politiques publiques »

Les bases de données, extraites du fichier BAAC, répertorient l'intégralité des accidents corporels de la circulation intervenus durant une année précise en France métropolitaine ainsi que les départements d’Outre-mer (Guadeloupe, Guyane, Martinique, La Réunion et Mayotte depuis 2012) avec une description simplifiée. Cela comprend des informations de localisation de l’accident, telles que renseignées ainsi que des informations concernant les caractéristiques de l’accident et son lieu, les véhicules impliqués et leurs victimes. La précision de ces données (latitude, longitude) ainsi que leur exhaustivité, permet à la puissance publique locale d’optimiser l’installation d’infrastructures routières en fonction des zones particulièrement accidentogènes. C’est l'un des premiers exemples concrets de politique publique pilotée par la donnée.

Accidents


Le choix de Christophe, développeur : les barèmes du système social et fiscal français de l'Institut des politiques publiques

"Modéliser la législation socio-fiscale"

Ce jeu de données contient tout un ensemble de paramètres que l'on rencontre dans les articles de la législation socio-fiscale – en particulier les impôts et les prestations sociales. Je travaille sur le projet OpenFisca qui tend à modéliser la législation socio-fiscale sous forme de code source logiciel. Le projet OpenFisca a lui aussi recensé depuis plusieurs années un ensemble de paramètres de la législation socio-fiscale. Lorsque l'Institut des Politiques Publiques a publié ses fichiers de données en open data, le projet OpenFisca a pu entamer un processus de fusion des deux ensembles de paramètres, en commençant par convertir les fichiers Excel dans un format facilitant la réutilisation – le YAML. Ce processus de fusion illustre à merveille l'intérêt de l'open data et du logiciel libre : chacun apporte ce qu'il peut au pot commun, et en retire ce que les autres y ont apporté, sans rien enlever à personne, en tirant au passage tout le monde vers le haut.

OpenFisca


Le choix de Christian, coordinateur du projet BAN : la Base Adresse Nationale

"Un choix classique mais incontournable"

D'abord, ce jeu de données fait partie des "pivots" essentiels et affiche à ce titre un nombre de réutilisations grandissant. Ces réutilisations se font soit par la mise à disposition des données brutes téléchargeables, mais aussi (voire même surtout) via l'API de géocodage qu'Etalab a développé et mis en service en avril 2015 sur adresse.data.gouv.fr. En 8 mois, 47 millions d'appels ont été faits sur cette API publique par de nombreux services en ligne (kelquartier, labonneboite, métromobilité à Grenoble, etc).

Ensuite, ce jeu de données nous sert au quotidien chez Etalab : pour des projets de datascience, pour ajouter des informations géographiques à certaines données, pour mener des travaux exploratoires comme le géocodage de listes électorales en vue de déterminer le périmètre de bureaux de votes, ou pour compléter des données ne comportant que des adresses sans position (par exemple l'annuaire des services publics nationaux).

Enfin, j'ai utilisé ce jeu de données dans différents projets récents lors de hackathons comme OpenSolarMap (crowdsourcing de l'orientation des pentes des toits) ou OpenEvacMap (crowdsourcing de plan d'évacuation qu'on lie aux adresses via la BAN et son API publique). Ce jeu de données et les API construites autour préfigurent une brique essentielle de l'infrastructure de donnée désormais indispensable au bon fonctionnement et à la réalisation de nombreux outils et applications tant dans la sphère publique qu'au delà. Ce jeu de données a son propre site dédié (adresse.data.gouv.fr), son propre compte twitter (@BaseAdresse)... et une communauté grandissante qui gravite autour.

BAN


Le choix de Simon, data editor : les indicateurs sanitaires proposés par Open Data Health

« De nouvelles sources de connaissance sur la santé quotidienne des Français »

Open Health propose en open data une série d’indicateurs sanitaires. L’originalité réside dans l’origine des données : cette société analyse chaque jour les tickets de caisse de 4000 pharmacies de ville.
Les principales épidémies, comme la grippe, sont déjà surveillées par le réseau Sentinelles de l’Inserm depuis le début des années 1980. Mais l’utilisation de nouvelles sources de données permet de suivre des phénomènes du quotidien comme l’incidence des poux ou les manifestations allergiques - ce qui n’était pas réalisé jusqu’à présent avec une telle granularité et en quasi-temps réel. Aujourd’hui l’open data cela concerne aussi les entreprises !

Open Health


Vous avez aussi un témoignage à partager ? Racontez le nous sur Twitter à @datagouvfr !

Jeux de données 11

Réutilisations 10