Déclarations d'intérêts des parlementaires publiées par la Haute Autorité pour la Transparence

Licence Ouverte / Open Licence

NosDonnées.fr

NosDonnees.fr est un catalogue collaboratif de jeux de données, ouvert aux contributions de chacun. NosDonnées est géré par : Regards Citoyens OKFN France

424 datasets

Informations

Temporality

Extras

Embed

Permalink

Description

Depuis la promulgation de la loi sur la transparence de la vie publique, les parlementaires doivent déclarer leurs intérêts à la Haute Autorité pour la Transparence de la Vie Publique en charge de les contrôler et de les rendre publics afin que chaque citoyen puisse évaluer les possibles risques de conflits d’intérêts de ses représentants. Activités annexes, rémunérations extérieures, autres mandats, noms et activités des collaborateurs… Autant d'informations remplies à la main par les parlementaires dans les formulaires publiés par la Haute Autorité : http://www.hatvp.fr/consulter-les-declarations-rechercher.html

Afin de permettre à tous de pouvoir explorer ces informations en OpenData, Regards Citoyens a proposé une interface de crowdsourcing permettant de numériser l'ensemble des déclarations en une semaine grâce à la participation de près de 8000 personnes : http://www.regardscitoyens.org/8000-personnes-liberent-en-une-semaine-les-donnees-manuscrites-des-declarations-dinterets-des-parlementaires/

Retrouvez ici les données résultantes ainsi que l'ensemble des numérisations anonymisées réalisées par les utilisateurs de l'application.

Resources 3

See also: community resources
100 downloads

Données textuelles brutes numérisées à partir des déclarations d'intérêts des parlementaires

Disponible
zip (csv utf8)

Cette archive comprend les données validées de l'opération de numérisation des déclarations d'intérêts des parlementaires.

Pour chacun des 13 extraits de formulaires, un fichier CSV numéroté comprend les informations validées pour chaque parlementaire pour la partie de la déclaration d'intérêts correspondante tel que le nom l'indique.

Les fichiers XX_ correspondent aux données brutes recréées à partir de ces fichiers pour réaliser les visualisations présentées ici : http://www.regardscitoyens.org/?p=5872

Le script python XX_calcul_delais_depot.py permet de calculer pour chaque parlementaire le délai entre le dépot du formulaire et la date légale. Il illustre comment compléter ces données des différentes informations disponibles sur les parlementaires à partir des sites NosDéputés.fr et NosSénateurs.fr.

Ces données sont des fichiers tableurs au format CSV utf-8. Si vous trouvez en les ouvrant des symboles kabbalistiques, vous employez certainement un mauvais logiciel, utilisez plutôt un vrai tableur comme LibreOffice : https://www.libreoffice.org/download/libreoffice-fresh/

01 août 2014

Type
Main file
MIME Type
None
Created on
January 13, 2017
Modified on
July 10, 2017
Published on
January 13, 2017
24 downloads

Export anonymisé des numérisations citoyennes des déclarations d'intérêts des parlementaires

Disponible
zip (sql)

Cette archive comprend un dump MySQL de l'ensemble des opérations de numérisation réalisées par les citoyens, pseudonymisés via un hash des adresses IP des contributeurs.

Voir l'autre version, beaucoup plus lourde (5Go), pour disposer également du dossier img contenant l'ensemble des extraits de déclarations proposés à la numérisation.

Il s'agit des données numérisées avant validation. Ces données sont fournies par souci de transparence, pour traitement d'analyse d'écriture manuelle, et pour le cas où des personnes souhaiteraient tester d'autres méthodes de validation.

Le dump SQL comprend deux tables :

  • crowdpi_documents_anon (11 097 lignes) : un élément par document à numériser comprenant plusieurs informations contextuelles (nom du député, liens vers la photo et la source), le champ img renvoyant au fichier jpg correspondant dans le dossier img, le type correspondant au type d'extrait de formulaire de 1 à 13 (voir plus bas), le champ tries indiquant le nombre de tâches de numérisations et le champ selected_task renvoyant à l'id de la tâche validée issue de la seconde table ;
  • crowdpi_tasks_anon (86 243 lignes) : un élément par numérisation enregistrée, renvoyant au document concerné via son id dans le champ document_id, un champ hash_ip correspondant à des adresses IP anonymisées, un champ created_at indiquant la date de numérisation, et un champ data comportant soit une string (soit NEANT, soit PB #[1-3] pour les problèmes remontés via l'interface, soit CORRECTED lorsque nous avons corrigé les soucis remontés), soit un array d'arrays de strings, formaté via la fonction json_encode de php.

Code des types d'extraits :
1 > donnees_personnelles
2 > activites_professionnelles
3 > activites_pro_5ans
4 > activites_conseil
5 > organes_dirigeants
6 > participations_financieres
7 > activites_conjoint
8 > fonctions_benevoles
9 > fonctions_mandats
10 > collaborateurs
11 > activites_conservees
12 > observations
13 > dates_reception

01 août 2014

Type
Main file
MIME Type
None
Created on
January 13, 2017
Modified on
July 10, 2017
Published on
January 13, 2017
15 downloads

Images et export anonymisé des numérisations citoyennes des déclarations d'intérêts des parlementaires

Disponible
zip (sql + jpeg)

Cette archive comprend un dossier img contenant l'ensemble des extraits de déclarations proposés à la numérisation ainsi qu'un dump MySQL de l'ensemble des opérations de numérisation réalisées par les citoyens, pseudonymisés via un hash des adresses IP des contributeurs.

Il s'agit des données numérisées avant validation. Ces données sont fournies par souci de transparence, pour traitement d'analyse d'écriture manuelle, et pour le cas où des personnes souhaiteraient tester d'autres méthodes de validation.

Le dump SQL comprend deux tables :

  • crowdpi_documents_anon (11 097 lignes) : un élément par document à numériser comprenant plusieurs informations contextuelles (nom du député, liens vers la photo et la source), le champ img renvoyant au fichier jpg correspondant dans le dossier img, le type correspondant au type d'extrait de formulaire de 1 à 13 (voir plus bas), le champ tries indiquant le nombre de tâches de numérisations et le champ selected_task renvoyant à l'id de la tâche validée issue de la seconde table ;
  • crowdpi_tasks_anon (86 243 lignes) : un élément par numérisation enregistrée, renvoyant au document concerné via son id dans le champ document_id, un champ hash_ip correspondant à des adresses IP anonymisées, un champ created_at indiquant la date de numérisation, et un champ data comportant soit une string (soit NEANT, soit PB #[1-3] pour les problèmes remontés via l'interface, soit CORRECTED lorsque nous avons corrigé les soucis remontés), soit un array d'arrays de strings, formaté via la fonction json_encode de php.

Code des types d'extraits :
1 > donnees_personnelles
2 > activites_professionnelles
3 > activites_pro_5ans
4 > activites_conseil
5 > organes_dirigeants
6 > participations_financieres
7 > activites_conjoint
8 > fonctions_benevoles
9 > fonctions_mandats
10 > collaborateurs
11 > activites_conservees
12 > observations
13 > dates_reception

01 août 2014

Type
Main file
MIME Type
None
Created on
January 13, 2017
Modified on
July 10, 2017
Published on
January 13, 2017

Community resources 0

You have built a more comprehensive database than those presented here? This is the time to share it!

Reuses 0

You reused these data and published an article, a computer graphics, or an application? It's time to let you know! Reference your work in just a few clicks and increase your visibility.

Discussion between the organization and the community about this dataset.