Pourquoi ?

L’open data consiste à ouvrir, c’est-à-dire diffuser, des informations permettant notamment de garantir la transparence administrative. Les administrations sont dans l’obligation de diffuser les informations publiques qu’elles produisent ou reçoivent.
L’ouverture de ces données est soumise à un cadre précis, la diffusion de ces données ne devant porter atteinte ni à la protection de la vie privée, ni au secret des affaires. Ainsi, nous veillons à traiter l’ensemble des informations avant leur publication.

Quand ?

Les données relatives aux trajets contenus dans le registre de preuve de covoiturage sont ouvertes après avoir fait l’objet d’un traitement permettant une publication conforme (anonymisation, agrégation, etc.).
Aujourd'hui ce traitement n'est pas automatisé et de ce fait la fréquence d'ouverture n'est pas définitive. Un jeu de donnée correspond aux trajets sur un mois.

Comment ?

Dans le cadre de l'ouverture des données, les principaux traitements effectués sont les suivants :

  • Anonymisation des données via la suppression des identifitants conducteurs et passagers.
  • Application de tranches horaires : les heures de départs et arrivées sont arrondis au quart d'heure près.
  • Carroyage des données géographiques :
    • Lorsque la densité du point de départ ou arrivée est faible : la latitude et longitude sont tronqués à 2 décimales (précision de ~700m).
    • Lorsque la densité du point de départ ou arrivée est forte : la latitude et longitude sont tronqués à 3 décimales (précision de ~70m).
  • Suppression des trajets afférents à une maille géographique "solitaire" :
    • Si le nombre d'occurences du code INSEE de départ est < 6 sur le jeu de données, le trajet est supprimé.
    • Si le nombre d'occurences du code INSEE d'arrivée est < 6 sur le jeu de données, le trajet est supprimé.

Ces mesures permettent ainsi de limiter la réidentification. Dans la description du jeu de données, le nombre de trajets supprimés est indiqué.

Format ?

Chaque ligne correspond à un trajet de covoiturage, c'est à dire un couple passager / conducteur. A chaque passager est donc affecté un trajet.

Exemple : un conducteur réalise un déplacement avec deux passagers différents au sein de son véhicule, le nombre de trajets réalisés et de 2. Ceci se traduit par deux lignes.

  • trip_id
    Identifiant permettrant de recouper plusieurs couples passager/conducteur dans un même véhicule.
    Exemple : c4124bb1-d8a4-487c-b4d9-367b931ee8ce
  • journey_start_datetime
    Exemple : 2019-10-31T23:00:00.000Z
    Date et heure du départ au format ISO 8601 (YYYY-MM-DDThh:mm:ssZ).
    L'heure est exprimée en UTC (Coordinated Universal Time). UTC n'est pas ajusté sur l'heure d'été et hiver !
  • journey_start_lat
    Exemple : 48.725
    Latitude du point de départ (prise en charge passager) comprise entre 90deg et -90deg décimaux en datum WSG-84
  • journey_start_lon
    Exemple : 2.261
    Longitude du point de départ (prise en charge passager) comprise entre 180deg et -180deg décimaux en datum WSG-84
  • journey_start_insee
    Exemple : 91377
    Code INSEE commune ou arrondissement du point de départ (prise en charge passager).
  • journey_start_postcode
    Exemple : 91300
    Code postal du point de départ (prise en charge passager)
  • journey_start_town
    Exemple : Massy
    Commune du point de départ (prise en charge passager)
  • journey_start_country
    Exemple : France
    Pays du point de départ (prise en charge passager)
  • journey_end_datetime
    Exemple : 2019-10-31T23:15:00.000Z
    Date et heure de l'arrivée au format ISO 8601 (YYYY-MM-DDThh:mm:ssZ).
    L'heure est exprimée en UTC (Coordinated Universal Time). UTC n'est pas ajusté sur l'heure d'été et hiver !
  • journey_end_lat
    Exemple : 48.695
    Latitude du point d'arrivée (dépose passager) comprise entre 90deg et -90deg décimaux en datum WSG-84
  • journey_end_lon
    Exemple : 2.162
    Longitude du point d'arrivée (dépose passager) comprise entre 180deg et -180deg décimaux en datum WSG-84
  • journey_end_insee
    Exemple : 91122
    Code INSEE commune ou arrondissement du point d'arrivée (dépose passager).
  • journey_end_postcode
    Exemple : 91440
    Code postal du point d'arrivée (dépose passager)
  • journey_end_town
    Exemple : Bures-sur-Yvette
    Commune du point d'arrivée (dépose passager)
  • journey_end_country
    Exemple : France
    Pays du point d'arrivée (dépose passager)

Attention

Ces données sont collectées à partir des informations communiquées par les opérateurs partenaires.
En outre il ne saurait s'agir :

  • d'une représentation exhaustive du covoiturage en France ;
  • d'un outil permettant le calcul de part de marché d'un acteur du covoiturage.

Contacts

Pour toute demande d’information, veuillez contacter l'équipe du registre de preuve de covoiturage à l’adresse suivante : technique@covoiturage.beta.gouv.fr
Nous vous remercions de bien vouloir renseigner l'objet de votre mail comme suit : OpenDataRPC-votre nom.

Spécificités jeu de données novembre 2019

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

L'identifiant permettrant de recouper plusieurs couples passager/conducteur dans un même véhicule sur le mois de novembre n'est pas totalement mis en place.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 171 213
  • Nombre de trajets exposés dans le jeu de données : 164 499
  • Nombre de trajets supprimés du jeu de données : 6714 = 3592 + 3707 - 585
    • Nombre d'occurences du code INSEE de départ est < 6 : 3592
    • Nombre d'occurences du code INSEE d'arrivée est < 6 : 3707
    • Nombre d'occurences du code INSEE de départ ET d'arrivée est < 6 : 585

Spécificités jeu de données décembre 2019

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

L'identifiant permettrant de recouper plusieurs couples passager/conducteur dans un même véhicule sur le mois de décembre n'est pas totalement mis en place.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 441 269
  • Nombre de trajets exposés dans le jeu de données : 433 140
  • Nombre de trajets supprimés du jeu de données : 8129 = 4305 + 4330 - 506
    • Nombre d'occurences du code INSEE de départ est < 6 : 4305
    • Nombre d'occurences du code INSEE d'arrivée est < 6 : 4330
    • Nombre d'occurences du code INSEE de départ ET d'arrivée est < 6 : 506

Spécificités jeu de données janvier 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

L'identifiant permettrant de recouper plusieurs couples passager/conducteur dans un même véhicule sur le mois de janvier n'est pas totalement mis en place.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 567 025
  • Nombre de trajets exposés dans le jeu de données : 559 705
  • Nombre de trajets supprimés du jeu de données : 7320 = 3856 + 3822 - 358
    • Nombre d'occurences du code INSEE de départ est < 6 : 3856
    • Nombre d'occurences du code INSEE d'arrivée est < 6 : 3822
    • Nombre d'occurences du code INSEE de départ ET d'arrivée est < 6 : 358

Spécificités jeu de données février 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 402 120
  • Nombre de trajets exposés dans le jeu de données : 394 970
  • Nombre de trajets supprimés du jeu de données : 7150 = 4056 + 3601 - 507
    • Nombre d'occurences du code INSEE de départ est < 6 : 4056
    • Nombre d'occurences du code INSEE d'arrivée est < 6 : 3601
    • Nombre d'occurences du code INSEE de départ ET d'arrivée est < 6 : 507

Spécificités jeu de données mars 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 242 833
  • Nombre de trajets exposés dans le jeu de données : 235 967
  • Nombre de trajets supprimés du jeu de données : 6866 = 3850 + 3458 - 442
    • Nombre d'occurences du code INSEE de départ est < 6 : 3850
    • Nombre d'occurences du code INSEE d'arrivée est < 6 : 3458
    • Nombre d'occurences du code INSEE de départ ET d'arrivée est < 6 : 442

Spécificités jeu de données avril 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 34 087
  • Nombre de trajets exposés dans le jeu de données : 32 673
  • Nombre de trajets supprimés du jeu de données : 1414 = 885 + 857 - 328
    • Nombre d'occurences du code INSEE de départ est < 6 : 885
    • Nombre d'occurences du code INSEE d'arrivée est < 6 : 857
    • Nombre d'occurences du code INSEE de départ ET d'arrivée est < 6 : 328

Spécificités jeu de données mai 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 73 951
  • Nombre de trajets exposés dans le jeu de données : 71 302
  • Nombre de trajets supprimés du jeu de données : 2 649 = 1 685 + 1 637 - 673
    • Nombre d'occurences du code INSEE de départ est < 6 : 1 685
    • Nombre d'occurences du code INSEE d'arrivée est < 6 : 1 637
    • Nombre d'occurences du code INSEE de départ ET d'arrivée est < 6 : 673

Spécificités jeu de données juin 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 134 132
  • Nombre de trajets exposés dans le jeu de données : 128 946
  • Nombre de trajets supprimés du jeu de données : 5 186= 2 913 + 2 866 - 593
    • Nombre d'occurences du code INSEE de départ est < 6 : 2 913
    • Nombre d'occurences du code INSEE d'arrivée est < 6 : 2 866
    • Nombre d'occurences du code INSEE de départ ET d'arrivée est < 6 : 593

Ressources

Ressources communautaires

Vous avez construit une base de données plus complète que celles présentées ici ? C'est le moment de la partager !

Réutilisations

Vous avez réutilisé ces données et publié un article, une infographie, ou une application ? C'est le moment de vous faire connaître ! Référencez votre travail en quelques clics et augmentez votre visibilité.

Discussions

Discussion entre l'organisation et la communauté à propos de ce jeu de données.