Pourquoi ?

L’open data consiste à ouvrir, c’est-à-dire diffuser, des informations permettant notamment de garantir la transparence administrative. Les administrations sont dans l’obligation de diffuser les informations publiques qu’elles produisent ou reçoivent.
L’ouverture de ces données est soumise à un cadre précis, la diffusion de ces données ne devant porter atteinte ni à la protection de la vie privée, ni au secret des affaires. Ainsi, nous veillons à traiter l’ensemble des informations avant leur publication.

Quand ?

Les données relatives aux trajets contenus dans le registre de preuve de covoiturage sont ouvertes après avoir fait l’objet d’un traitement permettant une publication conforme (anonymisation, agrégation, etc.).
Aujourd'hui ce traitement n'est pas automatisé et de ce fait la fréquence d'ouverture n'est pas définitive. Un jeu de donnée correspond aux trajets sur un mois.

Comment ?

Dans le cadre de l'ouverture des données, les principaux traitements effectués sont les suivants :

  • Anonymisation des données via la suppression des identifitants conducteurs et passagers.
  • Application de tranches horaires : les heures de départs et arrivées sont arrondis au quart d'heure près.
  • Carroyage des données géographiques :
    • Lorsque la densité du point de départ ou arrivée est faible : la latitude et longitude sont tronqués à 2 décimales (précision de ~700m).
    • Lorsque la densité du point de départ ou arrivée est forte : la latitude et longitude sont tronqués à 3 décimales (précision de ~70m).
  • Suppression des trajets afférents à une maille géographique "solitaire" :
    • Si le nombre d'occurences du code INSEE de départ est < 6 sur le jeu de données, le trajet est supprimé.
    • Si le nombre d'occurences du code INSEE d'arrivée est < 6 sur le jeu de données, le trajet est supprimé.

Ces mesures permettent ainsi de limiter la réidentification. Dans la description du jeu de données, le nombre de trajets supprimés est indiqué.

Format ?

Chaque ligne correspond à un trajet de covoiturage, c'est à dire un couple passager / conducteur. A chaque passager est donc affecté un trajet.

Exemple : un conducteur réalise un déplacement avec deux passagers différents au sein de son véhicule, le nombre de trajets réalisés et de 2. Ceci se traduit par deux lignes.

  • journey_id
    Identifiant unique affecté à un couple passager/conducteur.
  • trip_id
    Identifiant permettant de recouper plusieurs couples passager/conducteur dans un même véhicule.
    Exemple : c4124bb1-d8a4-487c-b4d9-367b931ee8ce
  • journey_start_datetime
    Exemple : 2019-10-31T23:00:00.000Z
    Date et heure du départ au format ISO 8601 (YYYY-MM-DDThh:mm:ssZ).
    L'heure est exprimée en UTC (Coordinated Universal Time). UTC n'est pas ajusté sur l'heure d'été et hiver !
  • journey_start_date nouveau à compter de aout 2020
    Exemple : 2019-10-31
    Date départ au format YYYY-MM-DD
  • journey_start_time nouveau à compter de aout 2020
    Exemple : 02:20:001
    Heure de départ au format hh:mm:ss
  • journey_start_lat
    Exemple : 48.725
    Latitude du point de départ (prise en charge passager) comprise entre 90deg et -90deg décimaux en datum WSG-84
  • journey_start_lon
    Exemple : 2.261
    Longitude du point de départ (prise en charge passager) comprise entre 180deg et -180deg décimaux en datum WSG-84
  • journey_start_insee
    Exemple : 91377
    Code INSEE commune ou arrondissement du point de départ (prise en charge passager).
  • journey_start_postcode
    Exemple : 91300
    Code postal du point de départ (prise en charge passager)
  • journey_start_town
    Exemple : Massy
    Commune du point de départ (prise en charge passager)
    journey_start_departmentnouveau à compter de aout 2020Exemple : 38*
    Département du point de départ (prise en charge passager)
  • journey_start_country
    Exemple : France
    Pays du point de départ (prise en charge passager)
  • journey_end_datetime
    Exemple : 2019-10-31T23:15:00.000Z
    Date et heure de l'arrivée au format ISO 8601 (YYYY-MM-DDThh:mm:ssZ).
    L'heure est exprimée en UTC (Coordinated Universal Time). UTC n'est pas ajusté sur l'heure d'été et hiver !
  • journey_end_date nouveau à compter de aout 2020
    Exemple : 2019-10-31
    Date d'arrivée au format YYYY-MM-DD
  • journey_end_time nouveau à compter de aout 2020
    Exemple : 02:20:001
    Heure d'arrivéet au format hh:mm:ss
  • journey_end_lat
    Exemple : 48.695
    Latitude du point d'arrivée (dépose passager) comprise entre 90deg et -90deg décimaux en datum WSG-84
  • journey_end_lon
    Exemple : 2.162
    Longitude du point d'arrivée (dépose passager) comprise entre 180deg et -180deg décimaux en datum WSG-84
  • journey_end_insee
    Exemple : 91122
    Code INSEE commune ou arrondissement du point d'arrivée (dépose passager).
  • journey_end_postcode
    Exemple : 91440
    Code postal du point d'arrivée (dépose passager)
    journey_end_departmentnouveau à compter de aout 2020Exemple : 38*
    Département du point d'arrivée (dépose passager)
  • journey_end_town
    Exemple : Bures-sur-Yvette
    Commune du point d'arrivée (dépose passager)
  • journey_end_country
    Exemple : France
    Pays du point d'arrivée (dépose passager)
  • passenger_seatsnouveau à compter de aout 2020
    Exemple : 2
    Nombre de sièges réservés par l'occupant passager
    ## Attention

Ces données sont collectées à partir des informations communiquées par les opérateurs partenaires.
En outre il ne saurait s'agir :

  • d'une représentation exhaustive du covoiturage en France ;
  • d'un outil permettant le calcul de part de marché d'un acteur du covoiturage.

Contacts

Pour toute demande d’information, veuillez contacter l'équipe du registre de preuve de covoiturage à l’adresse suivante : technique@covoiturage.beta.gouv.fr
Nous vous remercions de bien vouloir renseigner l'objet de votre mail comme suit : OpenDataRPC-votre nom.

Spécificités jeu de données novembre 2019

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

L'identifiant permettant de recouper plusieurs couples passager/conducteur dans un même véhicule sur le mois de novembre n'est pas totalement mis en place.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 171 213
  • Nombre de trajets exposés dans le jeu de données : 164 499
  • Nombre de trajets supprimés du jeu de données : 6714 = 3592 + 3707 - 585
    • Nombre d’occurrences du code INSEE de départ est < 6 : 3592
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 3707
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 585

Spécificités jeu de données décembre 2019

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

L'identifiant permettant de recouper plusieurs couples passager/conducteur dans un même véhicule sur le mois de décembre n'est pas totalement mis en place.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 441 269
  • Nombre de trajets exposés dans le jeu de données : 433 140
  • Nombre de trajets supprimés du jeu de données : 8129 = 4305 + 4330 - 506
    • Nombre d’occurrences du code INSEE de départ est < 6 : 4305
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 4330
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 506

Spécificités jeu de données janvier 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

L'identifiant permettant de recouper plusieurs couples passager/conducteur dans un même véhicule sur le mois de janvier n'est pas totalement mis en place.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 567 025
  • Nombre de trajets exposés dans le jeu de données : 559 705
  • Nombre de trajets supprimés du jeu de données : 7320 = 3856 + 3822 - 358
    • Nombre d’occurrences du code INSEE de départ est < 6 : 3856
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 3822
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 358

Spécificités jeu de données février 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 402 120
  • Nombre de trajets exposés dans le jeu de données : 394 970
  • Nombre de trajets supprimés du jeu de données : 7150 = 4056 + 3601 - 507
    • Nombre d’occurrences du code INSEE de départ est < 6 : 4056
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 3601
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 507

Spécificités jeu de données mars 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 242 833
  • Nombre de trajets exposés dans le jeu de données : 235 967
  • Nombre de trajets supprimés du jeu de données : 6866 = 3850 + 3458 - 442
    • Nombre d’occurrences du code INSEE de départ est < 6 : 3850
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 3458
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 442

Spécificités jeu de données avril 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 34 087
  • Nombre de trajets exposés dans le jeu de données : 32 673
  • Nombre de trajets supprimés du jeu de données : 1414 = 885 + 857 - 328
    • Nombre d’occurrences du code INSEE de départ est < 6 : 885
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 857
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 328

Spécificités jeu de données mai 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 73 951
  • Nombre de trajets exposés dans le jeu de données : 71 302
  • Nombre de trajets supprimés du jeu de données : 2 649 = 1 685 + 1 637 - 673
    • Nombre d’occurrences du code INSEE de départ est < 6 : 1 685
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 1 637
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 673

Spécificités jeu de données juin 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 134 132
  • Nombre de trajets exposés dans le jeu de données : 128 946
  • Nombre de trajets supprimés du jeu de données : 5 186= 2 913 + 2 866 - 593
    • Nombre d’occurrences du code INSEE de départ est < 6 : 2 913
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 2 866
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 593

Spécificités jeu de données juillet 2020

Les données concernent uniquement les trajets dont le point de départ ET d'arrivée est situé sur le territoire français. Les trajets dont l'origine ou la destination sont situés en dehors du territoire français seront ouverts dans un second temps.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 103 052
  • Nombre de trajets exposés dans le jeu de données : 98 212
  • Nombre de trajets supprimés du jeu de données : 4 840 = 2 678 + 2 719 - 557
    • Nombre d’occurrences du code INSEE de départ est < 6 : 2 678
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 2 719
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 557

Spécificités jeu de données aout 2020

Les données concernent également les trajets dont le point de départ OU d'arrivée est situé en dehors du territoire français.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 32 985
  • Nombre de trajets exposés dans le jeu de données : 28 845
  • Nombre de trajets supprimés du jeu de données : 4 140 = 2 377 + 2 353 - 590
    • Nombre d’occurrences du code INSEE de départ est < 6 : 2 377
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 2 353
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 590

Spécificités jeu de données septembre 2020

Les données concernent également les trajets dont le point de départ OU d'arrivée est situé en dehors du territoire français.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 66 228
  • Nombre de trajets exposés dans le jeu de données : 61 206
  • Nombre de trajets supprimés du jeu de données : 5 022 = 2 777 + 2 677 - 432
    • Nombre d’occurrences du code INSEE de départ est < 6 : 2 777
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 2 677
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 432

Spécificités jeu de données octobre 2020

Les données concernent également les trajets dont le point de départ OU d'arrivée est situé en dehors du territoire français.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 67 850
  • Nombre de trajets exposés dans le jeu de données : 63 000
  • Nombre de trajets supprimés du jeu de données : 4 850 = 2 490 + 2 715 - 355
    • Nombre d’occurrences du code INSEE de départ est < 6 : 2 490
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 2 715
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 355

Spécificités jeu de données novembre 2020

Les données concernent également les trajets dont le point de départ OU d'arrivée est situé en dehors du territoire français.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 35 858
  • Nombre de trajets exposés dans le jeu de données : 32 456
  • Nombre de trajets supprimés du jeu de données : 3 402 = 1 946 + 1 899 - 443
    • Nombre d’occurrences du code INSEE de départ est < 6 : 1 946
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 1 899
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 443

Spécificités jeu de données décembre 2020

Les données concernent également les trajets dont le point de départ OU d'arrivée est situé en dehors du territoire français.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 33 194
  • Nombre de trajets exposés dans le jeu de données : 29 842
  • Nombre de trajets supprimés du jeu de données : 3 352 = 1 883 + 1 907 - 438
    • Nombre d’occurrences du code INSEE de départ est < 6 : 1 883
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 1 907
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 438

Spécificités jeu de données janvier 2021

Les données concernent également les trajets dont le point de départ OU d'arrivée est situé en dehors du territoire français.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 42 162
  • Nombre de trajets exposés dans le jeu de données : 38 599
  • Nombre de trajets supprimés du jeu de données : 3 563 = 1 858 + 2 023 - 418
    • Nombre d’occurrences du code INSEE de départ est < 6 : 1 858
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 2 023
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 418

Spécificités jeu de données février 2021

Les données concernent également les trajets dont le point de départ OU d'arrivée est situé en dehors du territoire français.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 58 899
  • Nombre de trajets exposés dans le jeu de données : 54 799
  • Nombre de trajets supprimés du jeu de données : 4 100 = 2 287 + 2 230 - 417
    • Nombre d’occurrences du code INSEE de départ est < 6 : 2 287
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 2 230
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 417

Spécificités jeu de données mars 2021

Les données concernent également les trajets dont le point de départ OU d'arrivée est situé en dehors du territoire français.

  • Nombre trajets collectés et validés par le registre de preuve de covoiturage 111 599
  • Nombre de trajets exposés dans le jeu de données : 107 188
  • Nombre de trajets supprimés du jeu de données : 4 411 = 2 406 + 2 423 - 418
    • Nombre d’occurrences du code INSEE de départ est < 6 : 2 406
    • Nombre d’occurrences du code INSEE d'arrivée est < 6 : 2 423
    • Nombre d’occurrences du code INSEE de départ ET d'arrivée est < 6 : 418

Ressources

Ressources communautaires

Vous avez construit une base de données plus complète que celles présentées ici ? C'est le moment de la partager !

Réutilisations

Vous avez réutilisé ces données et publié un article, une infographie, ou une application ? C'est le moment de vous faire connaître ! Référencez votre travail en quelques clics et augmentez votre visibilité.

Discussions

Discussion entre l'organisation et la communauté à propos de ce jeu de données.