DATAtourisme est un dispositif national de collecte et de diffusion en open data des données touristiques institutionnelles. Porté par l’Etat, il est né d’une coopération inédite avec les réseaux des offices de tourisme, des agences départementales et des comités régionaux du tourisme de l’ensemble du territoire national.

Directement connectée aux bases de données territoriales, la plateforme nationale DATAtourisme permet un accès plus large et simplifié aux données publiques d’information touristique, au moyen de :
        -    Une technologie capable d’agréger et mettre à jour quotidiennement plusieurs dizaines de jeux de données qualifiées,
        ˗    Une ontologie nationale permettant de retranscrire l’intégralité des données touristiques en un vocabulaire et un format uniformisé
        ˗    Plusieurs services et une API permettant d’exploiter finement des données répondant à des besoins personnalisés
        ˗    Une licence d’exploitation unique et ouverte (Licence ouverte 2.0)

Lauréat du Programme Investissements d’Avenir, ce dispositif participe à la boîte à outils gouvernementale pour décliner la stratégie touristique nationale telle que définie par le Comité Interministériel du Tourisme.


Jeux de données disponibles :
        •    export complet et quotidien des données présentes sur la plateforme DATAtourisme, au format NT
        •    export quotidien simplifié des données de type « événement » (FMA) au format CSV
        •    export quotidien simplifié des données de type « lieux » (PLACE) au format CSV
        •    export quotidien simplifié des données de type « visites et activités » (PRODUCT) au format CSV
        •    export quotidien simplifié des données de type « itinéraires » (TOUR) au format CSV

Les fichiers CSV simplifiés contiennent les champs de description suivants :
        •    Titre ou nom du POI (label)
        •    Catégories de POI (type) (Il s'agit des identifiants des types, séparés par des barres verticales ( | ). Pour obtenir le libellé en français, il faut se référer au thésaurus.)
        •    Périodes regroupées (pour le fichier FMA uniquement) (Il s'agit d'objets au format date(AAAA-mm-jj)<->date(AAAA-mm-jj), la première étant la date de début et la dernière la date de fin. Différentes périodes sont concaténées par des barres verticales ( | )).
        •    Latitude (WGS 84)
        •    Longitude (WGS 84)
        •    Adresse postale
        •    Code postal et commune (postalcode + city; séparés par des dièse ( # )).
        •    Créateur de la donnée
        •    Réseau ou SIT source,
        •    Date de mise à jour (lastupdate)
        •    ID du POI (URI)

Depuis le 15/07/2019, trois nouveaux champs ont été créés avant ID du POI :
        •    Contacts du POI (Il s'agit d'objets (noms#telephones#emails#urls) concaténés par des barres verticales ( | ). Les champs noms, telephones, emails et urls sont respectivement des numéros de téléphone (format international), des adresses emails et des url qui sont concatnées par des diamants ( <> ). Chaque contact dans cette colonne garde ses # de manière obligatoire, ce qui permet de savoir en fonction du nombre de # déja comptés s'il s'agit d'un nom, d'un téléphone, d'un email ou d'une url.
        •    Classements du POI (Il s'agit d'objets (noms#notes) concaténés par des barres verticales ( | ).
        •    Description (champ libre multiligne). Pour certains POI, les tarifs sont indiqués dans la description.

Depuis le 16/06/2020, trois nouveaux champs ont été créés (après Code postal et commune) :
        •    Covid19 : mesures spécifiques (champ libre multiligne) : détail des mesures prises par l’établissement ou le site touristique pour accueillir le public durant la crise sanitaire
        •    Covid19 : est en activité (true/false) : information sur la confirmation de réouverture de l’établissement
        •    Covid19 : périodes d’ouverture confirmées (true/false) : true si les périodes d’ouverture ont été mises à jour à l’issue de la période de confinement du printemps 2020

Depuis le 26/11/2020, 13 nouveaux fichiers sont mis à disposition :
        •    Export quotidien simplifié des données au format CSV, découpé par région administrative : datatourisme.reg-CodeIsoRégional.date.csv,
        •    1 fichier par région administrative, rassemblant les POI de type FMA, PLACE, PRODUCT, TOUR,
        •    Liste des codes ISO : ARA (Auvergne Rhône Alpes), BFC (Bourgogne Franche Comté), BRE (Bretagne), COR (Corse), CVL (Centre Val de Loire), GDE (Grand Est), GLP (Guadeloupe), GUF (Guyane), HDF (Hauts de France), IDF (Ile de France), MTQ (Martinique), MYT (Mayote), NAQ (Nouvelle Aquitaine), NOR (Normandie), OCC (Occitanie), PAC (Provence Alpes Côte d’Azur), PDL (Pays de la Loire), REU (Ile de la Réunion).

De manière synthétique :
( | ) sépare les objets
( # ) sépare les propriétés pour chaque objet
( <> ) sépare plusieurs valeurs pour chaque propriété

Les fichiers csv sont encodés en UTF-8, le séparateur de colonne est la virgule et les valeurs non triviales sont encapsulées dans des guillemets doubles ( " ).


Pour accéder aux données et aux services de la plateforme (création de flux sur mesure et choix des formats) : https://www.datatourisme.gouv.fr

Pour en savoir plus et rejoindre la communauté : https://info.datatourisme.gouv.fr/

Découvrir l’ontologie DATAtourisme, le format national sémantique pour les données d’information touristique :
        https://framagit.org/datatourisme/ontology/tree/master

En savoir plus sur le format N-Triples : https://www.w3.org/TR/n-triples/

Initiation à RDF : https://www.emse.fr/~zimmermann/W3C/RDF1.1Primer/


Pour obtenir de l’aide dans le paramétrage et l’exploitation des données de la plateforme : https://support.datatourisme.gouv.fr/ (espace d’entre-aide accessible depuis votre compte Diffuseur)

Ressources

datatourisme.20210511.nt.zip

datatourisme.20210510.nt.zip

datatourisme.20210509.nt.zip

datatourisme.20210508.nt.zip

datatourisme.20210507.nt.zip

datatourisme.20210506.nt.zip

datatourisme.20210505.nt.zip

datatourisme.20210504.nt.zip

datatourisme.20210503.nt.zip

datatourisme.20210502.nt.zip

datatourisme.20210501.nt.zip

datatourisme.20210430.nt.zip

datatourisme.reg-myt.20210429.csv