DATAtourisme, la base nationale des données publiques d'information touristique en Open Data DATAtourisme

Description

[Dernière Modification de la description au 05/06/2024 - voir plus bas]

DATAtourisme est un dispositif national de collecte et de diffusion en open data des données institutionnelles relatives au recensement de l'offre touristique : description des points d'intérêt et événements touristiques géolocalisés et qualifiés.

Porté par l’Etat de 2015 à janvier 2022, et piloté par ADN Tourisme depuis le 1er février 2022, il est né d’une coopération inédite avec les réseaux des offices de tourisme, des agences départementales et des comités régionaux du tourisme de l’ensemble du territoire national.

Important : le périmètre du dispositif DATAtourisme porte sur le recensement de l'offre. Il ne comporte pas d'éléments statistiques tels que la fréquentation touristique, la capacité d'accueil, etc. L'offre recensée porte sur les éléments publiés volontairement par les territoires, sans garantie d'exhaustivité.

Directement connectée aux bases de données territoriales, la plateforme nationale DATAtourisme permet un accès plus large et simplifié aux données publiques d’information touristique, au moyen de :
        -    Une technologie capable d’agréger et mettre à jour quotidiennement plusieurs dizaines de jeux de données qualifiées,
        ˗    Une ontologie nationale permettant de retranscrire l’intégralité des données touristiques en un vocabulaire et un format uniformisé
        ˗    Plusieurs services et une API permettant d’exploiter finement des données répondant à des besoins personnalisés
        ˗    Une licence d’exploitation unique et ouverte (Licence ouverte 2.0)

Lauréat du Programme Investissements d’Avenir, ce dispositif participe à la boîte à outils gouvernementale pour décliner la stratégie touristique nationale telle que définie par le Comité Interministériel du Tourisme.


Jeux de données disponibles :
        •    export complet et quotidien des données présentes sur la plateforme DATAtourisme, au format NT
        •    export quotidien simplifié des données de type « événement » (FMA) au format CSV
        •    export quotidien simplifié des données de type « lieux » (PLACE) au format CSV
        •    export quotidien simplifié des données de type « visites et activités » (PRODUCT) au format CSV
        •    export quotidien simplifié des données de type « itinéraires » (TOUR) au format CSV

Les fichiers CSV simplifiés contiennent actuellement les champs de description suivants :
        •    Titre ou nom du POI (label)
        •    Catégories de POI (type) (Il s'agit des identifiants des types, séparés par des barres verticales ( | ). Pour obtenir le libellé en français, il faut se référer au thésaurus.)
        •    Périodes regroupées (pour le fichier FMA uniquement) (Il s'agit d'objets au format date(AAAA-mm-jj)<->date(AAAA-mm-jj), la première étant la date de début et la dernière la date de fin. Différentes périodes sont concaténées par des barres verticales ( | )).
        •    Latitude (WGS 84)
        •    Longitude (WGS 84)
        •    Adresse postale
        •    Code postal et commune (postalcode + city; séparés par des dièse ( # )).
        •    Créateur de la donnée
        •    Réseau ou SIT source,
        •    Date de mise à jour (lastupdate)
        •    Contacts du POI (Il s'agit d'objets (noms#urls) concaténés par des barres verticales ( | ). Les champs noms et urls sont respectivement des noms et des url qui sont concaténées par des diamants ( <> ). Chaque contact dans cette colonne garde ses # de manière obligatoire, ce qui permet de savoir en fonction du nombre de # déja comptés s'il s'agit d'un nom ou d'une url.
        •    Classements du POI (Il s'agit d'objets (noms#notes) concaténés par des barres verticales ( | ).
        •    Description (champ libre multiligne). Pour certains POI, les tarifs sont indiqués dans la description.
        •    Covid19 : mesures spécifiques (champ libre multiligne) : détail des mesures sanitaires prises par l’établissement ou le site touristique pour accueillir le public (attention, la mise à jour de ces information est moins fréquente depuis 2022).
        •    ID du POI (URI)


EVOLUTIONS APPORTEES A LA PAGE ET AUX FICHIERS :

Le 05/06/2024 : suppression de l'historique des fichiers
        •     Veuillez noter que d'ici quelques jours, l'historique des fichiers antérieurs à la date du jour sera supprimé. Les données continueront à être mises à jour quotidiennement via des fichiers qui "annuleront et remplaceront" systématiquement ceux de la veille. Cela aura l'avantage de faciliter l'accès aux données pour les réutilisateurs puisque le nom des fichiers sera stable (sans mention de date), et d'améliorer le temps de chargement de la page.

Le 15/07/2019, trois nouveaux champs ont été créés avant ID du POI :
        •    Contacts du POI (Il s'agit d'objets (noms#telephones#emails#urls) concaténés par des barres verticales ( | ). Les champs noms, telephones, emails et urls sont respectivement des numéros de téléphone (format international), des adresses emails et des url qui sont concaténées par des diamants ( <> ). Chaque contact dans cette colonne garde ses # de manière obligatoire, ce qui permet de savoir en fonction du nombre de # déja comptés s'il s'agit d'un nom, d'un téléphone, d'un email ou d'une url.
        •    Classements du POI (Il s'agit d'objets (noms#notes) concaténés par des barres verticales ( | ).
        •    Description (champ libre multiligne). Pour certains POI, les tarifs sont indiqués dans la description.

Le 16/06/2020, trois nouveaux champs ont été créés (après Code postal et commune) :
        •    Covid19 : mesures spécifiques (champ libre multiligne) : détail des mesures prises par l’établissement ou le site touristique pour accueillir le public durant la crise sanitaire
        •    Covid19 : est en activité (true/false) : information sur la confirmation de réouverture de l’établissement
        •    Covid19 : périodes d’ouverture confirmées (true/false) : true si les périodes d’ouverture ont été mises à jour à l’issue de la période de confinement du printemps 2020

Le 26/11/2020, 13 nouveaux fichiers ont été mis à disposition :
        •    Export quotidien simplifié des données au format CSV, découpé par région administrative : datatourisme.reg-CodeIsoRégional.date.csv,
        •    1 fichier par région administrative, rassemblant les POI de type FMA, PLACE, PRODUCT, TOUR,
        •    Liste des codes ISO : ARA (Auvergne Rhône Alpes), BFC (Bourgogne Franche Comté), BRE (Bretagne), COR (Corse), CVL (Centre Val de Loire), GDE (Grand Est), GLP (Guadeloupe), GUF (Guyane), HDF (Hauts de France), IDF (Ile de France), MTQ (Martinique), MYT (Mayote), NAQ (Nouvelle Aquitaine), NOR (Normandie), OCC (Occitanie), PAC (Provence Alpes Côte d’Azur), PDL (Pays de la Loire), REU (Ile de la Réunion).

Le 24/01/2022, le nom généré des fichiers a été mis à jour
        •    Tous les fichiers csv passent d'un format type.permietre.date.csv à un format type-perimetre-date.csv, dans le but d'obtenir un typage natif par la plateforme data.gouv.fr consistant ("csv") avec le type mime des fichiers.

Le 14/12/2023, le contenu des fichiers CSV simplifiés a été mis à jour
        •    Seules les URL sont disponibles pour le champs contact, les adresses email et numéros de téléphone ont été retirés.
        •    Les champs Covid19_est_en_activite et Covid19_periodes_d_ouvertures_confirmees ont été également retirés.

De manière synthétique :
( | ) sépare les objets
( # ) sépare les propriétés pour chaque objet
( <> ) sépare plusieurs valeurs pour chaque propriété

Les fichiers csv sont encodés en UTF-8, le séparateur de colonne est la virgule et les valeurs non triviales sont encapsulées dans des guillemets doubles ( " ).


Pour accéder aux données et aux services de la plateforme (création de flux sur mesure et choix des formats) : https://www.datatourisme.fr

Pour en savoir plus et rejoindre la communauté : https://info.datatourisme.fr/

Documentation et autres outils utiles : https://gitlab.adullact.net/adntourisme/datatourisme

Découvrir l’ontologie DATAtourisme, le format national sémantique pour les données d’information touristique :
        https://gitlab.adullact.net/adntourisme/datatourisme

En savoir plus sur le format N-Triples : https://www.w3.org/TR/n-triples/

Initiation à RDF : https://www.emse.fr/~zimmermann/W3C/RDF1.1Primer/


Pour obtenir de l’aide dans le paramétrage et l’exploitation des données de la plateforme : https://support.datatourisme.fr/ (espace d’entre-aide accessible depuis votre compte Diffuseur)

Producteur
Dernière mise à jour
10 juillet 2025

Vues

0

Téléchargements

0

Qualité des métadonnées:
Bon(100 %)

24 discussions

ID RNB

Posté le 14 mars 2025
Bonjour, Serait-il possible d'ajouter l'id RNB dans les exports simplifiés? Merci :)
Posté le 19 mars 2025
Bonjour et merci pour votre message. Nous venons tout juste d’intégrer 220 000 ID RNB et sommes actuellement en train de finaliser les vérifications associées. Pour le moment, nous souhaitons conserver les exports simplifiés dans leur format actuel afin de garantir leur clarté et leur facilité d’utilisation. Mais vous pouvez dès à présent retrouver ces ID en fonction de vos recherches sur la plateforme diffuseur de DATAtourisme : https://diffuseur.datatourisme.fr N’hésitez pas à nous solliciter si besoin. Bonne journée, Ch.

Equivalent de datatourisme dans d'autres pays d'Europe?

Posté le 11 février 2025
Un reuse de datatourisme a été présenté au FOSDEM, un salon européen de l'open source (https://fosdem.org/2025/about/). Une personne qui assistait en remote souhaite savoir si des initiatives similaires existent aux Pays-Bas et en Belgique par exemple: https://framacolibri.org/t/keskonfai-open-data-info/24690. DATATourisme est vraiment une initiative extraordinaire qui mérite d'être mise en valeur :)
Posté le 12 février 2025
Bonjour Alexandra, Merci pour votre message et pour l'information :-) Il y a effectivement une initiative similaire aux Pays-Bas qui est en cours de développement. Le projet est lancé depuis le début de l'année. La solution s'appelle Touripedia : https://www.linkedin.com/company/touripedia/?originalSubdomain=nl. Je vais répondre sur le framacolibri.

Contacts_du_POI

Posté le 18 décembre 2024
Bonjour, Les courriels et téléphones des "Contacts_du_POI" ont été retirés des fichiers "datatourisme-place.csv". Pensez-vous pouvoir les rétablir ? Merci par avance de votre aide CV
Posté le 18 décembre 2024
Bonjour, Les courriels et téléphones ont effectivement été retirés pour ne pas encourager le spamming. Je vous remercie pour votre compréhension. Bien à vous, Ch.

Arret des publications?

Posté le 24 mai 2024
Bonjour, il n'y a plus de mises à jour des fichiers? les derniers datent du 30 avril
Posté le 27 mai 2024
Bonjour, merci pour votre signalement : il y a en effet un dysfonctionnement, nos équipes techniques sont en train de travailler au rétablissement des flux quotidiens. Bonne journée !
Posté le 5 juin 2024
Bonjour, je vous confirme que le dysfonctionnement est en cours de résolution. Veuillez noter que d'ici quelques jours nous allons modifier les modalités d'accès aux fichiers afin de ne conserver que les fichiers du jour (suppression de l'historique de tous les fichiers antérieurs, qui sont à l'origine du dysfonctionnement de par leur encombrement). Cela nous permettra de remettre en place une MAJ quotidienne des données. Merci pour votre patience et compréhension.
Posté le 13 juin 2024
Bonjour, nous vous informons que les données sont à nouveau disponibles ! Merci pour votre patience, bonne journée.
Posté le 4 juillet 2024
Merci Eliane pour le signalement et à l'équipe DataTourisme pour le correctif. Je m'en suis également aperçu le 30 avril mais j'attendais un correctif éventuel dans la semaine, pas au bout d'un mois et demi. Au fil des jours, j'ai pensé du coup que le flux était tout simplement abandonné. Pascale, ne pouvez-vous pas mettre en place une supervision afin que ce ne soit pas les utilisateurs qui vous alertent ? De plus, pourquoi ne pas enlever les événements obsolètes des exports ? A moins que vous ne voyiez un intérêt à proposer des événements s'étant passés il y a un an, cela alourdit vos fichiers et nos traitements. Merci à vous.
Posté le 5 juillet 2024
Bonjour Eric de Data gouv, Nous aurions aimé nous aussi faire preuve de plus de réactivité ... malheureusement l'origine du problème n'était pas de notre fait : Data gouv a décidé de bloquer notre compte du fait qu'il y avait trop de ressources (suite à la conservation de l'historique des fichiers), mais ne nous a pas avertis ... Bien entendu nous aurions réagi aussitôt si nous avions été notifiés ou alertés. De notre côté les mises à jour partaient normalement et aucun dysfonctionnement n'était constaté. S'agissant des événements obsolètes, notre plateforme les conserve afin d'alimenter certains projets d'observation et de statistiques, il nous semble donc pertinent de les laisser disponibles. Cdt Pascale
Posté le 5 juillet 2024
Bonjour, Je constate aujourd'hui que l'historique a été supprimé de la plateforme il y a à peine un mois... Serait-il possible de le trouver ailleurs ou d'y accéder d'une autre façon ? Merci de votre compréhension
Posté le 5 juillet 2024
Bonjour @Maxime Coulmeau, Comme expliqué plus haut, nous avons été contraints de supprimer l'historique des fichiers car leur maintien n'était pas conforme au mode de fonctionnement de Data Gouv et notre compte était saturé / bloqué. Désormais, comme expliqué dans le texte de présentation, les données sont actualisées quotidiennement avec des fichiers qui annulent et remplacent ceux de la veille. Il n'est plus possible d'accéder aux anciennes versions des fichiers. Bonne journée
Posté le 5 juillet 2024
Me concernant, l'annulation-remplacement, c'est parfait !
Posté le 8 juillet 2024
Bonjour Maxime, Nous avons toutefois conservé une archive mensuelle au format turtle .nt pour de potentiels futurs besoins d'analyse. Bonne journée

plus de maj depuis le 23/05/2022

Posté le 27 mai 2022
Discussion close par Pascale Vinot le 29 mai 2022

Ontology, classes manquantes

Posté le 16 mai 2022
Bonjour, Concernant les spécifications de l’ontology, on trouve comme classe « Artisan d’art », mais pas « Artiste », qui ont pourtant deux définitions tout à fait différentes. Serait-il possible de rajouter le terme Artiste (avec si possible des sous-classes plus descriptives, comme Artiste peintre, Artiste sculpteur, etc.) ? Merci.
Posté le 16 mai 2022
Merci pour cette suggestion, nous l'étudierons prochainement avec notre comité technique afin de voir si un tel ajout est possible.

Modifications données incorrectes

Posté le 16 mai 2022
Bonjour, Comment modifier une donnée personnelle erronée dans la base datatourisme ? J’ai quelques données incorrectes sur la fiche de ma compagne, de type URL site web, description et sa traduction automatique, adresse, classification, licence des médias… Faut-il se tourner vers le diffuseur ? Merci d’avance.
Posté le 16 mai 2022
Bonjour, ce sont les créateurs de données qui sont en mesure d'apporter les corrections : vous pouvez prendre contact avec la structure indiquée dans le champ "HasBeenCreatedBy" et leur demander de modifier leur base de données locale. Si vous avez besoin d'aide pour identifier cet interlocuteur, contactez nous par mail à l'adresse contact@datatourisme.fr en nous transmettant le lien vers la fiche concernée. Bonne journée !

Migration totale des domaines *.datatourisme.gouv.fr vers *.datatourisme.fr

Posté le 26 avril 2022
Nous vous informons que la plateforme DATAtourisme et ses composants sont sur le point de changer de nom de domaine en passant de *.datatourisme.gouv.fr vers *.datatourisme.fr Cette migration est en cours de réalisation et sera totalement effective aux alentours du 24 mai. Afin de ne pas perturber vos flux, une redirection 301 de l’ensemble des anciens domaines est prévue, ne nécessitant pas d’intervention immédiate ou urgente de votre part. Cependant, cette redirection étant provisoire (jusqu’à fin 2022), il sera nécessaire que vous procédiez aux modifications de vos paramétrages dans les prochaines semaines ou mois. Les nouvelles URL de téléchargement des flux en *datatourisme.fr sont d’ores et déjà fonctionnelles : n’hésitez pas à procéder aux modifications dès à présent pour ne pas risquer de coupure de service. Pour cela il vous suffira de remplacer *.datatourisme.gouv.fr par *.datatourisme.fr dans toutes les URL que vous exploitez. En particulier les Url de téléchargement des flux "https://diffuseur.datatourisme.gouv.fr/webservice/{token}/{app_key}" par "https://diffuseur.datatourisme.fr/webservice/{token}/{app_key}", car beaucoup de librairies telles que cURL ne suivent pas les redirections par défaut. Veuillez noter aussi que tous les identifiants de l’ontologie DATAtourisme vont également passer de *.datatourisme.gouv.fr à *.datatourisme.fr : A partir du 25 mai 2022, les identifiants (URI) de tous les objets que vous exploitez et manipulez dans vos applications verront leurs identifiants modifiés . Nous vous invitons à mettre en place un dispositif anti-doublon afin d’éviter la cohabitation de POI identiques dont seul l’identifiant aura changé. Pour chaque identifiant, seule la partie .gouv est modifiée, le reste est préservé. Veuillez noter enfin qu’une coupure totale des services est à prévoir les 23 et 24 mai 2022 afin de finaliser la migration. Vous n’aurez pas accès la plateforme durant cette période et vos flux ne seront pas actualisés. Aucune intervention de votre part n’est attendue sur la plateforme, le service sera rétabli dès que l’intervention de nos équipes techniques sera terminée. Nous vous invitons à rester attentifs aux annonces que nous publierons sur le support en ligne https://support.datatourisme.gouv.fr/ afin de suivre l'évolution de cette intervention. Ces évolutions font suite à la mise en place des nouvelles instances de pilotage du dispositif DATAtourisme au 1er février dernier. Merci pour votre attention, nous restons attentifs à vos questions. L’équipe DATAtourisme
Posté le 3 mai 2022
En complément, veuillez noter que les redirections 301 seront mises en place ce vendredi 6 mai 2022 dans la journée. Comme mentionné ci-dessous, nous attirons particulièrement votre attention sur le fait que beaucoup de librairies telles que cURL ne suivent pas les redirections par défaut : il est donc indispensable que vous puissiez vous surveiller le comportement de vos flux une fois la redirection en place, et que vous puissiez remplacer au plus tôt vos Url de téléchargement des flux "https://diffuseur.datatourisme.gouv.fr/webservice/{token}/{app_key}" par "https://diffuseur.datatourisme.fr/webservice/{token}/{app_key}" afin d'éviter tout dysfonctionnement.

Ajout de champs à l'export CSV

Posté le 18 mars 2022
Discussion close par Pascale Vinot le 26 avril 2022

difference entre 2 FMA du même jour

Posté le 24 janvier 2022
Discussion close par Pascale Vinot le 21 février 2022

url stable du fichier FMA du jour

Posté le 24 janvier 2022
Discussion close par Pascale Vinot le 21 février 2022

Fixing unknown distribution formats

Posté le 20 janvier 2022
Discussion close par Pascale Vinot le 21 février 2022

comment distinguer les poi dans le fichier par région administrative ?

Posté le 24 décembre 2021
Discussion close par Pascale Vinot le 21 février 2022

heure de mis à jour des fichiers

Posté le 1 décembre 2021
Discussion close par Pascale Vinot le 21 février 2022

Page trop lourde à charger, quelque soit le navigateur

Posté le 7 avril 2021
Discussion close par Pascale Vinot le 21 février 2022

Problème de compréhension donnée Covid19 : périodes d’ouverture confirmées (true/false)

Posté le 12 décembre 2020
Discussion close par Pascale Vinot le 21 février 2022

Automatisation de l'accès aux fichiers CSV

Posté le 11 juin 2020
Discussion close par Pascale Vinot le 21 février 2022

Mise à jour ontologie

Posté le 23 avril 2020
Discussion close par Pascale Vinot le 21 février 2022

Séparateurs colonnes des fichiers CSV en ",," au lieu de ","

Posté le 6 janvier 2020
Discussion close par Pascale Vinot le 21 février 2022

CSV inexploitable

Posté le 20 juin 2019
Discussion close par Direction Générale des Entreprises le 25 juin 2019