Baromètre de la science ouverte (général)

Description

Ce jeu de données recense les données de publications sous-jacentes au baromètre français de la Science Ouverte.

Le site https://barometredelascienceouverte.esr.gouv.fr offre une vision globale des résultats du baromètre de la science ouverte.

Ce jeu de données liste les publications scientifiques avec une affiliation française et ayant soit un DOI soit un identifiant HAL. Pour chacune, le jeu de données fournit ses méta-données, les informations quant au statut Open Access (par le service Unpaywall), ainsi que son champ disciplinaire.

Les détails de la méthode sont exposés sur https://barometredelascienceouverte.esr.gouv.fr/a-propos/methodologie

Les données sont disponibles au format CSV :
https://storage.gra.cloud.ovh.net/v1/AUTH_32c5d10cb0fe4519b957064a111717e3/bso_dump/bso-publications-latest.csv.gz
et au format jsonl (json lines) :
https://storage.gra.cloud.ovh.net/v1/AUTH_32c5d10cb0fe4519b957064a111717e3/bso_dump/bso-publications-latest.jsonl.gz

Les données sont aussi disponibles par année, par exemple pour les publications parues en 2024:

https://storage.gra.cloud.ovh.net/v1/AUTH_32c5d10cb0fe4519b957064a111717e3/bso_dump/bso-publications-latest_split_2024_enriched.csv.gz

et

https://storage.gra.cloud.ovh.net/v1/AUTH_32c5d10cb0fe4519b957064a111717e3/bso_dump/bso-publications-latest_split_2024_enriched.jsonl.gz

Le fichier jsonl contient les informations d'open access pour différentes dates d'observation, le fichier csv ne contient que les informations les plus récentes.

- id: identifiant attribué par le baromètre à la publication

- doi: DOI de la publication

- pmid: identifiant PubMed de la publication

- hal_id: identifiant HAL de la publication

- year: année de publication

- title: titre de la publication

- journal_issns: ISSN de la revue (potentiellement plusieurs)

- journal_issn_l: ISSN de liaison de la revue

- journal_name: nom de la revue

- publisher: éditeur (forme brute)

- publisher_dissemination: éditeur (après normalisation)

- lang: langue de la publication

- genre: type de publication

- bso_country: pays d'affiliation - seul le bso_country fr est à prendre à compte pour les résultats du baromètre français

- amount_apc_EUR: montant des APC (estimés) en euros

- apc_source: méthode d'estimation des APC

domains

- detected_countries: pays d'affiliation détectés

- bso_local_affiliations: liste des identifiants des baromètre locaux associés

- funding_anr: identifiants des projets ANR

- funding_europe: identifiants des projets européens

- bso_classification: classification thématique (en 10 macro disciplines)

- bsso_classification: classification thématique en santé

- observation_date: date d'observation du statut open access

- is_oa: en open access ? (à la date d'observation)

- oa_host_type: type d'accès ouvert

- journal_is_in_doaj: revue dans le DOAJ ?

- journal_is_oa: revue entièrement OA ?

- unpaywall_oa_status: status dans Unpaywall (closed / gold / hybrid / bronze / green)

- oa_colors: couleurs OA du baromètre (closed / gold APC / diamond / hybrid / green) potentiellement plusieurs

- licence_publisher : licence de la version OA chez l'éditeur

- licence_repositories : licence de la version OA sur archive ouverte

- repositories : liste des archives ouvertes hébergeant la publication en OA

- software_mentions : software mentionnés dans le texte intégral

- data_mentions : données mentionnées dans le texte intégral

- software_used : software mentionnés dans le texte intégral comme ayant été utilisés

- software_created : software mentionnés dans le texte intégral comment ayant été créés

- software_shared : software mentionnés dans le texte intégral comment ayant été partagés

- data_used : données mentionnées dans le texte intégral comme ayant été utilisées

- data_created : données mentionnées dans le texte intégral comme ayant été produites

- data_shared : données mentionnées dans le texte intégral comme ayant été partagées

- has_doi_in_hal : booléen qui vaut 1 si HAL expose un DOI pour cette publication, 0 sinon

- missing_doi_in_hal : booléen qui vaut 1 si le DOI de la publication n'est pas présent dans HAL, 0 ou vide sinon

Plan de Gestion de données (PGD):

Aricia Bassinet, Laetitia Bracco, Eric Jeangirard, Anne L'Hôte, Patrice Lopez, et al.. Plan de gestion de données du projet "Baromètre Science Ouverte Données et codes". Ministère de l'Enseignement Supérieur et de la Recherche; Université de Lorraine; Inria. 2022. hal: hal-05391570

Attributions
(Créateur)
Ministère de l'Enseignement supérieur, de la Recherche et de l'Innovation(Éditeur)
Dernière mise à jour
25 février 2026

Vues

0

Téléchargements

0

  • Couverture temporelle non renseignée

  • Couverture spatiale non renseignée

Ce jeu de données provient d'un portail externe. Voir la source originale.
2 fichiers principaux

Mis à jour le 25 février 2026 csv 1K

Mis à jour le 25 février 2026 json 883