Open Bilbio corpus for content analysis

Description

Description of the corpus

The corpus describes fulltexts publication in sciences (mathemtaics, computing, statistics) in LATEX or TXT format.
They are published in open access.

Purprose to use this corpus is twice :

  • information extraction (for instance: extract all collocations around a target word, or extract methods names)
  • comparison of abstract and body text

size of publication corpus : 650,000
size of publication sample : 20

data :

body string text data

Auteur

Ce jeu de données a été publié à l'initiative et sous la responsabilité de nicolas turenne
Publié le 1 décembre 2016 et mis à jour le 2 décembre 2016

Dernière mise à jour

12 octobre 2023

Licence

Creative Commons Attribution

Qualité des métadonnées
77.77777777777779/100

Couverture spatiale non renseignée

Certains fichiers ne sont pas disponibles

Il n'y a pas encore de réutilisation pour ce jeu de données.

Publiez une réutilisation Qu'est-ce qu'une réutilisation ?

Il n'y a pas encore de discussion pour ce jeu de données.

Il n'y a pas encore de ressources communautaires pour ce jeu de données.

Partagez vos ressources En savoir plus sur la communauté

Informations

Tags

ID

5840026288ee383a2cc65bb3

Temporalité

Création

1 décembre 2016

Fréquence

Semestrielle

Couverture temporelle

01/01/1994 à 01/07/2014

Dernière mise à jour

12 octobre 2023

Actions

Intégrer sur votre site

Visites

548

28 en avr. 2024

Téléchargements

37

1 en avr. 2024

Réutilisations de ce jeu de données

0

Favoris

0