Open Bilbio corpus for content analysis

Description

Description of the corpus

The corpus describes fulltexts publication in sciences (mathemtaics, computing, statistics) in LATEX or TXT format.
They are published in open access.

Purprose to use this corpus is twice :

  • information extraction (for instance: extract all collocations around a target word, or extract methods names)
  • comparison of abstract and body text

size of publication corpus : 650,000
size of publication sample : 20

data :

body string text data

Producteur
DELETED DELETED
Ce jeu de données a été publié à l'initiative et sous la responsabilité de DELETED DELETED.
Dernière mise à jour
12 octobre 2023

Vues

0

Téléchargements

0

Qualité des métadonnées:
Bon(67 %)
  • Fréquence de mise à jour non respectée

  • Couverture spatiale non renseignée

  • Certains fichiers ne sont pas disponibles