Archive en agro-écologie de BSV (Bulletins de Santé du Végétal)

Ce jeu de données a été publié à l'initiative et sous la responsabilité de nicolas turenne
Publié le 30 novembre 2016 et mis à jour le 1 décembre 2016

nicolas turenne

Informations

Licence
Creative Commons Attribution
Couverture temporelle
1946/01 to 2016/11
Fréquence
Semestrielle
Date de création
30 novembre 2016
Date de mise à jour
1 décembre 2016
Dernière mise à jour de ressource
1 décembre 2016
Granularité de la couverture territoriale
Région française
Couverture territoriale
France

Extras

ID
583eac9ac751df6321c0bb7e
Date de création
30 novembre 2016
Date de mise à jour
1 décembre 2016

The corpus describes damage of insects and diseases on crops (wheat, wine...).
corpus contains 41,000 documents. 17,000 were published from 1960 till 2000 of medium quality about text recognition.
Each file contains level of risk about crop from a region of France. Texts are in French

size of document corpus : 40,899
size of document sample : 37 (from different region of France, with different crops)

size of the corpus (txt format) in octets: 457 Mb
size of the corpus (pdf format) in octets: 37 Gb

metadata for each file:

_id: name of the file
region: name of a French region (example: Alsace)
crops: list of crop names (example: wheat)
diseases: list of diseases names (example: oidium)
insects: list of insects names (for example: puceron noir)
risk: patterns of risk (example : "12% of fields")
town: list of cities (example: Dijon)
date: date of publication of the document
pesticides: list of pesticides (exmple: d.d.t.)

The database contains :
cited areas: 27
cited insects: 389
cited diseases: 279
cited pesticids: 727
cited crops: 122

Ressources 3

Voir aussi : ressources communautaires
8 téléchargements

Ecology Crop Disease Newsletter Corpus - PDF format

Disponible
zip (29.8Go)

Description of the corpus

The corpus describes damage of insects and diseases on crops (wheat, wine...).
corpus contains 41,000 documents. 17,000 were published from 1960 till 2000 of medium quality about text recognition.
Each file contains level of risk about crop from a region of France. Texts are in French

size of document corpus : 40,899
size of document sample : 37 (from different region of France, with different crops)

size of the corpus (pdf format) in octets: 37 Gb

Type
Fichier principal
Type MIME
cc
Créée le
1 décembre 2016
Modifiée le
1 décembre 2016
Publiée le
1 décembre 2016
1 téléchargements

EcologySample.rar

Disponible
rar (14.2Mo)

File contains 37 documents (txt and pdf format for each one)
and one file of extracted entities for each file

Type
Fichier principal
Type MIME
application/rar
sha1
e58702f1f8c03cda07bfc4ec10d1de8043920540
Créée le
30 novembre 2016
Modifiée le
30 novembre 2016
Publiée le
30 novembre 2016

Embed

Vous pouvez facilement intégrer ce jeu de données sur votre site en collant cet extrait de code dans votre page html.

Ressources communautaires 0

Vous avez construit une base de données plus complète que celles présentées ici ? C'est le moment de la partager !

Réutilisations 0

Vous avez réutilisé ces données et publié un article, une infographie, ou une application ? C'est le moment de vous faire connaître ! Référencez votre travail en quelques clics et augmentez votre visibilité.

Discussions 0

Discussion entre l'organisation et la communauté à propos de ce jeu de données.