République
Française

  • Se connecter
  • S'enregistrer
  • Données
  • Réutilisations
  • Organisations
    • Qu'est-ce que data.gouv.fr ?
    • Comment publier des données ?
    • Comment exploiter des données ?
  • Actualités
  • Nous contacter
  1. Accueil
  2. Réutilisations
  3. Modèle de Questions-Réponses Francophone

Modèle de Questions-Réponses Francophone

Publié le 3 août 2020

Voir la réutilisation

Etalab

Etalab est un département de la direction interministérielle du numérique (DINUM), dont les missions et l’organisation sont fixées par le décret du 30 Octobre 2019. Il coordonne notamment la conception et la mise en œuvre de la stratégie de l’État dans le domaine de la donnée. Ouverture (open…

64 jeux de données
37 réutilisations
  • francophone
  • modele
  • nlp
  • question-answering

Informations

Type
Application
Thématique
Outils open data
ID
5f2811240099d52bbc13217f

Publication

Date de création
3 août 2020

Participez

Ajouter une réutilisation Contacter le réutilisateur

Intégrer sur votre site

URL stable

Sommaire
  1. Description
  2. Jeux de données utilisés 1
  3. Discussions 0
  4. Plus de réutilisations

Description

Modèle etalab-ia/camembert-base-squadFR-fquad-piaf

Lien du modèle sur Hugging Face Hub

Intro

Modèle francophone de questions-réponses, utilisant comme base CamemBERT fine-tuné sur la combinaison de trois jeux de données francophones de questions-réponses:

  1. PIAFv1.1
  2. FQuADv1.0
  3. SQuAD-FR (SQuAD traduit automatiquement au Français)

Utilisation

from transformers import pipeline

nlp = pipeline('question-answering', model='etalab-ia/camembert-base-squadFR-fquad-piaf', tokenizer='etalab-ia/camembert-base-squadFR-fquad-piaf')

nlp({
    'question': "Qui est Claude Monet?",
    'context': "Claude Monet, né le 14 novembre 1840 à Paris et mort le 5 décembre 1926 à Giverny, est un peintre français et l’un des fondateurs de l'impressionnisme."
})

Citation

PIAF

@inproceedings{KeraronLBAMSSS20,
  author    = {Rachel Keraron and
               Guillaume Lancrenon and
               Mathilde Bras and
               Fr{\'{e}}d{\'{e}}ric Allary and
               Gilles Moyse and
               Thomas Scialom and
               Edmundo{-}Pavel Soriano{-}Morales and
               Jacopo Staiano},
  title     = {Project {PIAF:} Building a Native French Question-Answering Dataset},
  booktitle = {{LREC}},
  pages     = {5481--5490},
  publisher = {European Language Resources Association},
  year      = {2020}
}

FQuAD

@article{dHoffschmidt2020FQuADFQ,
  title={FQuAD: French Question Answering Dataset},
  author={Martin d'Hoffschmidt and Maxime Vidal and Wacim Belblidia and Tom Brendl'e and Quentin Heinrich},
  journal={ArXiv},
  year={2020},
  volume={abs/2002.06071}
}

SQuAD-FR

 @MISC{kabbadj2018,
   author =       "Kabbadj, Ali",
   title =        "Something new in French Text Mining and Information Extraction (Universal Chatbot): Largest Q&A French training dataset (110 000+) ",
   editor =       "linkedin.com",
   month =        "November",
   year =         "2018",
   url =          "\url{https://www.linkedin.com/pulse/something-new-french-text-mining-information-chatbot-largest-kabbadj/}",
   note =         "[Online; posted 11-November-2018]",
 }

Jeux de données utilisés 1

  • Etalab

    PIAF - Le dataset francophone de Questions-Réponses (PIAF - Q&A) PIAF - Q&A

    Par Etalab

    PIAF, construire un jeu de données francophones ouvert pour l’IA Le recours à l’intelligence artificielle au sein de l’action publique est souvent identifié comme une opportunité pour interroger des textes documentaires et réaliser des outils de questions/réponses (QR) automatiques à destination…

    Qualité des métadonnées : 0.8888888888888888/1
    Qualité des métadonnées :
    Description des données renseignée
    Ressources documentées
    Licence renseignée
    Fréquence de mise à jour respectée
    Formats de fichiers standards
    Couverture temporelle renseignée
    Couverture spatiale non renseignée
    En savoir plus sur cet indicateur
    — Mis à jour le 6 octobre 2022
    • 1 réutilisation
    • 3 favoris

Discussion entre l'organisation et la communauté à propos de cette réutilisation.

Plus de réutilisations

Découvrez davantage de réutilisations.

  • Altimètre de la France

    Application

    Publié le 28 janvier 2023 par DonnéesPubliques.org

  • La France des logements sociaux

    Visualisation

    Publié le 28 janvier 2023 par Charles-Henri ARNOULD

  • Un hiver sous haute tension pour les industries…

    Article de presse

    Publié le 26 janvier 2023 par Samuel Goeta

  • fonds-publics.fr

    Application

    Publié le 23 janvier 2023 par Joachim Brindeau

Participez

  • Créez ou trouvez votre organisation
  • Consultez la documentation
Publiez un jeu de données
Publiez une réutilisation

L'Open Data

  • Thématiques à la une
  • Données de référence
  • Portail des données européennes
  • Catalogue des données
  • Nouveautés

Support

  • Documentation de la plateforme
  • API du portail
  • Guides de l’Open Data
  • Nous contacter

Réseaux sociaux

  • Created by potrace 1.15, written by Peter Selinger 2001-2017
  • RSS
  • Infolettre
  • Un département de la DINUM
  • numerique.gouv.fr
  • Moteur open source : udata (6.0.1)
  • Extension du thème udata : udata-front (3.1.1)

république
française

  • Gouvernement.fr
  • France.fr
  • Legifrance.gouv.fr
  • Service-public.fr
  • Opendata France
  • CADA.fr
  • Etalab.gouv.fr
  • Licences
  • Conditions générales d'utilisation
  • Politique de confidentialité
  • Accessibilité : partiellement conforme

Sauf indication contraire, tout le contenu de ce site est disponible sous Licence Ouverte 2.0