Agrégation : Corpus FAB-LANG sur la Base de français médiéval

Par Louis-Patrick Bergot, le 11 octobre 2023

Les laboratoires IHRIM et CIHAM viennent de publier le corpus FAB-LANG sur le portail de la Base de français médiéval (http://txm.bfm-corpus.org).

Ce corpus est composé des trois fabliaux au programme de l'épreuve de langue médiévale de l'agrégation externe de lettres modernes 2024 :

IV. De Haimet et de Barat

VI. Du bouchier d'Abevile

XIII. Du segretain moine

dans la version établie par Jean Doufournet (Paris, Flammarion, 2014).

Vous pouvez librement lire les textes en ligne, télécharger le lexique complet des formes avec leurs fréquences (tableau Excel) et télécharger une concordance de tous les mots du corpus (tableau Excel).

Les utilisateurs inscrits à la BFM peuvent en plus utiliser le moteur de recherche de la BFM (création de lexiques et index dynamiques, concordances, retour au texte, etc.).

Seul le corps du texte de l'édition, libre de droits, est accessible. Les données mises à disposition par la BFM (transcriptions, lexiques, concordances, etc.) sont réutilisables sous licence ouverte Etalab.

Les textes sont équipés d'étiquettes morpho-syntaxiques Cattex et lemmatisés. Il s'agit d'un procédé automatique, sans vérification, à utiliser avec prudence.

Un corpus de l'ensemble des fabliaux au programme de littérature française (transcription originale, avec traduction et commentaires par C. Pierreville, en collaboration avec Baptiste Laïd, Céline Guillot-Barbance, Alexei Lavrentiev et Ariane Pinche), est en cours de préparation.

Mots clés : aucun
Classé dans : Annonces