Corpus BFM2019 de la Base de français médiéval

Par Louis-Patrick Bergot, le 26 juin 2019

Le corpus BFM2019 de la Base de français médiéval vient d'être publié. Pour le consulter, cliquez sur ce lien.

Le graphisme du portail BFM-TXM a été entièrement repensé et embelli pour cette nouvelle édition.

Les conditions d’utilisation ont été simplifiées, et tous les textes sont diffusés sous licence ouverte Etalab.

Le corpus BFM2019 comprend une quinzaine de nouveaux textes et atteint environ 4 700 000 mots. Tous les textes sont encodés selon les recommandations du consortium TEI, balisés pour le discours direct, automatiquement annotés en morphosyntaxe et lemmatisés. L’étiquetage morphosyntaxique a été vérifié pour 4 nouveaux textes (38 textes vérifiés, soit près de 1 000 000 mots) et la lemmatisation pour 18 textes (environ 400 000 mots).

Le corpus s’enrichit aussi de trois nouvelles éditions originales :

- La Vie de saint Alexis, par T. Rainsford et C. Marchello-Nizia

- L’image du monde de Gossouin, version en prose, par N. Kanaoka

- Les quinze joies de mariage, par N. Kanaoka sur la base de l'édition imprimée établie par M. Guéret-Laferté, S. Louis et C. Mira, Rouen, Presses universitaires de Rouen et du Havre, 2009.

Pour signaler tout problème technique ou toute erreur dans un texte du corpus, n'hésitez pas à écrire à l'adresse suivante : bfm@ens-lyon.fr

Mots clés : aucun
Classé dans : Publications