Outils numériques et traitement automatique du breton
Langue
fr
Chapitre d'ouvrage
Ce document a été publié dans
Langues régionales de France: nouvelles approches, nouvelles méthodologies, revitalisation, Langues régionales de France: nouvelles approches, nouvelles méthodologies, revitalisation. 2023p. 37-74
Société Linguistique de Paris
Résumé
Dans cet article, la linguiste formelle Mélanie Jouitteau et le développeur web Reun Bideault présentent une synthèse des outils numériques et TAL disponibles ou en développement pour le breton. Ils discutent des ressources ...Lire la suite >
Dans cet article, la linguiste formelle Mélanie Jouitteau et le développeur web Reun Bideault présentent une synthèse des outils numériques et TAL disponibles ou en développement pour le breton. Ils discutent des ressources pour son développement. La PNL du breton est encore objectivement peu développée, mais quelques nouveaux outils viennent d'être mis à disposition, ce qui ouvre un vrai potentiel de développement. Nous présentons un état de l'art du domaine, et nous détaillons comment la première arborescence Dépendances Universelles, créée par Tyers & Ravishankar (2018) a pu être renforcée par 25000 phrases glosées supplémentaires dans la banque de données du wikigrammaire ARBRES (Jouitteau (2009-).< Réduire
Résumé en anglais
In this article, formal linguist Mélanie Jouitteau and web developer Reun Bideault present a synthesis of the numeric and NLP tools available or in development for Breton. They discuss the resources for its development. ...Lire la suite >
In this article, formal linguist Mélanie Jouitteau and web developer Reun Bideault present a synthesis of the numeric and NLP tools available or in development for Breton. They discuss the resources for its development. NLP of Breton is still objectively poorly developed, but some new tools have just been made available, which opens a real potential for development. We present a state-of-the-art of the field, and we detail how the first tree bank Universal Dependencies, created by Tyers & Ravishankar (2018) could be reinforced by 25000 additional glossed sentences in the databank of the wikigrammar ARBRES (Jouitteau (2009-).< Réduire
Mots clés
TAL Traitement Automatique des Langues
breton
celtique
wikigrammaires
Mots clés en anglais
NLP Natural Language Processing
Breton
Celtic
Wikigrammars
Origine
Importé de halUnités de recherche