Guide de survie des langues minorisées à l'heure de l'intelligence artificielle : Appel aux communautés parlantes
Langue
fr
Article de revue
Ce document a été publié dans
Lapurdum. 2023
Centre de recherche sur la langue et les textes basques IKER UMR 5478 CNRS
Date de soutenance
2023Résumé
Cet article s'adresse à la fois aux chercheurs en sciences humaines et aux structures de politique linguistique des langues minorisées. Il comprend un résumé compréhensible de la chaîne de développement du numérique pour ...Lire la suite >
Cet article s'adresse à la fois aux chercheurs en sciences humaines et aux structures de politique linguistique des langues minorisées. Il comprend un résumé compréhensible de la chaîne de développement du numérique pour le Traitement Automatique des Langues (TAL), avec une attention particulière pour ces langues qui n'ont pas des corpus aussi vastes que le français ou l'anglais. Dans le contexte de la révolution de l'Intelligence Artificielle (IA), dont j'explique les enjeux pour ces langues à corpus restreint, je liste les recommandations indispensables au développement de ressources pérennes à même d'assurer un développement durable, avec une liste des pièges et mécompréhensions les plus courantes. L'article prend le breton comme exemple illustratif d'une langue à corpus restreint démontrant des ressources et applications numériques émergentes. Ses conclusions s'appliquent largement à toutes les langues à corpus restreint dont le développement numérique est amorcé, mais encore insuffisant pour profiter directement des applications d'IA développées actuellement pour les langues à corpus massif.< Réduire
Origine
Importé de halUnités de recherche