Améliorer un lexique syntaxique à l'aide des tables du lexique-grammaire — Constructions impersonnelles et expressions verbales figées
SAGOT, Benoît
Linguistic signs, grammar and meaning: computational logic for natural language [SIGNES]
Linguistic signs, grammar and meaning: computational logic for natural language [SIGNES]
SAGOT, Benoît
Linguistic signs, grammar and meaning: computational logic for natural language [SIGNES]
< Réduire
Linguistic signs, grammar and meaning: computational logic for natural language [SIGNES]
Langue
fr
Article de revue
Ce document a été publié dans
Cahiers du Cental. 2008, vol. 5, p. 107-126
Presses universitaires de Louvain
Résumé
Nous avons le projet de développer un lexique morphologique et syntaxique du français à large couverture qui soit directement utilisable dans des applications de Traitement Automatique du Langage (TAL), en particulier ...Lire la suite >
Nous avons le projet de développer un lexique morphologique et syntaxique du français à large couverture qui soit directement utilisable dans des applications de Traitement Automatique du Langage (TAL), en particulier celles nécessitant une analyse syntaxique profonde, et ce, quel que soit le cadre théorique utilisé. Ce lexique, baptisé Lefff (Lexique des Formes Fléchies du Français), est en cours de développement depuis 2004. Au départ, ce lexique ne comportait que des informations morphologiques verbales, principalement induites automatiquement à partir de corpus. Il couvre maintenant toutes les catégories, et est progressivement enrichi d'informations syntaxiques. Nous montrons ici comment nous l'avons enrichi à partir des tables du lexique-grammaire, initialement développées autour de M. Gross. Celles-ci constituent un point de départ d'une valeur inestimable. Il est néanmoins nécessaire de procéder à un double travail de linguistique et de modélisation, afin d'exploiter leur contenu dans un lexique TAL tel que le Lefff. Nous illustrons cette approche sur deux types d'entrées verbales et adjectivales non standard : les constructions impersonnelles et les expressions verbales figées.< Réduire
Résumé en anglais
We intend to develop a large-coverage morphological and syntactic lexicon for French which can be directly used in Natural Langage Processing (NLP) applications, in particular in those involving deep parsing, regardless ...Lire la suite >
We intend to develop a large-coverage morphological and syntactic lexicon for French which can be directly used in Natural Langage Processing (NLP) applications, in particular in those involving deep parsing, regardless of the underlying grammatical framework. This lexicon, named Lefff (Lexique des Formes Fléchies du Français — Lexicon of French inFlected Forms), has been under development since 2004. At the beginning, this lexicon contained only verbal morphological information, mostly automatically induced from corpora. It now covers all parts of speech, and is progressively enriched with syntactic information. In this paper, we show how we used the lexicon-grammar tables, whose development has been initiated by M. Gross, to enrich the Lefff. These tables are a valuable starting point. However, it is necessary to achieve both a linguistic and formal modeling work, in order to exploit their content in a NLP lexicon such as the Lefff. We illustrate this approach on two kinds of non-standard verbal and adjectival entries : impersonal structures and verbal idiomatic expressions.< Réduire
Mots clés
lexique-grammaire
constructions impersonnelles
constructions verbales figées
Mots clés en anglais
lexicon-grammar
impersonal constructions
frozen verbal expressions
Origine
Importé de halUnités de recherche