Afficher la notice abrégée

dc.contributor.advisorCourcelle, Bruno
dc.contributor.advisorClément, Lionel
dc.contributor.advisorSalvati, Sylvain
dc.contributor.authorKIRMAN, Jerome
dc.contributor.otherSchmitz, Sylvain
dc.contributor.otherVillemonte de la Clergerie, Eric
dc.date2015-12-04
dc.identifier.urihttp://www.theses.fr/2015BORD0330/abes
dc.identifier.uri
dc.identifier.urihttps://tel.archives-ouvertes.fr/tel-01267716
dc.identifier.nnt2015BORD0330
dc.description.abstractLa linguistique informatique a pour objet de construire un modèle formel des connaissances linguistiques, et d’en tirer des algorithmes permettant le traitement automatique des langues. Pour ce faire, elle s’appuie fréquemment sur des grammaires dites génératives, construisant des phrases valides par l’application successive de règles de réécriture. Une approche alternative, basée sur la théorie des modèles, vise à décrire la grammaticalité comme une conjonction de contraintes de bonne formation, en s’appuyant sur des liens profonds entre logique et automates pour produire des analyseurs efficaces. Notre travail se situe dans ce dernier cadre. En s’appuyant sur plusieurs résultats existants en informatique théorique, nous proposons un outil de modélisation linguistique expressif, conçu pour faciliter l’ingénierie grammaticale. Celui-ci considère dans un premier temps la structure abstraite des énoncés, et fournit un langage logique s’appuyant sur les propriétés lexicales des mots pour caractériser avec concision l’ensemble des phrases grammaticalement correctes. Puis, dans un second temps, le lien entre ces structures abstraites et leurs représentations concrètes (en syntaxe et en sémantique) est établi par le biais de règles de linéarisation qui exploitent la logique et le lambda-calcul. Par suite, afin de valider cette approche, nous proposons un ensemble de modélisations portant sur des phénomènes linguistiques divers, avec un intérêt particulier pour le traitement des langages présentant des phénomènes d’ordre libre (c’est-à-dire qui autorisent la permutation de certains mots ou groupes de mots dans une phrase sans affecter sa signification), ainsi que pour leur complexité algorithmique.
dc.description.abstractEnThe goal of computational linguistics is to provide a formal account linguistical knowledge, and to produce algorithmic tools for natural languageprocessing. Often, this is done in a so-called generative framework, where grammars describe sets of valid sentences by iteratively applying some set of rewrite rules. Another approach, based on model theory, describes instead grammaticality as a set of well-formedness logical constraints, relying on deep links between logic and automata in order to produce efficient parsers. This thesis favors the latter approach. Making use of several existing results in theoretical computer science, we propose a tool for linguistical description that is both expressive and designed to facilitate grammar engineering. It first tackles the abstract structure of sentences, providing a logical language based on lexical properties of words in order to concisely describe the set of grammaticaly valid sentences. It then draws the link between these abstract structures and their representations (both in syntax and semantics), through the use of linearization rules that rely on logic and lambda-calculus. Then in order to validate this proposal, we use it to model various linguistic phenomenas, ending with a specific focus on languages that include free word order phenomenas (that is, sentences which allow the free reordering of some of their words or syntagmas while keeping their meaning), and on their algorithmic complexity.
dc.language.isofr
dc.subjectLinguistique informatique
dc.subjectSyntaxe modèle-théorique
dc.subjectGrammaires catégorielles abstraites
dc.subjectLambda-calcul
dc.subjectLogique
dc.subject.enComputational linguistics
dc.subject.enModel-theoretic syntax
dc.subject.enAbstract categorial grammars
dc.subject.enLambda-calculus
dc.subject.enLogic
dc.titleMise au point d'un formalisme syntaxique de haut niveau pour le traitement automatique des langues
dc.title.enA high-level syntactic formalism for natural language processing
dc.typeThèses de doctorat
dc.contributor.jurypresidentSenizergues, Géraud
bordeaux.hal.laboratoriesLaboratoire bordelais de recherche en informatique
bordeaux.type.institutionBordeaux
bordeaux.thesis.disciplineInformatique
bordeaux.ecole.doctoraleÉcole doctorale de mathématiques et informatique (Talence, Gironde)
star.origin.linkhttps://www.theses.fr/2015BORD0330
dc.contributor.rapporteurPerrier, Guy
dc.contributor.rapporteurDuchier, Denys
bordeaux.COinSctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Mise%20au%20point%20d'un%20formalisme%20syntaxique%20de%20haut%20niveau%20pour%20le%20traitement%20automatique%20des%20langues&rft.atitle=Mise%20au%20point%20d'un%20formalisme%20syntaxique%20de%20haut%20niveau%20pour%20le%20traitement%20automatique%20des%20langues&rft.au=KIRMAN,%20Jerome&rft.genre=unknown


Fichier(s) constituant ce document

FichiersTailleFormatVue

Il n'y a pas de fichiers associés à ce document.

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée