Extraction automatique de cadres de sous-catégorisation verbale pour le français à partir d'un corpus arboré
hal.structure.identifier | Laboratoire de Linguistique Formelle [LLF UMR7110] | |
dc.contributor.author | KUPŚĆ, Anna | |
dc.date.accessioned | 2022-03-07T14:29:40Z | |
dc.date.available | 2022-03-07T14:29:40Z | |
dc.date.issued | 2007 | |
dc.date.conference | 2007 | |
dc.identifier.uri | https://oskar-bordeaux.fr/handle/20.500.12278/130176 | |
dc.description.abstract | Nous présentons une expérience d'extraction automatique des cadres de souscatégorisation pour 1362 verbes français. Nous exploitons un corpus journalistique richement annoté de 10 000 phrases dont nous extrayons 12 510 occurrences verbales. Nous évaluons dans un premier temps l'extraction des cadres basée sur la fonction des arguments, ce qui nous fournit 39 cadres différents avec une moyenne de 1.54 cadres par lemme. Ensuite, nous adoptons une approche mixte (fonction et catégorie syntaxique) qui nous fournit dans un premier temps 925 cadres différents, avec une moyenne de 3.44 cadres par lemme. Plusieurs méthodes de factorisation, neutralisant en particulier les variantes de réalisation avec le passif ou les pronoms clitiques, sont ensuite appliquées et nous permettent d'aboutir à 235 cadres différents avec une moyenne de 1.94 cadres par verbe. Nous comparons brièvement nos résultats avec les travaux existants pour le français et pour l'anglais. | |
dc.language.iso | fr | |
dc.source.title | TALN 2007 | |
dc.title | Extraction automatique de cadres de sous-catégorisation verbale pour le français à partir d'un corpus arboré | |
dc.type | Communication dans un congrès avec actes | |
dc.subject.hal | Sciences de l'Homme et Société/Linguistique | |
bordeaux.hal.laboratories | CLLE Montaigne : Cognition, langues, Langages, Ergonomie - UMR 5263 | * |
bordeaux.institution | Université Bordeaux Montaigne | |
bordeaux.country | FR | |
bordeaux.title.proceeding | TALN 2007 | |
bordeaux.conference.city | Toulouse | |
bordeaux.peerReviewed | oui | |
hal.identifier | halshs-00751131 | |
hal.version | 1 | |
hal.origin.link | https://hal.archives-ouvertes.fr//halshs-00751131v1 | |
bordeaux.COinS | ctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.title=Extraction%20automatique%20de%20cadres%20de%20sous-cat%C3%A9gorisation%20verbale%20pour%20le%20fran%C3%A7ais%20%C3%A0%20partir%20d'un%20corpus%20arbor%C3%A9&rft.btitle=TALN%202007&rft.atitle=Extraction%20automatique%20de%20cadres%20de%20sous-cat%C3%A9gorisation%20verbale%20pour%20le%20fran%C3%A7ais%20%C3%A0%20partir%20d'un%20corpus%20arbor%C3%A9&rft.date=2007&rft.au=KUP%C5%9A%C4%86,%20Anna&rft.genre=proceeding |
Fichier(s) constituant ce document
Fichiers | Taille | Format | Vue |
---|---|---|---|
Il n'y a pas de fichiers associés à ce document. |