Acquisition de grammaires lexicalisées pour les langues naturelles

Acquisition de grammaires lexicalisées pour les langues naturelles PDF Author: Erwan Moreau
Publisher:
ISBN:
Category :
Languages : fr
Pages : 236

Get Book Here

Book Description
L'inférence grammaticale désigne le problème qui consiste à découvrir les règles de formation des phrases d'un langage, c'est-à-dire une grammaire de celui-ci. Dans le modèle d'apprentissage de Gold, les exemples fournis sont constitués uniquement des phrases appartenant au langage. L'algorithme doit fournir une grammaire qui représente le langage énuméré. Les grammaires catégorielles sont l'un des nombreux formalismes existants pour représenter des langages. Kanazawa a montré que certaines sous-classes de ces grammaires sont apprenables, mais ses résultats ne sont pas applicables directement aux langues naturelles. Sur le plan théorique, nous proposons de généraliser les résultats de Kanazawa à différents types de grammaires. Les grammaires combinatoires générales sont un modèle flexible permettant de définir des systèmes grammaticaux à base de règles de réécriture. Nous démontrons dans ce cadre que certaines classes de langages sont apprenables. Dans un souci de généralité maximale, nos résultats sont exprimés sous forme de critères sur les règles des systèmes grammaticaux considérés. Ces résultats sont appliqués à plusieurs formalismes relativement adaptés à la représentation des langues naturelles.Nous abordons également le problème de la mise en oeuvre de l'apprentissage sur des données réelles. En effet, les algorithmes existants capables d'apprendre des classes de langages intéressantes sont NP-complets. Afin de contourner cet obstacle, nous proposons un cadre d'apprentissage plus souple, l'apprentissage partiel : le contexte d'utilisation est modifié dans le but d'obtenir une complexité algorithmique plus réaliste. Nous testons cette approche sur des données de taille moyenne, et obtenons des résultats plutôt encourageants.

Acquisition de grammaires lexicalisées pour les langues naturelles

Acquisition de grammaires lexicalisées pour les langues naturelles PDF Author: Erwan Moreau
Publisher:
ISBN:
Category :
Languages : fr
Pages : 236

Get Book Here

Book Description
L'inférence grammaticale désigne le problème qui consiste à découvrir les règles de formation des phrases d'un langage, c'est-à-dire une grammaire de celui-ci. Dans le modèle d'apprentissage de Gold, les exemples fournis sont constitués uniquement des phrases appartenant au langage. L'algorithme doit fournir une grammaire qui représente le langage énuméré. Les grammaires catégorielles sont l'un des nombreux formalismes existants pour représenter des langages. Kanazawa a montré que certaines sous-classes de ces grammaires sont apprenables, mais ses résultats ne sont pas applicables directement aux langues naturelles. Sur le plan théorique, nous proposons de généraliser les résultats de Kanazawa à différents types de grammaires. Les grammaires combinatoires générales sont un modèle flexible permettant de définir des systèmes grammaticaux à base de règles de réécriture. Nous démontrons dans ce cadre que certaines classes de langages sont apprenables. Dans un souci de généralité maximale, nos résultats sont exprimés sous forme de critères sur les règles des systèmes grammaticaux considérés. Ces résultats sont appliqués à plusieurs formalismes relativement adaptés à la représentation des langues naturelles.Nous abordons également le problème de la mise en oeuvre de l'apprentissage sur des données réelles. En effet, les algorithmes existants capables d'apprendre des classes de langages intéressantes sont NP-complets. Afin de contourner cet obstacle, nous proposons un cadre d'apprentissage plus souple, l'apprentissage partiel : le contexte d'utilisation est modifié dans le but d'obtenir une complexité algorithmique plus réaliste. Nous testons cette approche sur des données de taille moyenne, et obtenons des résultats plutôt encourageants.

Apprentissage de grammaires catégorielles pour simuler l'acquisition du langage naturel à l'aide d'informations sémantiques

Apprentissage de grammaires catégorielles pour simuler l'acquisition du langage naturel à l'aide d'informations sémantiques PDF Author: Daniela Dudau
Publisher:
ISBN:
Category :
Languages : en
Pages : 200

Get Book Here

Book Description
Cette classe mérite d'être étudiée parce que ses membres permettent de générer l'ensemble des langages hors-contexte ou algébriques et parce que l'interface qu'elle permet avec une interprétation sémantique la rend apte à modéliser certaines particularités des langues naturelles. Mais les résultats d'apprenabilité connus ne concernent que des sous-classes triviales (classe des grammaires rigides) ou donnent lieu à des algorithmes rédhibitoires (classes des grammaires k-valuées avec k > 1). Nous définissons une nouvelle sous-classe de grammaires catégorielles classiques à la fois intéressante d'un point de vue de la théorie des langages (puisque ses représentants permettent de générer l'ensemble des langages de structures de toutes les grammaires catégorielles classiques) et d'un point de vue de l'apprentissage automatique (puisqu'elle est apprenable au sens de Gold à condition de fournir des données adaptées). Pour tester la validité et l'efficacité de notre proposition nous avons constitué un corpus de textes en français avec des annotations sémantiques. Les résultats des expérimentations sont prometteurs, spécialement en ce qui concerne l'influence de certains facteurs comme l'ordre des phrases (de la plus courte à la plus longue) et la redondance du vocabulaire, qui s'avère bénéfique, confirmant certaines hypothèses psycholinguistiques.

Efficient production of linguistic resources

Efficient production of linguistic resources PDF Author: Lionel Nicolas
Publisher:
ISBN:
Category :
Languages : en
Pages : 185

Get Book Here

Book Description
L’efficacité de la grande majorité des outils utilisés pour le Traitement Automatique des Langues Naturelles (TALN) dépend directement ou indirectement des ressources linguistiques informatisées sur lesquels ils reposent. Pour des langues internationalement employées telles que le français ou l’espagnol, bien des ressources de référence sont encore dans un état précaire de développement. Pour d’autres langues ayant une communauté moins importante, ces ressources sont souvent inexistantes. Cette situation est la conséquence directe des ambigüités et des irrégularités des langues naturelles. Ces dernières rendent leur formalisation complexe, leur description manuelle fastidieuse et leur acquisition automatisée difficile. De nos jours, pour les aspects linguistiques ayant des formalismes de description consensuels, la principale limitation à la création des ressources linguistiques est le coût humain prohibitif induit par leur création et amélioration manuelle. Comme le formalise la loi de Zipf, améliorer la qualité et la couverture d’une ressource linguistique devient toujours plus laborieux lorsque l’on compara les efforts investis aux améliorations obtenues. La difficulté est donc moins de savoir comment décrire l’aspect linguistique d’une langue que d’en réaliser une description dont la couverture et la qualité répondent aux besoins d’applications performantes. Construire de telles ressources requiert donc des années d’efforts constants débouchant trop souvent sur des résultats d’une qualité relative et d’une visibilité limitée. L’acquisition et la correction rapides et efficaces de ressources linguistiques sont donc des problèmes peu résolus et d’une importante capitale pour les développement dans le domaine du TALN. Dans ce contexte, mes recherches ont pour but premier de faciliter la production de ressources linguistiques symboliques ayant trait à l’analyse syntaxique. Elles s’inscrivent dans un projet, appelé Victoria, dont l’objectif est de développer un ensemble de techniques, d’outils et de stratégies pour l’acquisition et la correction de règles morphologiques, de lexiques morphosyntaxiques et de grammaires lexicalisées. L’application pratique de ces développements nous a permis de créer et/ou d’améliorer des ressources linguistiques pour le français, l’espagnol et le galicien. Plus particulièrement, mes efforts se sont concentrés sur : des stratégies pratiques pour minimiser les efforts nécessaires à la création et l’amélioration de ressources linguistiques ; l’acquisition automatique des règles morphologiques d’une langue à morphologie concaténative ; la correction semi-automatique de lexiques morpho-syntaxiques à large couverture.

Conjectures sur une grammaire indépendante du contexte pour les langues naturelles

Conjectures sur une grammaire indépendante du contexte pour les langues naturelles PDF Author: Denis Bouchard
Publisher: 1979.
ISBN:
Category :
Languages : fr
Pages : 128

Get Book Here

Book Description


Approche logique des grammaires pour les langues naturelles

Approche logique des grammaires pour les langues naturelles PDF Author: Houda Anoun
Publisher: Univ Europeenne
ISBN: 9786131518317
Category :
Languages : fr
Pages : 188

Get Book Here

Book Description


Approche logique des grammaires pour les langues naturelles

Approche logique des grammaires pour les langues naturelles PDF Author: Houda Anoun
Publisher:
ISBN:
Category :
Languages : fr
Pages : 165

Get Book Here

Book Description
Les contributions majeures de cette thèse s'articulent autour des trois axes de base de la linguistique computationnelle, à savoir la logique, la linguistique et l'informatique. Nous proposons ainsi un nouveau système non-directionnel GLE permettant de simuler les opérations transformationnelles du Programme Minimaliste dans un cadre logique qui fait appel au raisonnement hypothétique de manière contrôlée. La pertinence de ce formalisme est soulignée en montrant sa capacité de prendre en charge des phénomènes linguistiques complexes, nécessitant un partage contraint de ressources, tels que liliage d'anaphores ou la résolution d'ellipse. En outre, nous présentons un atelier logique ICHARTE destiné à la recherche et l'enseignement de la linguistique computationnelle. Cet outil est composé de bibliothèques pour l'assistant à la démonstration Coq, qui comprennent la formalisation de systèmes logiques avancés dédié au traitement des langues naturelles, dont la logique multimodale.

T.A.L.

T.A.L. PDF Author:
Publisher:
ISBN:
Category : Applied linguistics
Languages : fr
Pages : 684

Get Book Here

Book Description


Expanding the Lexicon

Expanding the Lexicon PDF Author: Sabine Arndt-Lappe
Publisher: Walter de Gruyter GmbH & Co KG
ISBN: 3110498162
Category : Language Arts & Disciplines
Languages : en
Pages : 282

Get Book Here

Book Description
The creation of new lexical units and patterns has been studied in different research frameworks, focusing on either system-internal or system-external aspects, from which no comprehensive view has emerged. The volume aims to fill this gap by studying dynamic processes in the lexicon – understood in a wide sense as not being necessarily limited to the word level – by bringing together approaches directed to morphological productivity as well as approaches analyzing general types of lexical innovation and the role of discourse-related factors. The papers deal with ongoing changes as well as with historical processes of change in different languages and reflect on patterns and specific subtypes of lexical innovation as well as on their external conditions and the speakers’ motivations for innovating. Moreover, the diffusion and conventionalization of innovations will be addressed. In this way, the volume contributes to understanding the complex interplay of structural, cognitive and functional factors in the lexicon as a highly dynamic domain.

An Introduction to Generative Grammar

An Introduction to Generative Grammar PDF Author: Nicolas Ruwet
Publisher:
ISBN:
Category : Language Arts & Disciplines
Languages : en
Pages : 396

Get Book Here

Book Description


Translation and Meaning

Translation and Meaning PDF Author: Marcel Thelen
Publisher: Lodz Studies in Language
ISBN: 9783631663905
Category : Semantics
Languages : en
Pages : 0

Get Book Here

Book Description
This book presents new and innovative ideas on the didactics of translation and interpreting. They include assessment methods and criteria, assessment of competences, graduate employability, placements, skills labs, the perceived skills gap between training and profession, the teaching of terminology, and curriculum design.