Analyse automatique par transitions pour l'identification des expressions polylexicales

Analyse automatique par transitions pour l'identification des expressions polylexicales PDF Author: Hazem Al Saied
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
Cette thèse porte sur l'identification des expressions polylexicales, abordée au moyen d'une analyse par transitions. Une expression polylexicale (EP) est une construction linguistique composée de plusieurs éléments dont la combinaison montre une irrégularité à un ou plusieurs niveaux linguistiques. La tâche d'identification d'EPs consiste à annoter en contexte les occurrences d'EPs dans des textes, i.e à détecter les ensembles de tokens formant de telles occurrences. L'analyse par transitions est une approche célèbre qui construit une sortie structurée à partir d'une séquence d'éléments, en appliquant une séquence de «transitions» choisies parmi un ensemble prédéfini, pour construire incrémentalement la sortie. Dans cette thèse, nous proposons un système par transitions dédié à l'identification des EPs au sein de phrases représentées comme des séquences de tokens, et étudions diverses architectures pour le classifieur qui sélectionne les transitions à appliquer, permettant de construire l'analyse de la phrase. La première variante de notre système utilise un classifieur linéaire de type machine à vecteur support. Les variantes suivantes utilisent des modèles neuronaux: un simple perceptron multicouche, puis des variantes intégrant une ou plusieurs couches récurrentes. Le scénario privilégié est une identification d'EPs n'utilisant pas d'informations syntaxiques, alors même que l'on sait les deux tâches liées. Nous étudions ensuite une approche par apprentissage multitâche, réalisant conjointement l'étiquetage morphosyntaxique, l'identification des EPs par transitions et l'analyse syntaxique en dépendances par transitions. La thèse comporte une partie expérimentale importante. Nous avons d'une part étudié quelles techniques de ré-échantillonnage des données permettent une bonne stabilité de l'apprentissage malgré des initialisations aléatoires. D'autre part, nous avons proposé une méthode de réglage des hyperparamètres de nos modèles par analyse de tendances au sein d'une recherche aléatoire de combinaison d'hyperparamètres. Nous utilisons en effet de manière privilégiée les données des deux compétitions internationales PARSEME des EPs verbales. Nos variantes produisent de très bons résultats, et notamment les scores d'état de l'art pour de nombreuses langues de PARSEME. L'une des variantes s'est classée première pour la plupart des langues de PARSEME 1.0. Pourtant, nos modèles ont des performances faibles sur les EPs non vues à l'apprentissage.

Analyse automatique par transitions pour l'identification des expressions polylexicales

Analyse automatique par transitions pour l'identification des expressions polylexicales PDF Author: Hazem Al Saied
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
Cette thèse porte sur l'identification des expressions polylexicales, abordée au moyen d'une analyse par transitions. Une expression polylexicale (EP) est une construction linguistique composée de plusieurs éléments dont la combinaison montre une irrégularité à un ou plusieurs niveaux linguistiques. La tâche d'identification d'EPs consiste à annoter en contexte les occurrences d'EPs dans des textes, i.e à détecter les ensembles de tokens formant de telles occurrences. L'analyse par transitions est une approche célèbre qui construit une sortie structurée à partir d'une séquence d'éléments, en appliquant une séquence de «transitions» choisies parmi un ensemble prédéfini, pour construire incrémentalement la sortie. Dans cette thèse, nous proposons un système par transitions dédié à l'identification des EPs au sein de phrases représentées comme des séquences de tokens, et étudions diverses architectures pour le classifieur qui sélectionne les transitions à appliquer, permettant de construire l'analyse de la phrase. La première variante de notre système utilise un classifieur linéaire de type machine à vecteur support. Les variantes suivantes utilisent des modèles neuronaux: un simple perceptron multicouche, puis des variantes intégrant une ou plusieurs couches récurrentes. Le scénario privilégié est une identification d'EPs n'utilisant pas d'informations syntaxiques, alors même que l'on sait les deux tâches liées. Nous étudions ensuite une approche par apprentissage multitâche, réalisant conjointement l'étiquetage morphosyntaxique, l'identification des EPs par transitions et l'analyse syntaxique en dépendances par transitions. La thèse comporte une partie expérimentale importante. Nous avons d'une part étudié quelles techniques de ré-échantillonnage des données permettent une bonne stabilité de l'apprentissage malgré des initialisations aléatoires. D'autre part, nous avons proposé une méthode de réglage des hyperparamètres de nos modèles par analyse de tendances au sein d'une recherche aléatoire de combinaison d'hyperparamètres. Nous utilisons en effet de manière privilégiée les données des deux compétitions internationales PARSEME des EPs verbales. Nos variantes produisent de très bons résultats, et notamment les scores d'état de l'art pour de nombreuses langues de PARSEME. L'une des variantes s'est classée première pour la plupart des langues de PARSEME 1.0. Pourtant, nos modèles ont des performances faibles sur les EPs non vues à l'apprentissage.

Garder la trace, mettre de l'ordre et relier les points

Garder la trace, mettre de l'ordre et relier les points PDF Author: Caroline Pasquer
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
L'identification automatique d'expressions polylexicales (EP) est un pré-requis pour de nombreuses applications de traitement automatique des langues. Cette tâche représente un défi car les EP, et en particulier les verbales (EPV) telles que 'casser sa pipe' (signifiant 'mourir'), ont des formes de surface très variables ('cassera-t-il un jour sa pipe ?'). Cependant, comparée à des constructions libres, cette variabilité est généralement plus restreinte (p. ex. certains noms non modifiables par un adjectif), d'où des profils de variabilité distincts. On se penche ici sur un sous-problème de l'identification d'EPV, à savoir l'identification d'occurrences d'EPV vues dans d'autres contextes, quelque soit leur forme de surface, ce qui nécessite de prendre en compte l'ambiguïté pour éviter des lectures littérales ('casser sa vieille pipe') ou des co-occurrences fortuites ('casser le tuyau de sa pipe'). On considère pour cela deux approches : la première se fonde sur une mesure de la variabilité des EPV indépendante de la langue. La seconde consiste à modéliser le problème comme une tâche de classification d'après des traits pertinents pour la variabilité morpho-syntaxique des EPV, ce qui nous a conduit à développer un système (VarIDE), qui a participé à la compétition PARSEME d'identification automatique d'EPV en 2018.

Multiword expressions

Multiword expressions PDF Author: Manfred Sailer
Publisher: Language Science Press
ISBN: 3961100632
Category : Bilingualism
Languages : en
Pages : 376

Get Book Here

Book Description
Multiword expressions (MWEs) are a challenge for both the natural language applications and the linguistic theory because they often defy the application of the machinery developed for free combinations where the default is that the meaning of an utterance can be predicted from its structure. There is a rich body of primarily descriptive work on MWEs for many European languages but comparative work is little. The volume brings together MWE experts to explore the benefits of a multilingual perspective on MWEs. The ten contributions in this volume look at MWEs in Bulgarian, English, French, German, Maori, Modern Greek, Romanian, Serbian, and Spanish. They discuss prominent issues in MWE research such as classification of MWEs, their formal grammatical modeling, and the description of individual MWE types from the point of view of different theoretical frameworks, such as Dependency Grammar, Generative Grammar, Head-driven Phrase Structure Grammar, Lexical Functional Grammar, Lexicon Grammar.

Socio-onomastics

Socio-onomastics PDF Author: Terhi Ainiala
Publisher: John Benjamins Publishing Company
ISBN: 9027265690
Category : Language Arts & Disciplines
Languages : en
Pages : 240

Get Book Here

Book Description
The volume seeks to establish socio-onomastics as a field of linguistic inquiry not only within sociolinguistics, but also, and in particular, within pragmatics. The linguistic study of names has a very long history, but also a history sometimes fraught with skepticism, and thus often neglected by linguists in other fields. The volume takes on the challenge of instituting onomastic study into linguistics and pragmatics by focusing on recent trends within socio-onomastics, interactional onomastics, contact onomastics, folk onomastics, and linguistic landscape studies. The volume is an introduction to these fields – with the introductory chapter giving an overview of, and an update on, recent onomastic study – and in addition offers detailed in-depth analyses of place names, person names, street names and commercial names from different perspectives: historically, as well as from the point of view of the impact of globalization and glocalization. All the chapters focus on the use and function of names and naming, on changes in name usage, and on the reasons for, processes in, and results of names in contact.

The Phrasal Verb in English

The Phrasal Verb in English PDF Author: Dwight Bolinger
Publisher: Cambridge, Mass. : Harvard University Press
ISBN:
Category : Language Arts & Disciplines
Languages : en
Pages : 212

Get Book Here

Book Description


Turkey, Islam, Nationalism, and Modernity

Turkey, Islam, Nationalism, and Modernity PDF Author: Carter V. Findley
Publisher: Yale University Press
ISBN: 0300152620
Category : History
Languages : en
Pages : 506

Get Book Here

Book Description
Book Description: Publication Date: August 30, 2011. "Turkey, Islam, Nationalism, and Modernity" reveals the historical dynamics propelling two centuries of Ottoman and Turkish history. As mounting threats to imperial survival necessitated dynamic responses, ethnolinguistic and religious identities inspired alternative strategies for engaging with modernity. A radical, secularizing current of change competed with a conservative, Islamically committed current. Crises sharpened the differentiation of the two streams, forcing choices between them. The radical current began with the formation of reformist governmental elites and expanded with the advent of 'print capitalism', symbolized by the privately owned, Ottoman-language newspapers. The radicals engineered the 1908 Young Turk revolution, ruled empire and republic until 1950, made secularism a lasting 'belief system', and still retain powerful positions. The conservative current gained impetus from three history-making Islamic renewal movements, those of Mevlana Halid, Said Nursi, and Fethullah Gulen. Powerful under the empire, Islamic conservatives did not regain control of government until the 1980s. By then they, too, had their own influential media. Findley's reassessment of political, economic, social and cultural history reveals the dialectical interaction between radical and conservative currents of change, which alternately clashed and converged to shape late Ottoman and republican Turkish history.

Evaluating Second Language Education

Evaluating Second Language Education PDF Author: J. Charles Alderson
Publisher: Cambridge University Press
ISBN: 9780521422697
Category : Education
Languages : en
Pages : 392

Get Book Here

Book Description
"Counter Responsibility for planning language teaching programs now carries with it a strong element of accountability. Evaluation of the whole process of course design, development, and implementation is therefore a necessary area of activity for course designers, language planners, and researchers. This book brings together accounts of recent work in this increasingly important field and will be a valuable resource both for those already engaged in evaluation and for those in training. Part One presents a review of the literature, covering past developments in the wider field of educational evaluation, as well as specifically in second language education. Part Two contains a series of eight original case-studies, written by scholars involved in evaluations in widely divergent settings. The focus in each case is on how the evaluator addresses the difficulties central to each study, and the findings are also included. The final Part Three provides practical guidance for evaluators, offering suggestions about how to set up and carry out evaluations in any given setting."--Publisher's website.

The Handbook of Translation and Cognition

The Handbook of Translation and Cognition PDF Author: John W. Schwieter
Publisher: John Wiley & Sons
ISBN: 1119241456
Category : Language Arts & Disciplines
Languages : en
Pages : 615

Get Book Here

Book Description
The Handbook of Translation and Cognition is a pioneering, state-of-the-art investigation of cognitive approaches to translation and interpreting studies (TIS). Offers timely and cutting-edge coverage of the most important theoretical frameworks and methodological innovations Contains original contributions from a global group of leading researchers from 18 countries Explores topics related to translator and workplace characteristics including machine translation, creativity, ergonomic perspectives, and cognitive effort, and competence, training, and interpreting such as multimodal processing, neurocognitive optimization, process-oriented pedagogies, and conceptual change Maps out future directions for cognition and translation studies, as well as areas in need of more research within this dynamic field

Pattern Recognition and Applications

Pattern Recognition and Applications PDF Author: María Inés Torres
Publisher:
ISBN: 9784274903625
Category : Artificial intelligence
Languages : en
Pages : 316

Get Book Here

Book Description


E-Lexicography

E-Lexicography PDF Author: Pedro A. Fuertes-Olivera
Publisher: A&C Black
ISBN: 1441128069
Category : Reference
Languages : en
Pages : 357

Get Book Here

Book Description
This book looks at current research and future directions in e-lexicography. Online dictionaries and reference tools are increasingly prevalent in a digitized and internet-led era in language study that has embraced computational linguistics. This book responds with theoretical and practical analysis of key topics, from a global range of contributors. Since COBUILD in the 1980s, lexicographers have found it essential to engage with and utilize electronic computational tools. Internet dictionaries, online reference tools and even search engine optimization demand a knowledge of electronic lexicography and force a reassessment of the field. This volume looks at, amongst other topics: • Polyfunctional versus monofunctional dictionary tools • Developing theories of lexicography for electronic mediums • Distinguishing between the database and the dictionary • Online dictionaries not as data repositories but as sophisticated search engines This volume will appeal to scholars in lexicography and to practicing lexicographers.