Traitement automatique des langues et recherche d'information en langue arabe dans un domaine de spécialité

Traitement automatique des langues et recherche d'information en langue arabe dans un domaine de spécialité PDF Author: Siham Boulaknadel
Publisher:
ISBN:
Category :
Languages : fr
Pages : 226

Get Book Here

Book Description
La Recherche d'Information a pour objectif de fournir à un utilisateur un accès facile à l'information qui l'intéresse, cette information étant située dans une masse de documents textuels. Afin d'atteindre cet objectif, un système de recherche d'information doit représenter, stocker et organiser l'information, puis fournir à l'utilisateur les éléments correspondant au besoin d'information exprimé par sa requête. La plupart des systèmes de recherche d'information (SRI) utilisent des termes simples pour indexer et retrouver des documents. Cependant, cette représentation n'est pas assez précise pour représenter le contenu des documents et des requêtes, du fait de l'ambiguïté des termes isolés de leur contexte. Une solution à ce problème consiste à utiliser des termes complexes à la place de termes simples isolés. Cette approche se fonde sur l'hypothèse qu'un terme complexe est moins ambigu qu'un terme simple isolé.Notre thèse s’inscrit dans le cadre de la recherche d’information dans un domaine de spécialité en langue arabe. L'objectif de notre travail a été d’une part, d’identifier les termes complexes présents dans les requêtes et les documents. D’autre part, d'exploiter pleinement la richesse de la langue en combinant plusieurs connaissances linguistiques appartenant aux niveaux morphologique et syntaxique, et de montrer comment l'apport de connaissances morphologiques et syntaxiques permet d'améliorer l'accès à l'information. Ainsi, nous avons proposé une plate-forme intégrant divers composants dans le domaine public ; elle conduit à montrer l'apport significatif et tranché de plusieurs de ces composants. En outre, nous avons avons défini linguistiquement les termes complexes en langue arabe et nous avons développé un système d’identification de termes complexes sur corpus qui produit des résultats de bonne qualité en terme de précision, en s’appuyant sur une approche mixte qui combine modèle statistique et données linguistiques

Traitement automatique des langues et recherche d'information en langue arabe dans un domaine de spécialité

Traitement automatique des langues et recherche d'information en langue arabe dans un domaine de spécialité PDF Author: Siham Boulaknadel
Publisher:
ISBN:
Category :
Languages : fr
Pages : 226

Get Book Here

Book Description
La Recherche d'Information a pour objectif de fournir à un utilisateur un accès facile à l'information qui l'intéresse, cette information étant située dans une masse de documents textuels. Afin d'atteindre cet objectif, un système de recherche d'information doit représenter, stocker et organiser l'information, puis fournir à l'utilisateur les éléments correspondant au besoin d'information exprimé par sa requête. La plupart des systèmes de recherche d'information (SRI) utilisent des termes simples pour indexer et retrouver des documents. Cependant, cette représentation n'est pas assez précise pour représenter le contenu des documents et des requêtes, du fait de l'ambiguïté des termes isolés de leur contexte. Une solution à ce problème consiste à utiliser des termes complexes à la place de termes simples isolés. Cette approche se fonde sur l'hypothèse qu'un terme complexe est moins ambigu qu'un terme simple isolé.Notre thèse s’inscrit dans le cadre de la recherche d’information dans un domaine de spécialité en langue arabe. L'objectif de notre travail a été d’une part, d’identifier les termes complexes présents dans les requêtes et les documents. D’autre part, d'exploiter pleinement la richesse de la langue en combinant plusieurs connaissances linguistiques appartenant aux niveaux morphologique et syntaxique, et de montrer comment l'apport de connaissances morphologiques et syntaxiques permet d'améliorer l'accès à l'information. Ainsi, nous avons proposé une plate-forme intégrant divers composants dans le domaine public ; elle conduit à montrer l'apport significatif et tranché de plusieurs de ces composants. En outre, nous avons avons défini linguistiquement les termes complexes en langue arabe et nous avons développé un système d’identification de termes complexes sur corpus qui produit des résultats de bonne qualité en terme de précision, en s’appuyant sur une approche mixte qui combine modèle statistique et données linguistiques

Computational Intelligence and Its Applications

Computational Intelligence and Its Applications PDF Author: Abdelmalek Amine
Publisher: Springer
ISBN: 3319897438
Category : Computers
Languages : en
Pages : 676

Get Book Here

Book Description
This book constitutes the refereed proceedings of the 6th IFIP TC 5 International Conference on Computational Intelligence and Its Applications, CIIA 2018, held in Oran, Algeria, in May 2018. The 56 full papers presented were carefully reviewed and selected from 202 submissions. They are organized in the following topical sections: data mining and information retrieval; evolutionary computation; machine learning; optimization; planning and scheduling; wireless communication and mobile computing; Internet of Things (IoT) and decision support systems; pattern recognition and image processing; and semantic web services.

Le repérage automatique des entités nommées dans la langue arabe

Le repérage automatique des entités nommées dans la langue arabe PDF Author: Wajdi Zaghouani
Publisher: Omn.Univ.Europ.
ISBN: 9786131565953
Category : Language Arts & Disciplines
Languages : fr
Pages : 156

Get Book Here

Book Description
Il existe plusieurs approches pour construire un syst me d'extraction automatique des entit s nomm es. Nous pr sentons le fonctionnement des syst mes base de r gles ainsi que les syst mes apprentissage automatique. Dans ce travail, nous avons opt pour un syst me base de r gles linguistiques, ce qui a n cessit une recherche sur les entit s nomm es en arabe ainsi que sur quelques traits linguistiques de la langue. Cette tude a servi lors de l' tape de l'impl mentation du syst me que nous avons baptis RENAR. Nous avons valu les performances du syst me sur deux corpus repr sentant deux variantes r gionales de l'arabe moderne. Les r sultats de l' valuation ont montr l'importance des marqueurs lexicaux et des dictionnaires pour un syst me base de r gles. Ce travail se veut une contribution l'avancement des recherches dans le domaine du rep rage de l'information pour la langue arabe.

Traitement automatique des langues et linguistique informatique 2

Traitement automatique des langues et linguistique informatique 2 PDF Author: Mohamed Zakaria Kurdi
Publisher: ISTE Group
ISBN: 1784051853
Category : Computational linguistics
Languages : fr
Pages : 326

Get Book Here

Book Description
Le traitement automatique des langues (TAL) est une discipline scientifique qui se trouve à l’intersection de champs tels que l’intelligence artificielle (IA), la linguistique et les sciences cognitives. Pluridisciplinaire, cet ouvrage fournit les clés pour comprendre et concevoir plusieurs types de systèmes de TAL. Parmi les nombreux sujets théoriques couverts, une attention particulière a été accordée aux théories du sens lexical, à la sémantique formelle ainsi qu’à l’analyse du discours. D’un point de vue pratique, cet ouvrage passe en revue des applications telles que les bases de données lexicales et les ontologies, la traduction automatique, la recherche d’information ainsi que l’extraction d’informations, d’opinions et de sentiments à partir de grandes masses de données. Sont également abordées les architectures des systèmes de TAL (linguiciels) en relation avec les modèles cognitifs ainsi que les différentes approches d’évaluation de ces systèmes.

Modélisation d'une terminologie médicale en langue arabe à des fins de médiation, d'extraction et de recherche d'information

Modélisation d'une terminologie médicale en langue arabe à des fins de médiation, d'extraction et de recherche d'information PDF Author: Khadija El Bouchikhi
Publisher:
ISBN:
Category :
Languages : fr
Pages : 472

Get Book Here

Book Description
Notre objectif, dans le cadre de ce projet de thèse, est la proposition d'un modèle terminologique à des fins d'extraction, de recherche d'information et de médiation dans un contexte multilingue. Le contexte multilingue a été choisi pour répondre aux besoins des utilisateurs dans la diffusion et la structuration de l'information spécialisée dans le domaine médical en langue arabe. Etant donnée la difficulté de traitement automatique de la terminologie médicale en langue arabe morphologiquement et/ou sémantiquement, nous avons voulu aborder ces problématiques en nous appuyant sur ce qui était déjà fait en Anglais, une autre langue qui connaît des avancées en TALN. Nous nous sommes focalisés sur le champ sémantique et pour ce faire, nous nous sommes appuyés sur la catégorisation sémantique internationale de l'UMLS. L'idée principale du projet est de refléter l'importance du rôle de l'outil terminologique dans les recherches en sciences de l'information et de la communication qui accorde plus d'importance à l'outil thésaurique qu'à l'outil terminologique au niveau de la structuration de l'information. Les résultats de notre expérience ont été satisfaisants étant donné les difficultés rencontrées au cours de l'évolution de notre projet. Ces difficultés étaient liées au manque de la documentation spécialisée en langue arabe, et d'outils permettant à la terminologie de s'appliquer dans le contexte d'un SRI. Nous avons constitué quelques échantillons de ces outils afin de consolider notre idée sur le plan pratique. Nos résultats ont été concrétisés par la proposition de deux méthodologies au niveau de la recherche de l'information, i) une méthodologie de reformulation des requêtes et ii) une autre en structuration de l'information au niveau de l'indexation. Et d'autres prometteuses, au niveau de l'acquisition des connaissances, nous avons exploré l'alignement phrastique pour but d'extraction des termes médicaux en langue arabe, et nous avons suggéré de considérer l'outil terminologique comme élément de médiation afin d'améliorer la communication spécialisée. Nous avons ainsi constaté à travers l'évolution de notre projet le rôle primordial de l'outil terminologique pour l'amélioration des recherches documentaires spécialisées en langue arabe et de façon générale, son rôle important dans le traitement de l'information dans le domaine médical

Traitement automatique des langues pour la recherche d'information

Traitement automatique des langues pour la recherche d'information PDF Author: Christian Jacquemin
Publisher:
ISBN: 9782746202252
Category : Information retrieval
Languages : en
Pages : 264

Get Book Here

Book Description


Le traitement automatique des Langues

Le traitement automatique des Langues PDF Author: Pirmin Lemberger
Publisher: Dunod
ISBN: 2100811509
Category : Computers
Languages : fr
Pages : 336

Get Book Here

Book Description
Le traitement automatique du langage est une branche importante de l'intelligence artificielle et du machine learning dont l'objectif est de parvenir à "comprendre" et analyser des textes afin d'en extraire des connaissances sans intervention humaine. Les champs d'application sont à la fois très variés et très vastes (traduction instantanée en plusieurs langues, commandes vocales, agents conversationnels, analyse de CV, veille économique...). Cet ouvrage dresse un état de l'art de cette discipline, en explique les bases théoriques et informatiques, les approches linguistiques classiques et les approches statistiques plus modernes. L'exemple de l'analyse des suggestions rassemblées lors du Grand débat national à l'aide de ces méthodes d'IA sert d'illustration.

Les Ambiguïtés de la Langue Arabe Pour Un Traitement Automatique

Les Ambiguïtés de la Langue Arabe Pour Un Traitement Automatique PDF Author: BAUDOUIN-J.
Publisher: Omniscriptum
ISBN: 9786131554278
Category : Arabic language
Languages : fr
Pages : 360

Get Book Here

Book Description
Ce travail est une m thodologie de lev e d'ambigu t s. Il comprend ainsi une typologie des ambigu t s et propose les bases d'une th orie lexicale, qui partir d'une syntaxe lexicale, propre chaque lexie, cr e des mod les syntaxiques. Nous d finissons diff rents types d'ambigu t s allant de la graphie et jusqu'au paradigme. La d finition de telles ambigu t s et leurs solutions visent la voyellation. Nous analysons ces ambigu t s pour les diff rentes cat gories lexicales, nom, verbe, pr position et pour toutes les affixations que ces cat gories peuvent avoir. Une telle analyse m ne la d finition de tous les affixes et leur attribue ainsi leurs propres cat gories syntaxiques; cette recherche peut aboutir la cr ation de mod les syntaxiques, qui peuvent accompagner les lexies dans leurs entr es dictionnairiques. Apr s attribution des fonctions grammaticales chacun des l ments composant cette syntaxe, nous parviendrons la repr sentation des mod les grammaticaux propres chaque lexie et en fonction de ses voisins. Nous identifions les paradigmes auxquels peuvent se r f rer les lexies tudi es. Cette identification doit attribuer la voyellation interne de toute la lexie

Analyse linguistique et extraction automatique de relations sémantiques des textes en arabe

Analyse linguistique et extraction automatique de relations sémantiques des textes en arabe PDF Author: Youcef Ihab Morsi
Publisher:
ISBN:
Category :
Languages : fr
Pages : 167

Get Book Here

Book Description
Cette recherche porte sur le développement d'un outil de traitement automatique de la langue arabe standard moderne, au niveau morphologique et sémantique, avec comme objectif final l'extraction d'information dans le domaine de l'innovation technologique en entreprise. En ce qui concerne l'analyse morphologique, notre outil comprend plusieurs traitements successifs qui permettent d'étiqueter et de désambiguïser les occurrences dans les textes : une couche morphologique (Gibran 1.0), qui s'appuie sur les schèmes arabes comme traits distinctifs ; une couche contextuelle (Gibran 2.0), qui fait appel à des règles contextuelles ; et une troisième couche (Gibran 3.0) qui fait appel à un modèle d'apprentissage automatique. Notre méthodologie est évaluée sur le corpus annoté Arabic-PADT UD treebank. Les évaluations obtiennent une F-mesure de 0,92 et 0,90 pour les analyses morphologiques. Ces expérimentations montrent, entre autres, la possibilité d'améliorer une telle ressource par les analyses linguistiques. Cette approche nous a permis de développer un prototype d'extraction d'information autour de l'innovation technologique pour la langue arabe. Il s'appuie sur l'analyse morphologique et des patrons syntaxico-sémantiques. Cette thèse s'inscrit dans un parcours docteur-entrepreneur.

Traitement Automatique Du Langage Naturel

Traitement Automatique Du Langage Naturel PDF Author: Source Wikipedia
Publisher: University-Press.org
ISBN: 9781230696171
Category :
Languages : en
Pages : 44

Get Book Here

Book Description
Ce contenu est une compilation d'articles de l'encyclopedie libre Wikipedia. Pages: 42. Chapitres: Linguistique informatique, Traduction de langues distribuee, Recherche d'information, Analyse semantique latente, Racinisation, Synthese vocale, Simplification de textes, Reconnaissance vocale, Reconnaissance de l'ecriture manuscrite, Corpus, Lexical markup framework, Traduction vocale quasi-instantanee, SixthSense, Modele booleen, Generation automatique de textes, Watson, Synapse Developpement, Entites nommees, TF-IDF, Resume automatique de texte, Generateur automatique de phrases, N-gramme, Modele vectoriel, Evaluation des systemes de transcription enrichie d'emissions radiophoniques, Modele probabiliste de pertinence, George Armitage Miller, Tagmatica, Extraction terminologique, Browsealoud, SpeechMagic, Lemmatisation, Linguatec, Similarite cosinus, Sac de mots, Table de radotage, Association pour le traitement automatique des langues, Taux d'erreur de mots, Etiquetage grammatical, Retour de pertinence, Michel Lenoble, Text REtrieval Conference, Icophone, PROMT, Druide informatique, Lexique des formes flechies du francais, Powerset, Architecture de transfert, Okapi BM25. Extrait: Abregee en RI ou IR (Information Retrieval en anglais), la recherche d'information est la science qui etudie la maniere de repondre pertinemment a une requete en retrouvant de l'information dans un corpus. Celui-ci est composes de documents d'une ou plusieurs bases de donnees, qui sont decrits par un contenu ou les metadonnees associees. Les bases de donnees peuvent etre relationnelles ou non structurees, telles celles mises en reseau par des liens hypertexte comme dans le World Wide Web, l'internet et les intranets. Le contenu des documents peut etre du texte, des sons, ses images ou des donnees. La recherche d'information est un domaine historiquement lie aux sciences de l'information et a la bibliotheconomie qui visent a representer...