Construction automatique d'un dictionnaire orienté vers l'analyse morpho-syntaxique de l'arabe, écrit voyellé ou non voyellé

Construction automatique d'un dictionnaire orienté vers l'analyse morpho-syntaxique de l'arabe, écrit voyellé ou non voyellé PDF Author: Lotfi Zouari
Publisher:
ISBN:
Category :
Languages : fr
Pages : 8

Get Book Here

Book Description
Le présent travail pose le problème du traitement automatique d'une langue naturelle : l'arabe. Le but est d'appréhender la langue arabe écrite, telle qu'elle se présente, sans aucun prétraitement manuel. En premier lieu, il s'agit donc de construire automatiquement un dictionnaire, qui doit permettre l'analyse aussi bien des textes voyellés que non voyellés. En second lieu, l'analyse morphologique doit permettre la reconnaissance des unités lexicales qui composent le texte, lesquelles ne correspondent pas toujours aux entrées du dictionnaire à cause des problèmes de l'agglutination. Côté analyse syntaxique, on s'est intéressé à la levée des ambiguïtés grammaticales simplement. Elle doit en plus prendre en compte les problèmes dûs à l'agglutination.

Construction automatique d'un dictionnaire orienté vers l'analyse morpho-syntaxique de l'arabe, écrit voyellé ou non voyellé

Construction automatique d'un dictionnaire orienté vers l'analyse morpho-syntaxique de l'arabe, écrit voyellé ou non voyellé PDF Author: Lotfi Zouari
Publisher:
ISBN:
Category :
Languages : fr
Pages : 8

Get Book Here

Book Description
Le présent travail pose le problème du traitement automatique d'une langue naturelle : l'arabe. Le but est d'appréhender la langue arabe écrite, telle qu'elle se présente, sans aucun prétraitement manuel. En premier lieu, il s'agit donc de construire automatiquement un dictionnaire, qui doit permettre l'analyse aussi bien des textes voyellés que non voyellés. En second lieu, l'analyse morphologique doit permettre la reconnaissance des unités lexicales qui composent le texte, lesquelles ne correspondent pas toujours aux entrées du dictionnaire à cause des problèmes de l'agglutination. Côté analyse syntaxique, on s'est intéressé à la levée des ambiguïtés grammaticales simplement. Elle doit en plus prendre en compte les problèmes dûs à l'agglutination.

ANALYSE MORPHO-SYNTAXIQUE AUTOMATIQUE SANS DICTIONNAIRE

ANALYSE MORPHO-SYNTAXIQUE AUTOMATIQUE SANS DICTIONNAIRE PDF Author: Jacques Vergne
Publisher:
ISBN:
Category :
Languages : fr
Pages : 212

Get Book Here

Book Description
CE TRAVAIL DECRIT UN ANALYSEUR MORPHO-SYNTAXIQUE AUTOMATIQUE DU FRANCAIS ECRIT, N'UTILISANT PAS DE DICTIONNAIRE ET FONCTIONNANT AU MOYEN D'UNE METHODE STRUCTURELLE DE RECONNAISSANCE DES FORMES. LA BASE LINGUISTIQUE DE CET ANALYSEUR EST UNE CONCEPTION DE LA PHRASE ACTICULEE AUTOUR DES GROUPES NOMINAUX SIMPLES, CONSIDERES COMME ELEMENTS FONDATEURS ET CONSTITUTIFS DE CETTE PHRASE, ET EN RELATION DE DETERMINATION LES UNS AVEC LES AUTRES. CETTE CONCEPTION PERMET DE DECRIRE LA PHRCASE SOUS LA FORME D'UN ARBRE DE DETERMINATION, ET EST PARTICULIEREMENT ADAPTEE A L'ANALYSE DE TEXTES SCIENTIFIQUES. IL EST COURAMMENT ADMIS QUE LES RELATIONS DE DEPENDANCE, DE DETERMINATION ET DE COORDINATION NE PEUVENT ETRE CALCULEES QU'AVEC DES INFORMATIONS SEMANTIQUES SUR LES MOTS ET DES CONNAISSANCES SUR LE DOMAINE. CE TRAVAIL SE PROPOSE DE MONTRER QUE LA DEDUCTION DE CES RELATIONS PAR DES MOYENS PUREMENT MORPHO-SYNTAXIQUES DONNE DES RESULTATS DEJA SATISFAISANTS. CE TRAVAIL EXPLORE AINSI LES LIMITES DES MOYENS MORPHO-SYNTAXIQUES SOUVENT ABANDONNES AU PROFIT DES MOYENS SEMANTIQUES

Stratégies et règles minimales pour un traitement automatique de l'arabe

Stratégies et règles minimales pour un traitement automatique de l'arabe PDF Author: Christian Gaubert
Publisher:
ISBN:
Category :
Languages : un
Pages : 866

Get Book Here

Book Description
La théorie de la minimalité dans le traitement automatique de l'arabe développée depuis 1985 par Audebert et Jaccarini est exposée dans ses grands principes, qui visent la construction d'un moniteur morpho-syntaxique : une analyse morphologique sans lexique effectuée par des automates augmentés et reflétant un compromis entre les phénomènes de concaténation et le croisement entre racines et schèmes, le rôle syntaxique central des invariants de la morphologie qui sont des tokens syntaxiques, et la description de ce rôle par des automates variables. Un logiciel écrit en C, Sarfiyya, a été créé pour poursuivre ce travail théorique et le confronter à la réalité de corpus de textes informatisés de presse et de littérature. Il repose sur un système original d'étiquettes floues privilégiant la détermination pour le nom, le mode/aspect pour le verbe, la famille syntaxique pour les tokens. Un éditeur graphique et interactif d'automates, un analyseur d'automates augmentés par des micro-lexiques et d'autres fonctions de Sarfiyya ont permis le développement de grammaires nominales et verbales avec peu de lexique et au comportement ambigu connu : cette ambiguïté avoisine deux interprétations par mot. Un analyseur de mots-outils ou tokens complète ces outils qui utilise un contexte court pour leur désambiguïsation. L'emploi de paires de tokens, lexicalisées ou catégorisées, permettent entre autres méthodes un taux de détection élevé. Une étude de faisabilité conclue ce travail par l'analyse la détectabilité d'un système de marques minimales, telles la présence de phrases nominales, des khabars et des mubtada's, de phrases verbales, subordonnées et relatives, points de passage de toute analyse de la phrase complexe. Des procédures linéaires sont proposées pour leur détection, dans le cadre de la construction du moniteur morpho-syntaxique. Cette étude démontre la fécondité de la méthode minimale et sa validité pour diverses applications, mais aussi ses faiblesses.

Analyse morpho-syntaxique automatique et reconnaissance des entités nommées en arabe standard

Analyse morpho-syntaxique automatique et reconnaissance des entités nommées en arabe standard PDF Author: Slim Mesfar
Publisher:
ISBN:
Category :
Languages : fr
Pages : 464

Get Book Here

Book Description
La langue arabe, bien que très importante par son nombre de locuteurs, elle présente des phénomènes morpho-syntaxiques très particuliers. Cette particularité est liée principalement à sa morphologie flexionnelle et agglutinante, à l’absence des voyelles dans les textes écrits courants, et à la multiplicité de ses formes, et cela induit une forte ambiguïté lexicale et syntaxique. Il s'ensuit des difficultés de traitement automatique qui sont considérables. Le choix d'un environnement linguistique fournissant des outils puissants et la possibilité d'améliorer les performances selon nos besoins spécifiques nous ont conduit à utiliser la plateforme linguistique NooJ. Nous commençons par une étude suivie d’une formalisation à large couverture du vocabulaire de l’arabe. Le lexique construit, nommé «El-DicAr», permet de rattacher l’ensemble des informations flexionnelles, morphologiques, syntactico-sémantiques à la liste des lemmes. Les routines de flexion et dérivation automatique à partir de cette liste produisent plus de 3 millions de formes fléchies. Nous proposons un nouveau compilateur de machines à états finis en vue de pouvoir stocker la liste générée de façon optimale par le biais d’un algorithme de minimisation séquentielle et d’une routine de compression dynamique des informations stockées. Ce dictionnaire joue le rôle de moteur linguistique pour l’analyseur morpho-syntaxique automatique que nous avons implanté. Cet analyseur inclut un ensemble d’outils: un analyseur morphologique pour le découpage des formes agglutinées en morphèmes à l’aide de grammaires morphologiques à large couverture, un nouvel algorithme de parcours des transducteurs à états finis afin de traiter les textes écrits en arabe indépendamment de leurs états de voyellation, un correcteur des erreurs typographiques les plus fréquentes, un outil de reconnaissance des entités nommées fondé sur une combinaison des résultats de l’analyse morphologique et de règles décrites dans des grammaires locales présentées sous forme de réseaux augmentés de transitions (ATNs), ainsi qu’un annotateur automatique et des outils pour la recherche linguistique et l’exploration contextuelle. Dans le but de mettre notre travail à la disposition de la communauté scientifique, nous avons développé un service de concordances en ligne «NooJ4Web: NooJ pour la Toile» permettant de fournir des résultats instantanés à différents types de requêtes et d’afficher des rapports statistiques ainsi que les histogrammes correspondants. Les services ci-dessus cités sont offerts afin de recueillir les réactions des divers usagers en vue d’une amélioration des performances. Ce système est utilisable aussi bien pour traiter l’arabe, que le français et l’anglais

Méthodes d'apprentissage pour l'analyse morphosyntaxique, expérimentées dans le cas de l'arabe et du français

Méthodes d'apprentissage pour l'analyse morphosyntaxique, expérimentées dans le cas de l'arabe et du français PDF Author: Yahya Hlal (auteur d'une thèse de sciences.)
Publisher:
ISBN:
Category :
Languages : fr
Pages : 285

Get Book Here

Book Description


La conception et la réalisation d'un système d'analyse morpho-syntaxique robuste pour l'arabe

La conception et la réalisation d'un système d'analyse morpho-syntaxique robuste pour l'arabe PDF Author: Riadh Ouersighni
Publisher:
ISBN:
Category :
Languages : fr
Pages : 266

Get Book Here

Book Description
Cette thèse s'inscrit dans le cadre du traitement automatique du langage naturel (TALN). Elle concerne la conception et la réalisation effective d'un noyau d système d'analyse morpho-syntaxique robuste de l'arabe de grandeur réelle, qui puisse être utilisé dans les applications à grande échelle. Baptisé AraParse (Arabic Parser). AraParse est basé sur des ressources linguistiques (lexiques et grammaires) à large couverture et permet de traiter de l'arabe voyellé, non-voyellé ou partiellement voyellé. La thèse présente tout d'abord les problèmes posés par l'analyse morphologique, l'analyse syntaxique et l'intégration de ces deux types d'analyse dans un système opérationnel. Le système réalisé, baptisé AraParse, conçu suivant une architecture modulaire, permet un traitement des textes arabes voyellés, non voyellés et partiellement voyellés et utilise des ressources linguistiques (lexiques et grammaires) à large couverture. Nous aborderons ensuite le problème de la robustesse du système. la robustesse caractérise la capacité de l'analyseur à produire un résultat satisfaisant même devant une situation inattendue. Nous avons adopté une démarche tolérante basée sur la distinction entre le noyau et la périphérie de la grammaire. Le noyau décrit des propriétés essentielles de la langue. La périphérie englobe l'ensemble des phénomènes extra-linguistiques. Notre objectif est aussi de concevoir un système qui peut être réutilisé dans d'autre application. La vérification grammaticale en est une. Le système AraCheck, directement déduit de AraParse permet la détection et le diagnostic des fautes d'accord en arabe. Il est basé sur une approche tolérante par une analyse complète en un seul passage, par relâchement de contrainte au niveau des règles de contrôle de la grammaire

Développement d'un système automatique de synthèse de la parole à partir du texte arabe standard voyellé

Développement d'un système automatique de synthèse de la parole à partir du texte arabe standard voyellé PDF Author: Sofiane Baloul
Publisher:
ISBN:
Category :
Languages : fr
Pages : 322

Get Book Here

Book Description
Le travail de cette thèse est une contribution à l'étude et au développement d'un système de synthèse de la parole à partir du texte arabe standard voyellé basé sur le diphone. Cette contribution intervient à différents niveaux de ce système : construction de la base acoustique, analyse syntaxique, conversion graphème-phonème et génération de la prosodie. L'analyse morpho-syntaxique implémentée repose sur l'utilisation d'un lexique partiel, l'étiquetage par défaut et la propagation de déductions contextuelles. Elle permet le découpage du texte en tronçons (intermédiaires entre le mot et la phrase) non récursifs. L'interface syntaxe-prosodie permet ensuite de distribuer les pauses et de générer les paramètres prosodiques de hauteur et de durée. L'ensemble de ces traitements est intégré dans le système multilingue de synthèse de la parole à partir du texte de la société Elan Speech.

CONCEPTION D'UN DICTIONNAIRE POUR LE TRAITEMENT AUTOMATIQUE DE LA LANGUE ARABE DANS DIFFERENTS CONTEXTES D'APPLICATION

CONCEPTION D'UN DICTIONNAIRE POUR LE TRAITEMENT AUTOMATIQUE DE LA LANGUE ARABE DANS DIFFERENTS CONTEXTES D'APPLICATION PDF Author: Mohamed Hassoun
Publisher:
ISBN:
Category :
Languages : fr
Pages : 295

Get Book Here

Book Description
LE DICTIONNAIRE EST CONCU POUR LE TRAITEMENT AUTOMATIQUE DE L'ARABE DANS LE CADRE DU PROGRAMME DE RECHERCHE SAMIA (SYNTHESE ET ANALYSE MORPHOLOGIQUES INFORMATISEES DE L'ARABE). PARTANT DU MODELE LINGUISTIQUE CONCU PAR LE PROGRAMME SAMIA (TRAITS MORPHOLOGIQUES, REGLES DE CONTEXTUALISATION), ON A CHERCHE A DEFINIR UNE STRUCTURATION DES DONNEES PERMETTANT LA CONSTITUTION D'UN DICTIONNAIRE UTILISABLE DANS LES DEUX CONTEXTES DE L'ANALYSE ET DE LA SYNTHESE MORPHOLOGIQUES. ON EXAMINE LES CONDITIONS DE CONSULTATION ET D'EXPLOITATION DU DICTIONNAIRE AINSI QUE SON IMPLEMENTATION SUR LE SGBD RELATIONNEL INFORMIX

L'ANALYSE AUTOMATIQUE DETERMINISTE DE L'ARABE NON-VOCALISE

L'ANALYSE AUTOMATIQUE DETERMINISTE DE L'ARABE NON-VOCALISE PDF Author: ALAA EL-DIN.. MOHAMED
Publisher:
ISBN:
Category :
Languages : fr
Pages :

Get Book Here

Book Description
LA LANGUE ARABE A UNE FORTE STRUCTURE SYNTAXIQUE CARACTERISEE PAR LE NOMBRE IMPORTANT DE COMBINAISONS D'UNITES LEXICALES, AU NIVEAU DE LA PHRASE. CELA CONDUIT A DES AMBIGUITES REMARQUABLES SOUS LA FORME ECRITE NON VOYELLEE. CES AMBIGUITES CONDUISENT A MULTIPLIER LES DIFFICULTES DE L'ANALYSE DE CETTE FORME. AINSI LA QUESTION SUIVANTE SE POSE: PEUT-ON ANALYSER LA FORME NON VOYELLEE D'UNE FACON DETERMINISTE? LE PRESENT TRAVAIL ESSAIE DE FOURNIR UNE REPONSE A CETTE QUESTION, EN S'ADRESSANT A UN ANALYSEUR DETERMINISTE QUI A RECOURS A LA SYNTAXE ET LA SEMANTIQUE A LA FOIS

Conception d'un dictionnaire pour le traitement automatique de l'arabe dans différents contextes d'application

Conception d'un dictionnaire pour le traitement automatique de l'arabe dans différents contextes d'application PDF Author: Mohamed Hassoun
Publisher:
ISBN:
Category :
Languages : fr
Pages : 277

Get Book Here

Book Description