Reconnaissance Automatique de La Langue Arabe En Utilisant Le Systeme

Reconnaissance Automatique de La Langue Arabe En Utilisant Le Systeme PDF Author: Hassan Satori
Publisher: Omniscriptum
ISBN: 9783841628190
Category :
Languages : fr
Pages : 136

Get Book Here

Book Description
Ce travail, est une contribution au traitement Automatique de la Parole, dans lequel nous avons etudie et realise un systeme de reconnaissance automatique de la parole en utilisant un environnement base entierement sur la langue arabe (base de donnees audio, base de donnees texte, transcriptions, affichage de resultat, etc.). Dans le but d'etudier les parametres les mieux adaptes a la langue arabe nous avons developpe un systeme de reference a base des modeles de Markov caches pour la reconnaissance de la parole continue. Le systeme est constitue de modeles phonetiques dependants du contexte, il a ete mis au point avec la plate-forme Sphinx4 a travers la modification et la construction de nouveaux outils appropries a la langue arabe. Le systeme, a ete teste pour differents locuteurs dans le but d'evaluer ses performances. Les resultats de tests de reconnaissances sont satisfaisants. La realisation du systeme a ete faite avec succes."

Reconnaissance Automatique de La Langue Arabe En Utilisant Le Systeme

Reconnaissance Automatique de La Langue Arabe En Utilisant Le Systeme PDF Author: Hassan Satori
Publisher: Omniscriptum
ISBN: 9783841628190
Category :
Languages : fr
Pages : 136

Get Book Here

Book Description
Ce travail, est une contribution au traitement Automatique de la Parole, dans lequel nous avons etudie et realise un systeme de reconnaissance automatique de la parole en utilisant un environnement base entierement sur la langue arabe (base de donnees audio, base de donnees texte, transcriptions, affichage de resultat, etc.). Dans le but d'etudier les parametres les mieux adaptes a la langue arabe nous avons developpe un systeme de reference a base des modeles de Markov caches pour la reconnaissance de la parole continue. Le systeme est constitue de modeles phonetiques dependants du contexte, il a ete mis au point avec la plate-forme Sphinx4 a travers la modification et la construction de nouveaux outils appropries a la langue arabe. Le systeme, a ete teste pour differents locuteurs dans le but d'evaluer ses performances. Les resultats de tests de reconnaissances sont satisfaisants. La realisation du systeme a ete faite avec succes."

Approche hybride pour la reconnaissance automatique de la parole en langue arabe

Approche hybride pour la reconnaissance automatique de la parole en langue arabe PDF Author: Abir Masmoudi Dammak
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
Le développement d'un système de reconnaissance de la parole exige la disponibilité d'une grande quantité de ressources à savoir, grands corpus de texte et de parole, un dictionnaire de prononciation. Néanmoins, ces ressources ne sont pas disponibles directement pour des dialectes arabes. De ce fait, le développement d'un SRAP pour les dialectes arabes se heurte à de multiples difficultés à savoir, l''abence de grandes quantités de ressources et l'absence d''une orthographe standard vu que ces dialectes sont parlés et non écrit. Dans cette perspective, les travaux de cette thèse s'intègrent dans le cadre du développement d'un SRAP pour le dialecte tunisien. Une première partie des contributions consiste à développer une variante de CODA (Conventional Orthography for Arabic Dialectal) pour le dialecte tunisien. En fait, cette convention est conçue dans le but de fournir une description détaillée des directives appliquées au dialecte tunisien. Compte tenu des lignes directives de CODA, nous avons constitué notre corpus nommé TARIC : Corpus de l'interaction des chemins de fer de l'arabe tunisien dans le domaine de la SNCFT. Outre ces ressources, le dictionnaire de prononciation s'impose d'une manière indispensable pour le développement d'un SRAP. À ce propos, dans la deuxième partie des contributions, nous visons la création d'un système nommé conversion (Graphème-Phonème) G2P qui permet de générer automatiquement ce dictionnaire phonétique. Toutes ces ressources décrites avant sont utilisées pour adapter un SRAP pour le MSA du laboratoire LIUM au dialecte tunisien dans le domaine de la SNCFT. L'évaluation de notre système donné lieu WER de 22,6% sur l'ensemble de test.

Contribution à l'étude et à la reconnaissance automatique de la parole en Arabe standard

Contribution à l'étude et à la reconnaissance automatique de la parole en Arabe standard PDF Author: Mahieddine Djoudi
Publisher:
ISBN:
Category :
Languages : fr
Pages :

Get Book Here

Book Description
La reconnaissance automatique de la parole continue pose un certain nombre de problèmes. Les caractéristiques phonétiques et linguistiques de la langue sont largement impliquées dans le processus. Ce travail consiste à présenter une contribution à la reconnaissance automatique de l'arabe standard. Nous avons d'abord effectué une étude phonétique de la langue basée essentiellement sur l'examen de spectrogrammes de mots et de phrases en tenant compte des différents contextes de production des phénomènes. Cette étude nous a permis de définir les caractéristiques acoustiques des phénomènes nécessaires au système de reconnaissance. Ensuite, nous avons réalisé un système de décodage acoustico-phonétique, baptise sapha (systeme acoustico-phonétique de l'arabe) qui reçoit en entrée le signal de parole d'une phrase et retourne comme résultat un treillis de phonèmes. Les principales étapes du système sont: la segmentation du signal de parole en grandes classes phonétiques (voyelles, plosives, fricatives et sonnantes); l'extraction des indices phonétiques utilisés en reconnaissance; l'étiquetage des segments utilisant un systeme à base de règles de production. Les méthodes utilisées ont été adaptées du système aphodex développé dans notre équipe pour le décodage phonétique du français. L'évaluation des performances du systeme a été effectuée à partir de l'étiquetage manuel des phrases phonétiquement équilibrées du corps djouma que nous avons constitué. Enfin, nous avons développé quelques idées pour la conception d'un systeme de reconnaissance de phrases en arabe (mars) intégrant le décodeur phonétique et nous avons soulevé les problèmes d'ordre morphologique, phonologique, syntaxique et prosodique qu'il faut résoudre.

Reconnaissance et correction des erreurs dans les textes arabes

Reconnaissance et correction des erreurs dans les textes arabes PDF Author: Toufik Sari
Publisher: Univ Europeenne
ISBN: 9783841674661
Category :
Languages : fr
Pages : 264

Get Book Here

Book Description
Le langage est un moyen utilise pour communiquer des idees par la parole, ou tout autres signes expressifs, tandis que l'ecriture constitue l'acte de prescrire ces idees dans le but de les enregistrer. Vu que l'ecriture est une transcription de la langue, les systemes de reconnaissance de l'ecriture doivent imperativement integrer les traitements lies a la langue. Reconnaissance et correction doivent cooperer afin de prendre les bonnes decisions exploitant les connaissances linguistiques et contextuelles. La correction des erreurs de reconnaissance fait partie du processus de prise de decision vu le caractere pluridisciplinaire de ses techniques. La reconnaissance de l'ecriture Arabe n'emploie pas encore des dictionnaires electroniques, statistiques d'utilisation des elements de la langue et de verificateurs orthographiques. Ainsi, nous visons le developpement d'un systeme de reconnaissance automatique des textes arabes non contraint. Nous combinons les connaissances de la langue arabe avec les connaissances contextuelles des erreurs de reconnaissance. Les experimentations effectuees demontrent les performances de notre demarche et ouvrent une voie de recherche tres interessante.

Reconnaissance et traduction automatique de la parole de vidéos arabes et dialectales

Reconnaissance et traduction automatique de la parole de vidéos arabes et dialectales PDF Author: Mohamed Amine Menacer
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
Les travaux de recherche ont été développés dans le cadre du projet AMIS (Access to Multilingual Information and opinionS) dont l'objectif principal est de développer un système d'aide à la compréhension de vidéos dans des langues étrangères en générant un résumé automatique de ces dernières dans une langue compréhensible par l'utilisateur. Dans le cadre de cette thèse, nous nous sommes concentrés sur la reconnaissance et la traduction automatique de la parole de vidéos arabes et dialectales. Les approches statistiques proposées dans la littérature pour la reconnaissance automatique de la parole (RAP) sont indépendantes de la langue et elles sont applicables à l'arabe standard. Cependant, cette dernière présente quelques caractéristiques que nous devons prendre en considération afin de booster les performances du système de RAP. Parmi ces caractéristiques on peut citer l'absence de l'indication des voyelles dans le texte ce qui rend difficile leur apprentissage par le modèle acoustique. Nous avons proposé plusieurs approches de modélisation acoustique et/ou de langage afin de mieux reconnaître la parole arabe. L'arabe standard n'est pas la langue maternelle, c'est pourquoi dans les conversations quotidiennes, on utilise le dialecte, un arabe inspiré de l'arabe standard, mais pas seulement. Nous avons travaillé sur l'adaptation du système développé pour l'arabe standard au dialecte algérien qui est l'une des variantes de la langue arabe les plus difficiles à reconnaître par les systèmes de RAP. Cela est dû aux mots empruntés d'autres langues, au code-switching et au manque de ressources. Notre proposition pour remédier à ces problèmes est de tirer profit des données orales et textuelles d'autres langues impactant le dialecte. Le texte résultant de la RAP arabe a été utilisé pour la traduction automatique (TA). Nous avons réalisé dans un premier temps une étude comparative entre l'approche statistique à base de segments et l'approche neuronale utilisées dans le cadre de la TA. Ensuite, nous nous sommes intéressés à l'adaptation de ces deux approches pour traduire le texte code-switché. Notre étude portait sur le mélange de l'arabe et de l'anglais dans des documents officiels des nations unies. Pour pallier les différents problèmes dus à la propagation des erreurs dans le système séquentiel, nous avons travaillé sur l'adaptation du vocabulaire du système de RAP et sur la proposition d'une nouvelle modélisation permettant la traduction directe de la parole.

Traitements linguistiques pour la reconnaissance automatique de la parole appliquée à la langue arabe

Traitements linguistiques pour la reconnaissance automatique de la parole appliquée à la langue arabe PDF Author: Rahma Boujelbane Jarraya
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
Les différents dialectes de la langue arabe (DA) présentent de grandes variations phonologiques, morphologiques, lexicales et syntaxiques par rapport à la langue Arabe Standard Moderne (MSA). Jusqu'à récemment, ces dialectes n'étaient présents que sous leurs formes orales et la plupart des ressources existantes pour la langue arabe se limite à l'Arabe Standard (MSA), conduisant à une abondance d'outils pour le traitement automatique de cette variété. Étant donné les différences significatives entre le MSA et les DA, les performances de ces outils s'écroulent lors du traitement des DA. Cette situation conduit à une augmentation notable de l'ambiguïté dans les approches computationnelles des DA. Les travaux décrits dans cette thèse s'inscrivent dans ce cadre à travers la modélisation de l'oral parlé dans les médias tunisiens. Cette source de données contient une quantité importante d'Alternance Codique (AC) entre la langue normative MSA et le dialecte parlé en Tunisie (DT). La présence de ce dernier d'une manière désordonnée dans le discours pose une sérieuse problématique pour le Traitement Automatique de Langue et fait de cet oral une langue peu dotée. Toutefois, les ressources nécessaires pour modéliser cet oral sont quasiment inexistantes. Ainsi, l'objectif de cette thèse consiste à pallier ce manque afin de construire un modèle de langage dédié à un système de reconnaissance automatique pour l'oral parlé dans les médias tunisiens. Pour ce fait, nous décrivons dans cette thèse une méthodologie de création de ressources et nous l'évaluons par rapport à une tâche de modélisation de langage. Les résultats obtenu sont encourageants.

Système d'analyse morphologique automatique de la langue arabe

Système d'analyse morphologique automatique de la langue arabe PDF Author: Mohamed Hassoun
Publisher:
ISBN:
Category :
Languages : fr
Pages : 142

Get Book Here

Book Description
REALISATION D'UN ANALYSEUR MORPHOLOGIQUE DE LA LANGUE ARABE. L'OBJECTIF PREMIER ETAIT DE TRANSFORMER UN LOGICIEL EXISTANT POUR LE FRANCAIS DE MANIERE QU'IL PUISSE PRENDRE EN COMPTE LA LANGUE ARABE. LES PARTICULARITES DE LA LANGUE ARABE ET NOTAMMENT L'IMPORTANCE DE LA STRUCTURE A BASE DE CONSONNES ET LE SYSTEME DE DERIVATION QUI EN DECOULE A MONTRE QUE LE MODELE LINGUISTIQUE UTILISE POUR LE FRANCAIS NE PERMETTAIT PAS LA PRISE EN COMPTE DE L'ARABE SAUF AU PRIX DE TRAITEMENTS PUREMENT AD HOC ET ARTIFICIELS. IL EST DONC PROPOSE DANS CE TRAVAIL UN PROCEDE ORIGINAL D'ANALYSE MORPHOLOGIQUE ADAPTE A L'ARABE, FONDE SUR LE CALCUL D'UNE CHAINE DE BOOLEENS REPRESENTATIFS DE LA PRESENCE OU DE L'ABSENCE DE PROPRIETES CARACTERISTIQUES DU MOT ANALYSE. DES EXEMPLES D'ANALYSE SONT DONNES

Traduction automatique statistique de la langue arabe

Traduction automatique statistique de la langue arabe PDF Author: Haithem Afli
Publisher: Editions Universitaires Europeennes
ISBN: 9783841793225
Category :
Languages : de
Pages : 104

Get Book Here

Book Description
La mondialisation a eu des effets considerables sur l'essor de l'industrie de la langue, et plus particulierement en traduction automatique ou la demande ne cesse de croitre. Ainsi, les besoins en matiere de systemes de traduction automatique plus fiables augmentent de plus en plus. Pour cela nous sommes interesses a la conception de systemes de traduction automatique bases sur les modeles statistiques. Ce travail presente une etude et amelioration des phases d'optimisation et d'alignement d'un systeme de traduction automatique statistique pour la paire de langue arabe/anglais.

Reconnaissance automatique de l'écriture arabe manuscrite

Reconnaissance automatique de l'écriture arabe manuscrite PDF Author: Leila Chergui
Publisher: Presses Academiques Francophones
ISBN: 9783838149400
Category :
Languages : fr
Pages : 240

Get Book Here

Book Description
Le travail presente dans cet ouvrage est consacre a la conception d'une nouvelle base de mots arabes manuscrits representant des noms des communes algeriennes, et au developpement et l'evaluation d'un nouveau systeme de reconnaissance hors-ligne de mots arabes manuscrits base sur une combinaison de trois classifieurs neuronaux qui sont: un Perceptron Multi-Couches, un reseau a base de fonctions radiales et un reseau Fuzzy ART. Le systeme propose utilise une methode de reconnaissance globale. Pour cela, plusieurs etapes de pretraitement sont appliquees aux images de mots, incluant: un lissage, une normalisation, une squelettisation, un redressement et une extraction de contour. Trois types de moments geometriques ont ete utilises comme primitives, a savoir: les moments de Hu, les moments de Tchebichef et les moments de Zernike ont ete utilises; chacun d'eux a ete exploite par un classifieur neuronal different. L'evaluation du systeme de reconnaissance propose a ete menee sur deux bases de mots: IFN/ENIT et notre base nouvellement concue. Les resultats obtenus sont satisfaisant et comparable a des travaux pertinents realises dans le domaine de la reconnaissance du script arabe.

Amélioration des systèmes de traduction par analyse linguistique et thématique

Amélioration des systèmes de traduction par analyse linguistique et thématique PDF Author: Souhir Gahbiche-Braham
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
La traduction automatique des documents est considérée comme l'une des tâches les plus difficiles en traitement automatique des langues et de la parole. Les particularités linguistiques de certaines langues, comme la langue arabe, rendent la tâche de traduction automatique plus difficile. Notre objectif dans cette thèse est d'améliorer les systèmes de traduction de l'arabe vers le français et vers l'anglais. Nous proposons donc une étude détaillée sur ces systèmes. Les principales recherches portent à la fois sur la construction de corpus parallèles, le prétraitement de l'arabe et sur l'adaptation des modèles de traduction et de langue.Tout d'abord, un corpus comparable journalistique a été exploré pour en extraire automatiquement un corpus parallèle. Ensuite, différentes approches d'adaptation du modèle de traduction sont exploitées, soit en utilisant le corpus parallèle extrait automatiquement soit en utilisant un corpus parallèle construit automatiquement.Nous démontrons que l'adaptation des données du système de traduction permet d'améliorer la traduction. Un texte en arabe doit être prétraité avant de le traduire et ceci à cause du caractère agglutinatif de la langue arabe. Nous présentons notre outil de segmentation de l'arabe, SAPA (Segmentor and Part-of-speech tagger for Arabic), indépendant de toute ressource externe et permettant de réduire les temps de calcul. Cet outil permet de prédire simultanément l'étiquette morpho-syntaxique ainsi que les proclitiques (conjonctions, prépositions, etc.) pour chaque mot, ensuite de séparer les proclitiques du lemme (ou mot de base). Nous décrivons également dans cette thèse notre outil de détection des entités nommées, NERAr (Named Entity Recognition for Arabic), et nous examions l'impact de l'intégration de la détection des entités nommées dans la tâche de prétraitement et la pré-traduction de ces entités nommées en utilisant des dictionnaires bilingues. Nous présentons par la suite plusieurs méthodes pour l'adaptation thématique des modèles de traduction et de langue expérimentées sur une application réelle contenant un corpus constitué d'un ensemble de phrases multicatégoriques.Ces expériences ouvrent des perspectives importantes de recherche comme par exemple la combinaison de plusieurs systèmes lors de la traduction pour l'adaptation thématique. Il serait également intéressant d'effectuer une adaptation temporelle des modèles de traduction et de langue. Finalement, les systèmes de traduction améliorés arabe-français et arabe-anglais sont intégrés dans une plateforme d'analyse multimédia et montrent une amélioration des performances par rapport aux systèmes de traduction de base.