Développement d'un système automatique de synthèse de la parole à partir du texte arabe standard voyellé

Développement d'un système automatique de synthèse de la parole à partir du texte arabe standard voyellé PDF Author: Sofiane Baloul
Publisher:
ISBN:
Category :
Languages : fr
Pages : 322

Get Book Here

Book Description
Le travail de cette thèse est une contribution à l'étude et au développement d'un système de synthèse de la parole à partir du texte arabe standard voyellé basé sur le diphone. Cette contribution intervient à différents niveaux de ce système : construction de la base acoustique, analyse syntaxique, conversion graphème-phonème et génération de la prosodie. L'analyse morpho-syntaxique implémentée repose sur l'utilisation d'un lexique partiel, l'étiquetage par défaut et la propagation de déductions contextuelles. Elle permet le découpage du texte en tronçons (intermédiaires entre le mot et la phrase) non récursifs. L'interface syntaxe-prosodie permet ensuite de distribuer les pauses et de générer les paramètres prosodiques de hauteur et de durée. L'ensemble de ces traitements est intégré dans le système multilingue de synthèse de la parole à partir du texte de la société Elan Speech.

Développement d'un système automatique de synthèse de la parole à partir du texte arabe standard voyellé

Développement d'un système automatique de synthèse de la parole à partir du texte arabe standard voyellé PDF Author: Sofiane Baloul
Publisher:
ISBN:
Category :
Languages : fr
Pages : 322

Get Book Here

Book Description
Le travail de cette thèse est une contribution à l'étude et au développement d'un système de synthèse de la parole à partir du texte arabe standard voyellé basé sur le diphone. Cette contribution intervient à différents niveaux de ce système : construction de la base acoustique, analyse syntaxique, conversion graphème-phonème et génération de la prosodie. L'analyse morpho-syntaxique implémentée repose sur l'utilisation d'un lexique partiel, l'étiquetage par défaut et la propagation de déductions contextuelles. Elle permet le découpage du texte en tronçons (intermédiaires entre le mot et la phrase) non récursifs. L'interface syntaxe-prosodie permet ensuite de distribuer les pauses et de générer les paramètres prosodiques de hauteur et de durée. L'ensemble de ces traitements est intégré dans le système multilingue de synthèse de la parole à partir du texte de la société Elan Speech.

Modélisation de la prosodie pour la synthèse de la parole arabe standard à partir du texte

Modélisation de la prosodie pour la synthèse de la parole arabe standard à partir du texte PDF Author: Ahmed Zaki
Publisher:
ISBN:
Category :
Languages : fr
Pages : 192

Get Book Here

Book Description
Dans ce mémoire, nous proposons d'aborder le traitement de la prosodie afin d'améliorer le naturel d'un système de synthèse de la parole arabe standard à partir du texte. D'une manière générale, la qualité de synthèse est principalement mesurée par l'intelligibilité et le naturel de la parole. L'intelligibilité dépend essentiellement de la technique et de la méthode de synthèse utilisées. Le naturel est quant à lui il est associé en grande partie à l'aspect prosodique de la langue étudiée. De point de vue acoustique, la prosodie est définie par les variations de la fréquence fondamentale (intonation), la durée segmentale (rythme) et l'intensité. Ce mémoire traite de la modélisation des variations de la fréquence fondamentale et de la durée segmentale de la langue arabe standard. Nous avons proposé deux approches différentes pour la génération automatique de la prosodie. La première approche consistait en l'utilisation des réseaux de neurones pour l'apprentissage automatique. Deux modèles ont ainsi été élaborés. Le premier est dédié à la synthèse des contours intonatifs. Le deuxième est consacré à la prédiction de la durée segmentale. D'après les résultats expérimentaux, l'approche neuronale s'avère plus adaptée à la modélisation de la durée segmentale. C'est ainsi que nous avons proposé l'étude d'une autre approche pour la génération automatique des variations de la fréquence fondamentale. La deuxième approche proposée dans ce mémoire s'est articulée autour du développement d'un modèle intonatif fondé sur l'approche phonologique. Cette dernière permet la compréhension du mécanisme de génération de la prosodie à partir d'une représentation symbolique. Cette compréhension se manifeste par les règles employées sur le plan phonologique et sur le plan phonétique. Les règles utilisées dans le module phonologique sont fondées essentiellement sur un algorithme d'accentuation "standard". Ce dernier représente le noyau des règles tonales qui sont employées dans le module phonétique. Malgré l'aspect approximatif du modèle phonétique, les phrases de synthèse générées avec les contours intonatifs du modèle proposé ont été jugées perceptivement équivalentes aux phrases générées avec les contours intonatifs estimés de la parole naturelle.

Contribution à l'étude et à la reconnaissance automatique de la parole en Arabe standard

Contribution à l'étude et à la reconnaissance automatique de la parole en Arabe standard PDF Author: Mahieddine Djoudi
Publisher:
ISBN:
Category :
Languages : fr
Pages :

Get Book Here

Book Description
La reconnaissance automatique de la parole continue pose un certain nombre de problèmes. Les caractéristiques phonétiques et linguistiques de la langue sont largement impliquées dans le processus. Ce travail consiste à présenter une contribution à la reconnaissance automatique de l'arabe standard. Nous avons d'abord effectué une étude phonétique de la langue basée essentiellement sur l'examen de spectrogrammes de mots et de phrases en tenant compte des différents contextes de production des phénomènes. Cette étude nous a permis de définir les caractéristiques acoustiques des phénomènes nécessaires au système de reconnaissance. Ensuite, nous avons réalisé un système de décodage acoustico-phonétique, baptise sapha (systeme acoustico-phonétique de l'arabe) qui reçoit en entrée le signal de parole d'une phrase et retourne comme résultat un treillis de phonèmes. Les principales étapes du système sont: la segmentation du signal de parole en grandes classes phonétiques (voyelles, plosives, fricatives et sonnantes); l'extraction des indices phonétiques utilisés en reconnaissance; l'étiquetage des segments utilisant un systeme à base de règles de production. Les méthodes utilisées ont été adaptées du système aphodex développé dans notre équipe pour le décodage phonétique du français. L'évaluation des performances du systeme a été effectuée à partir de l'étiquetage manuel des phrases phonétiquement équilibrées du corps djouma que nous avons constitué. Enfin, nous avons développé quelques idées pour la conception d'un systeme de reconnaissance de phrases en arabe (mars) intégrant le décodeur phonétique et nous avons soulevé les problèmes d'ordre morphologique, phonologique, syntaxique et prosodique qu'il faut résoudre.

synthèse de la parole arabe

synthèse de la parole arabe PDF Author: Safa Nasser Eldin
Publisher:
ISBN:
Category :
Languages : fr
Pages : 174

Get Book Here

Book Description
Le travail décrit dans ce mémoire porte sur la modélisation de l'intonation. Le but de cette modélisation est d'améliorer le naturel de la parole produite par un système de synthèse de la parole arabe à partir du texte. Le naturel de la parole est fortement influencé par les paramètres prosodiques que sont l'intonation, l'intensité et le rythme. Dans cette étude nous nous intéressons essentiellement à l'analyse de l'intonation en vue d'obtenir des modèles intonatifs concernant l'intonation des phrases affirmatives et interrogatives, verbales et nominales. Nous procédons par une analyse descriptive de l'intonation, suivie d'une modélisation de variations de fréquence fondamentale. Nous avons utilisé la méthode de stylisation issue de l'école hollandaise et la méthode d'analyse par synthèse pour modéliser l'intonation. Nous aboutissons à une formalisation des règles pour le calcul des contours intonatifs qui dépend du nombre et le type de syllabes qui constituent la phrase et sa modalité.Le modèle intonatif est implémenté au niveau de deux systèmes de synthèse de la parole arabe à partir du texte : système de synthèse par règle utilisant le synthétiseur par formants (KLATT) et système de synthèse concaténation utilisant les diphones. Les phrases synthétisées avec les modèles sont évaluées par un groupe d'étudiants palestiniens de l'université Alquds. Les résultats obtenus montrent que le modèle d'intonation développé est capable de produire une parole de synthèse proche du naturel sans l'utilisation d'un analyseur syntaxique.

Approche hybride pour la reconnaissance automatique de la parole en langue arabe

Approche hybride pour la reconnaissance automatique de la parole en langue arabe PDF Author: Abir Masmoudi Dammak
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
Le développement d'un système de reconnaissance de la parole exige la disponibilité d'une grande quantité de ressources à savoir, grands corpus de texte et de parole, un dictionnaire de prononciation. Néanmoins, ces ressources ne sont pas disponibles directement pour des dialectes arabes. De ce fait, le développement d'un SRAP pour les dialectes arabes se heurte à de multiples difficultés à savoir, l''abence de grandes quantités de ressources et l'absence d''une orthographe standard vu que ces dialectes sont parlés et non écrit. Dans cette perspective, les travaux de cette thèse s'intègrent dans le cadre du développement d'un SRAP pour le dialecte tunisien. Une première partie des contributions consiste à développer une variante de CODA (Conventional Orthography for Arabic Dialectal) pour le dialecte tunisien. En fait, cette convention est conçue dans le but de fournir une description détaillée des directives appliquées au dialecte tunisien. Compte tenu des lignes directives de CODA, nous avons constitué notre corpus nommé TARIC : Corpus de l'interaction des chemins de fer de l'arabe tunisien dans le domaine de la SNCFT. Outre ces ressources, le dictionnaire de prononciation s'impose d'une manière indispensable pour le développement d'un SRAP. À ce propos, dans la deuxième partie des contributions, nous visons la création d'un système nommé conversion (Graphème-Phonème) G2P qui permet de générer automatiquement ce dictionnaire phonétique. Toutes ces ressources décrites avant sont utilisées pour adapter un SRAP pour le MSA du laboratoire LIUM au dialecte tunisien dans le domaine de la SNCFT. L'évaluation de notre système donné lieu WER de 22,6% sur l'ensemble de test.

Synthèse paramétrique de la parole Arabe

Synthèse paramétrique de la parole Arabe PDF Author: Amal Houidhek
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
Cette thèse porte sur l'adaptation de la synthèse paramétrique de la parole à partir d'un texte écrit à la langue arabe. Pour ce faire, différentes méthodes ont été développées afin de mettre en place des systèmes de synthèse. Ces méthodes sont basées sur une description du signal de parole par un ensemble de paramètres acoustiques et prosodiques. De même, chaque son est représenté par un ensemble de descripteurs contextuels contenant toutes les informations affectant la prononciation de celui-ci. Une partie de ces descripteurs dépend de la langue et de ses particularités, ainsi, afin d'adapter l'approche de synthèse paramétrique à l'arabe, une étude des particularités phonologiques de l'arabe était nécessaire. L'accent a été mis sur deux phénomènes : la gémination et la longueur des voyelles (courte/longue). Deux descripteurs associés à ces deux phénomènes ont été ajoutés à l'ensemble des descripteurs contextuels. De même, différentes approches de choix des unités ont été proposées pour modéliser les consonnes géminées et les voyelles longues. Quatre combinaisons de modélisation sont possibles en alternant la différentiation ou la fusion des consonnes simples et géminées d'une part et des voyelles courtes et longues d'autres part. Un ensemble des tests perceptifs et objectifs a été conduit afin d'évaluer l'effet des quatre approches de modélisation des unités sur la qualité de la parole synthétisée. Les évaluations ont été faites dans le cas de synthèse paramétrique par HMM (Hidden Markov Model) puis dans le cas de la synthèse paramétrique par DNN. Les résultats subjectifs sont montrés que dans le cas de l'approche par HMM, les quatre approches produisent des signaux de qualité similaire, une conclusion qui a été confirmée par les mesures objectives calculées pour évaluer la prédiction des durées des unités de parole. Cependant, les résultats des évaluations objectives dans le cas de l'approche par DNN ont montré que la différentiation des consonnes simples (respectivement des voyelles courtes) des consonnes géminées (respectivement des voyelles longues) permet d'avoir une prédiction des durées légèrement meilleure qu'avec les autres des approches de modélisation. En revanche, cette amélioration n'a pas été perçue lors des tests perceptifs ; les participants ont trouvé que les signaux générés par les quatre approches sont similaires en termes de qualité globale. Une dernière partie de la thèse a été consacrée à la comparaison de l'approche de synthèse par HMM à celle par DNN. L'ensemble des tests conduits ont montré que l'utilisation des DNN a amélioré la qualité perçue des signaux générés.

Reconnaissance et traduction automatique de la parole de vidéos arabes et dialectales

Reconnaissance et traduction automatique de la parole de vidéos arabes et dialectales PDF Author: Mohamed Amine Menacer
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
Les travaux de recherche ont été développés dans le cadre du projet AMIS (Access to Multilingual Information and opinionS) dont l'objectif principal est de développer un système d'aide à la compréhension de vidéos dans des langues étrangères en générant un résumé automatique de ces dernières dans une langue compréhensible par l'utilisateur. Dans le cadre de cette thèse, nous nous sommes concentrés sur la reconnaissance et la traduction automatique de la parole de vidéos arabes et dialectales. Les approches statistiques proposées dans la littérature pour la reconnaissance automatique de la parole (RAP) sont indépendantes de la langue et elles sont applicables à l'arabe standard. Cependant, cette dernière présente quelques caractéristiques que nous devons prendre en considération afin de booster les performances du système de RAP. Parmi ces caractéristiques on peut citer l'absence de l'indication des voyelles dans le texte ce qui rend difficile leur apprentissage par le modèle acoustique. Nous avons proposé plusieurs approches de modélisation acoustique et/ou de langage afin de mieux reconnaître la parole arabe. L'arabe standard n'est pas la langue maternelle, c'est pourquoi dans les conversations quotidiennes, on utilise le dialecte, un arabe inspiré de l'arabe standard, mais pas seulement. Nous avons travaillé sur l'adaptation du système développé pour l'arabe standard au dialecte algérien qui est l'une des variantes de la langue arabe les plus difficiles à reconnaître par les systèmes de RAP. Cela est dû aux mots empruntés d'autres langues, au code-switching et au manque de ressources. Notre proposition pour remédier à ces problèmes est de tirer profit des données orales et textuelles d'autres langues impactant le dialecte. Le texte résultant de la RAP arabe a été utilisé pour la traduction automatique (TA). Nous avons réalisé dans un premier temps une étude comparative entre l'approche statistique à base de segments et l'approche neuronale utilisées dans le cadre de la TA. Ensuite, nous nous sommes intéressés à l'adaptation de ces deux approches pour traduire le texte code-switché. Notre étude portait sur le mélange de l'arabe et de l'anglais dans des documents officiels des nations unies. Pour pallier les différents problèmes dus à la propagation des erreurs dans le système séquentiel, nous avons travaillé sur l'adaptation du vocabulaire du système de RAP et sur la proposition d'une nouvelle modélisation permettant la traduction directe de la parole.

SYSTEME MULTILINGUE DE SYNTHESE DE LA PAROLE A PARTIR DU TEXTE

SYSTEME MULTILINGUE DE SYNTHESE DE LA PAROLE A PARTIR DU TEXTE PDF Author: JAMAL.. EL KAFI
Publisher:
ISBN:
Category :
Languages : fr
Pages :

Get Book Here

Book Description
LE MEMOIRE PORTE SUR L'ETUDE ET LA REALISATION D'UNE CARTE DE SYNTHESE DE PAROLE MULTILINGUE A PARTIR DU TEXTE. CETTE SYNTHESE EST BASEE SUR LA TECHNIQUE LPC ET LA CONCATENATION DE DIPHONES. LES ALGORITHMES DE SYNTHESE DEVELOPPES ONT ETE MASQUES SUR UN PROCESSEUR SPECIALISE DEDIE A LA PAROLE: LE TMS50C42. LE DISPOSITIF EST CONSTITUE DE DEUX DICTIONNAIRES DE DIPHONES (ARABE ET FRANCAIS) STOCKES DANS DEUX EPROMS, DE PROGRAMMES DE TRANSFORMATIONS ORTHOGRAPHIQUE-PHONETIQUE ET PHONETIQUE-SON ET INTEGRE EN OUTRE DES ELEMENTS DE PROSODIE PERMETTANT D'AMELIORER LA QUALITE DE LA PAROLE RESTITUEE. CE SYSTEME DEVELOPPE DANS LE CADRE D'UNE AIDE DE L'ANVAR EST COMMERCIALISE DEPUIS PEU EN FRANCE, POUR LA SYNTHESE DU FRANCAIS.

La construction automatique de ressources multilingues à partir des réseaux sociaux

La construction automatique de ressources multilingues à partir des réseaux sociaux PDF Author: Karima Abidi
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
Le traitement automatique des langues est fondé sur l'utilisation des ressources langagières telles que les corpus de textes, les dictionnaires, les lexiques de sentiments, les analyseurs morpho-syntaxiques, les taggers, etc. Pour les langues naturelles, ces ressources sont souvent disponibles. En revanche, lorsqu'il est question de traiter les langues peu dotées, on est souvent confronté au manque d'outils et de données. Dans cette thèse, on s'intéresse à certaines formes vernaculaires de l'arabe utilisées au Maghreb. Ces formes sont connues sous le terme de dialecte que l'on peut classer dans la catégorie des langues peu dotées. Exceptés des textes brutes extraits généralement des réseaux sociaux, il existe très peu de ressources permettant de traiter les dialectes arabes. Ces derniers, comparativement aux autres langues peu dotées possèdent plusieurs spécificités qui les rendent plus difficile à traiter. Nous pouvons citer notamment l'absence de règles d'écriture de ces dialectes, ce qui conduit les usagers à écrire le dialecte sans suivre des règles précises, par conséquent un même mot peut avoir plusieurs graphies. Les mots en arabe dialectal peuvent s'écrire en utilisant le script arabe et/ou le script latin (écriture dite arabizi). Pour les dialectes arabes du Maghreb, ils sont particulièrement influencés par des langues étrangères comme le français et l'anglais. En plus de l'emprunt de mots de ces langues, un autre phénomène est à prendre en compte en traitement automatique des dialectes. Il s'agit du problème connu sous le terme de code-switching. Ce phénomène est connu en linguistique sous le terme de diglossie. Cela a pour conséquence de laisser libre cours à l'utilisateur qui peut écrire en plusieurs langues dans une même phrase. Il peut ainsi commencer en dialecte arabe et au milieu de la phrase, il peut "switcher" vers le français, l'anglais ou l'arabe standard. En plus de cela, il existe plusieurs dialectes dans un même pays et a fortiori plusieurs dialectes différents dans le monde arabe. Il est donc clair que les outils NLP classiques développés pour l'arabe standard ne peuvent être utilisés directement pour traiter les dialectes. L'objectif principal de ce travail consiste à proposer des méthodes permettant la construction automatique de ressources pour les dialectes arabes en général et les dialectes du Maghreb en particulier. Cela représente notre contribution à l'effort fourni par la communauté travaillant sur le traitement automatique des dialectes arabes. Nous avons ainsi produit des méthodes permettant de construire des corpus comparables, des ressources lexicales contenant les différentes formes d'une entrée et leur polarité. Par ailleurs, nous avons développé des méthodes pour le traitement de l'arabe standard sur des données de Twitter et également sur les transcriptions provenant d'un système de reconnaissance automatique de la parole opérant sur des vidéos en arabe extraites de chaînes de télévisions arabes telles que Al Jazeera, France24, Euronews, etc. Nous avons ainsi comparé les opinions des transcriptions automatiques provenant de sources vidéos multilingues différentes et portant sur le même sujet en développant une méthode fondée sur la théorie linguistique dite Appraisal.

CONTRIBUTIONS A LA SYNTHESE DE LA PAROLE A PARTIR DU TEXTE; TRANSCRIPTION GRAPHEME-PHONEME EN TEMPS REEL SUR MICROPROCESSEUR

CONTRIBUTIONS A LA SYNTHESE DE LA PAROLE A PARTIR DU TEXTE; TRANSCRIPTION GRAPHEME-PHONEME EN TEMPS REEL SUR MICROPROCESSEUR PDF Author: BERNARD.. PROUTS
Publisher:
ISBN:
Category :
Languages : fr
Pages :

Get Book Here

Book Description
DANS LE CADRE TRES GENERAL DE LA COMMUNICATION HOMME-MACHINE, ON S'INTERESSE A UN NOUVEAU TYPE DE PERIPHERIQUE: LE TERMINAL A REPONSE VOCALE. ON UTILISE UNE TECHNIQUE DE SYNTHESE A PARTIR DU TEXTE ORTHOGRAPHIE. LA PREMIERE PARTIE DE L'ETUDE PORTE SUR LA TRANSCRIPTION GRAPHEME-PHONEME. EN CE QUI CONCERNE LA SYNTHESE, LA SECONDE PARTIE EXPOSE UNE ANALYSE AUTOMATIQUE DE SEQUENCE DE PAROLE NATURELLE. LE COUPLAGE DU PROGRAMME DE TRADUCTION PHONETIQUE AVEC UN SYNTHETISEUR A PERMIS LA REALISATION D'UN SYSTEME AUTONOME DE SYNTHESE A PARTIR DU TEXTE