Book [PDF] Diagnostic Pour La Combinaison De Systemes De Reconnaissance Automatique De La Parole Download

Diagnostic pour la combinaison de systèmes de reconnaissance automatique de la parole

Author: Loïc Barrault
Publisher:
ISBN:
Category :
Languages : fr
Pages : 183

Book Description
La Reconnaissance Automatique de la Parole (RAP) est affectée par les nombreuses variabilités présentes dans le signal de parole. En dépit de l’utilisation de techniques sophistiquées, un système RAP seul n’est généralement pas en mesure de prendre en compte l’ensemble de ces variabilités. Nous proposons l’utilisation de diverses sources d’information acoustique pour augmenter la précision et la robustesse des systèmes. La combinaison de différents jeux de paramètres acoustiques repose sur l’idée que certaines caractéristiques du signal de parole sont davantage mises en avant par certains jeux de paramètres que par d’autres. L’intérêt est donc d’exploiter les points forts de chacun. Par ailleurs, les différentes partitions de l’espace acoustique opérées par les modèles acoustiques peuvent être mises à profit dans des techniques de combinaison bénéficiant de leur complémentarité. Le diagnostic est au coeur de ce travail. L’analyse des performances de chaque jeu de paramètres permet de dégager des contextes spécifiques dans lesquels la prédiction du résultat de reconnaissance est possible. Nous présentons une architecture de diagnostic dans laquelle le système RAP est vu comme un "canal de transmission" dont l’entrée correspond aux phonèmes et la sortie au résultat de reconnaissance. Cette architecture permet de séparer les sources d’ambiguïté au sein du système de reconnaissance. Les analyses ont permis d’intégrer des stratégies de combinaison post-décodage à un niveau segmental élevé (phonème ou mot). Des techniques de combinaison des probabilités a posteriori des états d’un modèle de Markov caché au niveau de la trame sont également proposées. Afin d’améliorer l’estimation de ces probabilités, les probabilités obtenues avec différents modèles acoustiques sont fusionnées. Pour combiner les probabilités de manière cohérente, nous avons développé un protocole permettant d’entraîner des modèles de même topologie avec des paramètres acoustiques différents

Reconnaissance vocale dans un contexte de voix sur IP

Author: Pedro Mayorga Ortiz
Publisher:
ISBN:
Category :
Languages : fr
Pages : 177

Get Book Here

Book Description
Ce travail de thèse a pour but de diagnostiquer les nouveaux défis posés à la reconnaissance vocale dans le contexte récent de la voix sur IP, et de proposer quelques solutions permettant d’y améliorer les performances d’un système de reconnaissance automatique.La première contribution de nos travaux a donc consisté à diagnostiquer le plus précisément possible les problèmes dûs à la compression et à la perte de paquets pour deux tâches de reconnaissance différentes : la reconnaissance automatique de la parole et la reconnaissance automatique du locuteur. A l’issu du diagnostic, nous avons constaté une dégradation plus importante due à la compression sur la tâche de vérification du locuteur. En ce qui concerne la reconnaissance automatique de la parole, la dégradation la plus importante a été provoquée par la perte de paquets. La seconde contribution de cette thèse correspond donc à la proposition de techniques de reconstruction afin d’améliorer la robustesse de systèmes soumis à des conditions de pertes de paquets. Nous proposons aussi d’autres alternatives comme l’adaptation d’un système de reconnaissance automatique de la parole en fonction des pertes de paquets. Les techniques de récupération ont été appliquées sur la base de l’émetteur et sur la base du récepteur. Par ailleurs, nos expérimentations confirment également les avantages d’une « architecture distribuée » où des vecteurs acoustiques transitent sur le réseau depuis le client jusqu’au serveur de reconnaissance, par rapport à une architecture plus classique type « serveur pur » où le signal (ou sa version compressée) transite depuis le terminal client sur le réseau jusqu’à un serveur de reconnaissance.

Reconnaissance automatique de la parole

Author: Jean-Paul Haton
Publisher:
ISBN: 9782100058426
Category :
Languages : fr
Pages : 373

Get Book Here

Book Description
La reconnaissance automatique de la parole donne aujourd'hui lieu à un ensemble important d'applications de nature et de difficulté très variées, concernant quotidiennement des millions de personnes à travers le monde. On peut prévoir que la parole fera de plus en plus partie des interfaces multimédia entre un utilisateur et un système automatique, d'une part grâce à l'amélioration de la robustesse des systèmes de reconnaissance automatique de la parole et, d'autre part, du fait de la sensibilisation croissante du grand public à cette technologie encore peu connue. Cet ouvrage illustre le caractère pluridisciplinaire de la reconnaissance automatique de la parole qui fait appel à des notions variées allant des mathématiques, du traitement du signal, de l'informatique et de l'intelligence artificielle jusqu'à la phonétique, à la linguistique, aux sciences cognitives et aux neurosciences. Il présente les fondements théoriques du domaine ainsi que les différents modèles et algorithmes utilisés (statistiques, neuromimétiques, symboliques) en les illustrant par des exemples réels. Les grands domaines d'application sont également étudiés : dictée, commandes, télématique, traduction, etc. Ce livre s'adresse aux étudiants en master et en doctorat, aux élèves ingénieurs, aux chercheurs, aux professionnels des interfaces homme-machine, ainsi qu'à toute personne ayant un niveau scientifique suffisant.

Reconnaissance automatique de la parole guidée par des transcriptions a priori

Author: Benjamin Lecouteux
Publisher:
ISBN:
Category :
Languages : fr
Pages : 170

Get Book Here

Book Description
L’utilisation des systèmes de reconnaissance automatique de la parole nécessite des conditions d’utilisation contraintes pour que ces derniers obtiennent des résultats convenables. Dans de nombreuses situations, des informations auxiliaires aux flux audio sont disponibles. Le travail de cette thèse s’articule autour des approches permettant d’exploiter ces transcriptions a priori disponibles. Ces informations se retrouvent dans de nombreuses situations : les pièces de théâtre avec les scripts des acteurs, les films accompagnés de sous-titres ou de leur scénario, les flashes d’information associés aux prompts des journalistes, les résumés d’émissions radio... Ces informations annexes sont de qualité variable, mais nous montrerons comment ces dernières peuvent être utilisées afin d’améliorer le décodage d’un SRAP. Ce document est divisé en deux axes liés par l’utilisation de transcriptions a priori au sein d’un SRAP : la première partie présente une méthode originale permettant d’exploiter des transcriptions a priori manuelles, et de les intégrer directement au coeur d’un SRAP. Nous proposons une méthode permettant de guider efficacement le système de reconnaissance à l’aide d’informations auxiliaires. Nous étendons notre stratégie à de larges corpus dénués d’informations temporelles. La seconde partie de nos travaux est axée sur la combinaison de SRAP. Nous proposons une combinaison de SRAP basée sur le décodage guidé : les transcriptions a priori guidant un SRAP principal sont fournies par des systèmes auxiliaires. Les travaux présentés proposent d’utiliser efficacement une information auxiliaire au sein d’un SRAP. Le décodage guidé par des transcriptions manuelles permet d’améliorer sensiblement la qualité du décodage ainsi que la qualité de la transcription a priori. Par ailleurs, les stratégies de combinaison proposées sont originales et obtiennent d’excellents résultats par rapport aux méthodes existantes à l’état de l’art

Traitement de la parole

Author: René Boite
Publisher: EPFL Press
ISBN: 2880743885
Category : Automatic speech recognition
Languages : fr
Pages : 508

Get Book Here

Book Description
Liées à l'essor considérable de la microélectronique, les applications en traitement du signal de parole sont chaque jour plus nombreuses. Cet ouvrage donne un exposé détaillé des algorithmes d'analyse, de codage, de synthèse et de reconnaissance de la parole. La modélisation autorégressive et l'analyse spectrale sont exposées avec toute la rigueur et la clarté nécessaires en vue d'une application correcte au signal de parole. L'ouvrage propose également une étude approfondie des techniques de quantification et de codage, ainsi qu'une introduction au débruitage. Les techniques de synthèse vocale à partir du texte y sont étudiées, tant dans le domaine du traitement du langage naturel que dans celui du traitement du signal. On y examine en détail la conception de systèmes de reconnaissance de la parole et du locuteur, basés sur la reconnaissance des formes ou sur les modèles markoviens et les réseaux de neurones. On aborde enfin les problèmes liés à l'implantation de ces algorithmes sur microprocesseurs, ASICs ou FPGAs. Cet ouvrage intéressera l'ingénieur confronté à la conception ou à l'implantation matérielle d'un système de codage, de synthèse ou de commande vocale.

Détection de thème et adaptation des modèles de langage pour la reconnaissance automatique de la parole

Author: Armelle Brun
Publisher:
ISBN:
Category :
Languages : fr
Pages : 142

Get Book Here

Book Description
Une des façons de procéder pour l'amélioration de la qualité des systèmes de Reconnaissance Automatique de la Parole (RAP) consiste à adapter le modèle de langage utilisé au thème du texte en cours de traitement. Nous proposons dans cette thèse une nouvelle approche de la sélection devocabulaire pour la détection de thème, qui permet d'améliorer légèrement les performances. Nous proposons également une méthode originale de détection de thème qui atteint des performances comparables à celles de l'état de l'art en exploitant un vocabulaire réduit. Nous avons également étudié la combinaison des méthodes de détection de thème. Celle-ci nous permet d'améliorer les performances de 10%, atteignant ainsi plus de 93\% de détection de thème correcte. Dans le cadre de l'intégration dans un système de RAP, nous avons montré amélioration conséquente de la perplexité.

Reconnaissance automatique de la parole

Author: Jean-Paul Haton
Publisher: Bordas Editions
ISBN: 9782040188276
Category : Reconnaissance automatique de la parole
Languages : fr
Pages : 239

Get Book Here

Book Description
Parler à une machine, dialoguer avec elle constitue l'un des défis majeurs de l'intelligence artificielle. A l'heure actuelle, on ne peut résoudre ce problème qu'en formulant des hypothèses significatives : nombre de locuteurs, niveau du bruit, taille des vocabulaires, complexité des tâches réalisées. Cet ouvrage présente les différentes techniques de reconnaissance de mots isolés et enchaînés, qui sont à la base des systèmes disponibles commercialement. Il étudie ce problème clé du développement des systèmes à venir qu'est le décodage acoustico-phonétique : comment transcrire un continuum acoustique de parole en une suite discrète d'unités linguistiques (phonèmes ou autres). Après avoir analysé la notion de mot, les auteurs développent les méthodes et techniques mises en oeuvre dans la compréhension d'une phrase et la conduite d'un dialogue. Rédigé avec un grand souci de clarté, cet ouvrage permet à tout ingénieur concerné par la communication homme/machine de mesurer les potentialités de cette nouvelle technologie.

Eléments pour un système de reconnaissance automatique de la parole continue du français

Author: Stéphane Igounet
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description

La parole numérique, analyse, reconnaissance et synthèse du signal vocal

Author: Jean-Paul Haton
Publisher: Académie royale de Belgique
ISBN: 2803105292
Category : Technology & Engineering
Languages : fr
Pages : 152

Get Book Here

Book Description
La reconnaissance automatique de la parole donne lieu à un ensemble d’applications de nature et de difficulté très variées, concernant quotidiennement des millions de personnes. Elle fait appel à des notions variées allant des mathématiques, du traitement du signal, de l’informatique et de l’intelligence artificielle jusqu’à la phonétique, la linguistique, les sciences cognitives et les neurosciences. L’ouvrage présente les fondements du domaine ainsi que les différents modèles et algorithmes utilisés (statistiques, neuromimétiques, symboliques). Les domaines d’application sont également étudiés : dictée, commandes, télématique, traduction, etc. Jean-Paul Haton, agrégé de l’Université (Ecole Normale Supérieure de Saint-Cloud) et Docteur d’état ès Sciences, est professeur émérite à l’Université de Lorraine à Nancy et chercheur au LORIA/INRIA. Il est membre senior de l’Institut Universitaire de France, Vice-Président de l’Académie Lorraine des Sciences et membre associé de l’Académie Royale de Belgique.

La paramètrisation MFCC en vue d'une reconnaissance robuste de parole

Author: Mahmoud Gdoura
Publisher: Editions Universitaires Europeennes
ISBN: 9783841748645
Category :
Languages : fr
Pages : 96

Get Book Here

Book Description
La reconnaissance automatique de la parole peut etre consideree comme une tache particuliere de reconnaissance des formes. Elle englobe plusieurs disciplines y comprise le traitement de signal, les techniques intelligentes et l'etude phonetique etc. Dans ce manuscrit nous presentons un systeme de reconnaissance de mots isoles base sur la technique de classification HMM dont le signal est parametrise par les MFCC tout en proposant une methode de parametrisation hybride pour faire face a la degradation des performances du systeme a cause du bruit.