Les ambiguïtés orales en français et leur traitement automatique pour les systèmes de reconnaissance automatique de la parole

Les ambiguïtés orales en français et leur traitement automatique pour les systèmes de reconnaissance automatique de la parole PDF Author: Juliette Bergoënd
Publisher:
ISBN:
Category :
Languages : fr
Pages : 118

Get Book Here

Book Description

Les ambiguïtés orales en français et leur traitement automatique pour les systèmes de reconnaissance automatique de la parole

Les ambiguïtés orales en français et leur traitement automatique pour les systèmes de reconnaissance automatique de la parole PDF Author: Juliette Bergoënd
Publisher:
ISBN:
Category :
Languages : fr
Pages : 118

Get Book Here

Book Description


Reconnaissance automatique de la parole pour des langues peu dotées

Reconnaissance automatique de la parole pour des langues peu dotées PDF Author: Viêt Bac Lê
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
Dans la plupart des langues peu dotées, les services liés aux technologies du traitement de l'oral sont inexistants. L'originalité de mon travail de thèse vient de la volonté d'aborder ces langues pour lesquelles peu ou pas de ressources nécessaires pour la reconnaissance automatique de la parole sont disponibles. Ce manuscrit présente notre méthodologie qui vise à développer et adapter rapidement un système de reconnaissance automatique de la parole continue pour une nouvelle langue peu dotée. La nature statistique des approches nécessite de disposer d'une grande quantité de ressources (vocabulaires, grands corpus de texte, grands corpus de parole, dictionnaires de prononciation) pour le développement d'un système de reconnaissance automatique de la parole continue à grand vocabulaire. Ces ressources ne sont cependant pas disponibles directement pour des langues peu dotées. Par conséquent, une première façon d'accélérer la portabilité des systèmes de reconnaissance vocale vers une nouvelle langue est de développer une méthodologie permettant une collecte rapide et facilitée de ressources écrites et orales. Dans ce travail, nous proposons tout d'abord des solutions pour résoudre les difficultés principales de récupération et de traitement des ressources textuelles spécifiques aux langues peu dotées : recueil d'un vocabulaire, collecte de documents à partir de l'Internet, normalisation de textes, segmentation de textes, filtrage. Une boîte à outils générique " open source " nommée CLIPS-Text-Tk a notamment été développée pour faciliter le portage des outils de traitement de corpus textuels vers une nouvelle langue. Ensuite, la plus grande partie de notre travail de thèse concerne la construction rapide de modèles acoustiques pour une langue peu dotée. Nous proposons des concepts et des méthodes d'estimation de similarités entre unités phonémiques (phonème, polyphone, groupe de polyphones, ...). Ces mesures de similarité sont ensuite utilisées pour la portabilité et l'adaptation rapide des modèles acoustiques multilingues indépendant et dépendant du contexte vers une nouvelle langue peu dotée. Pour les langues peu dotées qui ne disposent pas encore de dictionnaire phonétique, une modélisation acoustique à base de graphèmes est aussi proposée et évaluée. Enfin, les ressources écrites et orales collectées pour le vietnamien et le khmer ainsi que les résultats expérimentaux obtenus par nos systèmes de reconnaissance automatique de la parole en vietnamien et en khmer sont présentés et valident le potentiel des méthodes que nous avons proposées.

Eléments pour un système de reconnaissance automatique de la parole continue du français

Eléments pour un système de reconnaissance automatique de la parole continue du français PDF Author: Stéphane Igounet
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description


Reconnaissance automatique de la parole

Reconnaissance automatique de la parole PDF Author: Jean-Paul Haton
Publisher: Dunod
ISBN: 2100528033
Category : Computers
Languages : fr
Pages : 396

Get Book Here

Book Description
Cet ouvrage fait la synthèse des techniques de reconnaissance automatique de la parole (RAP) et de synthèse de la parole (SAP). Les applications de ces techniques sont présentées, de la télématique vocale (vérification d'identité par la voix, synthèse vocale...) à l'apprentissage des langues en passant par la traduction automatique.

Vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole

Vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole PDF Author: Sethserey Sam
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description
Les technologies de reconnaissance automatique de la parole sont désormais intégrées dans de nombreux systèmes. La performance des systèmes de reconnaissance vocale pour les locuteurs non natifs continue cependant à souffrir de taux d'erreur élevés, en raison de la différence entre la parole non native et les modèles entraînés. La réalisation d'enregistrements en grande quantité de parole non native est généralement une tâche très difficile et peu réaliste pour représenter toutes les origines des locuteurs. Ce travail de thèse porte sur l'amélioration des modèles acoustiques multilingues pour la transcription phonétique de la parole de type « réunion multilingue ». Traiter ce type de parole constitue plusieurs défis : 1) il peut exister de la conversation entre des locuteurs natifs et non natifs ; 2) il y a non seulement de la parole non native d'une langue, mais de plusieurs langues parlées par des locuteurs venant de différentes origines ; 3) il est difficile de collecter suffisamment de données pour amorcer les systèmes de transcription. Pour répondre à ces défis, nous proposons un processus d'adaptation de modèles acoustiques multilingues que nous appelons « adaptation autonome ». Dans l'adaptation autonome, nous étudions plusieurs approches pour adapter les modèles acoustiques multilingues de manière non supervisée (les langues parlées et les origines des locuteurs ne sont pas connues à l'avance) et qui n'utilise aucune donnée supplémentaire lors du processus d'adaptation. Les approches étudiées sont décomposées selon deux modules. Le premier module qui s'appelle « l'observateur de langues » consiste à récupérer les caractéristiques linguistiques (les langues parlées et les origines des locuteurs) des segments à décoder. Le deuxième module consiste à adapter le modèle acoustique multilingue en fonction des connaissances fournies par l'observateur de langue. Pour évaluer l'utilité de l'adaptation autonome d'un modèle acoustique multilingue, nous utilisons les données de test, qui sont extraites de réunions multilingues, contenant de la parole native et non native de trois langues : l'anglais (EN), le français (FR) et le vietnamien (VN). Selon les résultats d'expérimentation, l'adaptation autonome donne des résultats prometteurs pour les paroles non natives mais dégradent très légèrement les performances sur de la parole native. Afin d'améliorer la performance globale des systèmes de transcription pour toutes les paroles natives et non natives, nous étudions plusieurs approches de détection de parole non native et proposons de cascader un tel détecteur avec notre processus d'adaptation autonome. Les résultats obtenus ainsi, sont les meilleurs parmi toutes les expériences réalisées sur notre corpus de réunions multilingues.

Architecture du système de reconnaissance automatique de la parole DIRA

Architecture du système de reconnaissance automatique de la parole DIRA PDF Author: Mohamed Khaled Nasri
Publisher:
ISBN:
Category :
Languages : fr
Pages : 265

Get Book Here

Book Description
LA PAROLE EST UN DES MOYENS PARMI LES PLUS IMPORTANTS ET LES PLUS SIMPLES POUR COMMUNIQUER. LA COMPREHENSION DU MESSAGE PARLE EST UN PROBLEME TRES COMPLEXE, QUI NECESSITE L'INTEGRATION DE PLUSIEURS TYPES DE CONNAISSANCES (ACOUSTIQUE, PHONOLOGIQUE, PROSODIQUE, LEXICAL, SYNTAXIQUE, SEMANTIQUE, PRAGMATIQUE). UN DES PROBLEMES EST DE CHOISIR L'ARCHITECTURE DU SYSTEME DE COMPREHENSION ET LA STRATEGIE DE RESOLUTION ASSOCIEE. L'ARCHITECTURE D'UN SYSTEME DE COMPREHENSION ET LA STRATEGIE DE COMPREHENSION DOIVENT TENIR COMPTE DES APPROCHES PSYCHOLOGIQUES DE LA COMPREHENSION DE LA PAROLE. DANS CETTE THESE ON PRESENTE: 1) LES DIFFERENTES ARCHITECTURES DES SYSTEMES DE COMPREHENSION DE LA PAROLE EXISTANT A L'HEURE ACTUELLE AVEC LEUR STRATEGIE DE RESOLUTION DU PROBLEME DE COMPREHENSION; 2) L'ARCHITECTURE GENERALE DU SYSTEME DIRA, ET LA SIMULATION DES EXPERTS (ACOUSTIQUE-PHONETIQUE, LEXICAL ET SYNTACTICO-SEMANTIQUE) ET LA STRATEGIE GENERALE DE RESOLUTION DU PROBLEME DE COMPREHENSION; 3) LE MODULE DE COMPREHENSION DANS LE SYSTEME DIRA AVEC LES DIFFERENTES APPROCHES PSYCHOLOGIQUES DE COMPREHENSION DU LANGAGE; 4) LE MODULE D'ANALYSE PROSODIQUE ET LES RESULTATS DE L'ETIQUETAGE PROSODIQUE DU SIGNAL DE PAROLE; 5) LES RESULTATS DE FONCTIONNEMENT DU SYSTEME DIRA

Transcription et traitement manuel de la parole spontanée pour sa reconnaissance automatique

Transcription et traitement manuel de la parole spontanée pour sa reconnaissance automatique PDF Author: Thierry Bazillon
Publisher:
ISBN:
Category :
Languages : fr
Pages : 262

Get Book Here

Book Description
Le projet EPAC est le point de départ de nos travaux de recherche. Nous présentons ce contexte de travail dans notre premier chapitre.Dans un deuxième temps, nous nous intéressons à la tâche de transcription de la parole. Nous en exposerons quelques jalons, ainsi qu'un inventaire des corpus oraux disponibles aujourd'hui. Enfin, nous comparons deux méthodes de transcription : manuelle et assistée. Par la suite, nous réalisons une étude comparative de huit logiciels d'aide à la transcription. Cela afin de démontrer que, suivant les situations, certains sont plus indiqués que d'autres. Le codage des données est l'objet de notre quatrième chapitre. Peut-on facilement échanger des transcriptions? Nous démontrerons que l'interopérabilité est un domaine où beaucoup de travail reste à faire. Enfin, nous terminons par une analyse détaillée de ce que nous appelons la parole spontanée. Par différents angles, définitions et expériences, nous tentons de circonscrire ce que cette appellation recouvre.

Approche bimodale du traitement automatique de la parole

Approche bimodale du traitement automatique de la parole PDF Author: Pierre Jourlin
Publisher:
ISBN:
Category :
Languages : fr
Pages : 116

Get Book Here

Book Description
Ces travaux constituent une etude sur la possibilite d'integrer les informations visuelles constituees par le mouvement et la forme des levres dans les systemes de traitement automatique de la parole. Les differentes approches et methodes relatives a cette problematique sont abordees d'une facon theorique et experimentale. Une description technique des phenomenes d'asynchronie (ou d'independance temporelle) presents dans cette source d'information bimodale est tout d'abord etablie. Differentes manieres de gerer ces phenomenes dans les systemes de reconnaissance de la parole sont etudiees et comparees. Nous definissons alors une nouvelle approche fondee sur un produit d'automates a transitions valuees. En outre, la combinaison de deux modalites, qui peuvent avoir des niveaux de fiabilite totalement differents, pose un certain nombre de problemes relatifs a la ponderation. Nous etudions donc les divers criteres et methodes permettant de trouver une ponderation optimale. Il est egalement fait etat de differentes experimentations effectuees dans le domaine du traitement de la parole acoustico-labiale. Nos propres experimentations dans le domaine de la reconnaissance de la parole bimodale et dans le projet amibe (finance par le cnrs) sont decrites. Les resultats des nouvelles methodes developpees dans ces travaux sont egalement presentes. Enfin, nous abordons egalement le domaine de la verification d'identite acoustico-labiale. Nous presentons les resultats obtenus par le systeme que avons realise en collaboration avec l'idiap dans le cadre du projet europeen m2vts (programme acts). Ces experimentations furent parmi les toutes premieres realisees dans le domaine de la reconnaissance et verification acoustico-labiale du locuteur

Diagnostic pour la combinaison de systèmes de reconnaissance automatique de la parole

Diagnostic pour la combinaison de systèmes de reconnaissance automatique de la parole PDF Author: Loïc Barrault
Publisher:
ISBN:
Category :
Languages : fr
Pages : 183

Get Book Here

Book Description
La Reconnaissance Automatique de la Parole (RAP) est affectée par les nombreuses variabilités présentes dans le signal de parole. En dépit de l’utilisation de techniques sophistiquées, un système RAP seul n’est généralement pas en mesure de prendre en compte l’ensemble de ces variabilités. Nous proposons l’utilisation de diverses sources d’information acoustique pour augmenter la précision et la robustesse des systèmes. La combinaison de différents jeux de paramètres acoustiques repose sur l’idée que certaines caractéristiques du signal de parole sont davantage mises en avant par certains jeux de paramètres que par d’autres. L’intérêt est donc d’exploiter les points forts de chacun. Par ailleurs, les différentes partitions de l’espace acoustique opérées par les modèles acoustiques peuvent être mises à profit dans des techniques de combinaison bénéficiant de leur complémentarité. Le diagnostic est au coeur de ce travail. L’analyse des performances de chaque jeu de paramètres permet de dégager des contextes spécifiques dans lesquels la prédiction du résultat de reconnaissance est possible. Nous présentons une architecture de diagnostic dans laquelle le système RAP est vu comme un "canal de transmission" dont l’entrée correspond aux phonèmes et la sortie au résultat de reconnaissance. Cette architecture permet de séparer les sources d’ambiguïté au sein du système de reconnaissance. Les analyses ont permis d’intégrer des stratégies de combinaison post-décodage à un niveau segmental élevé (phonème ou mot). Des techniques de combinaison des probabilités a posteriori des états d’un modèle de Markov caché au niveau de la trame sont également proposées. Afin d’améliorer l’estimation de ces probabilités, les probabilités obtenues avec différents modèles acoustiques sont fusionnées. Pour combiner les probabilités de manière cohérente, nous avons développé un protocole permettant d’entraîner des modèles de même topologie avec des paramètres acoustiques différents

Reconnaissance automatique de la parole et dialogue oral homme-machine

Reconnaissance automatique de la parole et dialogue oral homme-machine PDF Author: Jean-Paul Haton
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description