Reconnaissance hors-ligne par modélisation markovienne de mots manuscrits dans un vocabulaire ouvert

Reconnaissance hors-ligne par modélisation markovienne de mots manuscrits dans un vocabulaire ouvert PDF Author: Cherki Farouz
Publisher:
ISBN:
Category :
Languages : fr
Pages : 436

Get Book Here

Book Description
NOUS DECRIVONS DANS CE MEMOIRE UN SYSTEME DE RECONNAISSANCE DE MOTS MANUSCRITS HORS-LIGNE SANS CONTRAINTE DANS UN GRAND VOCABULAIRE. LA REALISATION D'UN TEL SYSTEME A NECESSITE DE REPONDRE AUX DEUX PROBLEMES SUIVANTS: LE PREMIER PROBLEME PORTE SUR LA DIMINUTION DU TAUX DE RECONNAISSANCE, OBSERVE QUAND IL S'AGIT DE RECHERCHER LE MOT CORRESPONDANT A UNE IMAGE DANS UN GRAND LEXIQUE. LA REPONSE APPORTEE A CE PROBLEME PASSE PAR UNE MEILLEURE CARACTERISATION DE L'IMAGE POUR MIEUX RENSEIGNER LE MODULE DE RECONNAISSANCE. NOUS AVONS DEVELOPPE DANS LE CADRE DE CETTE THESE UNE METHODE D'EXTRACTION DE CARACTERISTIQUES, QUI A PARTIR D'UNE IMAGE DE MOT SEGMENTEE, DETERMINE UNE DESCRIPTION POUR REPRESENTER LE MOT. CETTE REPRESENTATION EST DEDUITE DE L'ETIQUETAGE DES SEGMENTS (ENTITES RESULTANT DE LA PHASE DE SEGMENTATION) A PARTIR D'UN ALPHABET APPELE ENSEMBLE DE GRAPHEMES. UN GRAPHEME EST UNE ENTITE POUVANT CORRESPONDRE A UN MORCEAU DE LETTRE, UNE LETTRE COMPLETE OU DES LETTRES JOINTES. L'ALPHABET DES GRAPHEMES EST CONSTRUIT DANS UNE PHASE PRECEDENTE A PARTIR D'UN ECHANTILLON D'APPRENTISSAGE. L'ETIQUETAGE DES DIFFERENTS SEGMENTS DE L'IMAGE TIENT COMPTE DU CONTEXTE LOCAL DANS LEQUEL LES SEGMENTS S'INSCRIVENT. CETTE IDEE NOUS A PERMIS DE CONSTRUIRE UNE DESCRIPTION PERTINENTE DE L'IMAGE QUI EST FOURNIE PAR LA SUITE AUX MODELES DE MARKOV CACHES POUR ESTIMER LA PROBABILITE DE VRAISEMBLANCE DE L'IMAGE AVEC CHAQUE ENTREE DU LEXIQUE. L'APPLICATION D'UNE TELLE METHODE A DONNE DES TAUX DE RECONNAISSANCE TRES INTERESSANTS ET A MONTRE UNE CERTAINE ROBUSTESSE FACE A L'AUGMENTATION DE LA TAILLE DU LEXIQUE. LE DEUXIEME PROBLEME SOULEVE QUAND IL S'AGIT DE REALISER UNE RECONNAISSANCE DANS UN GRAND VOCABULAIRE PORTE SUR LE TEMPS D'EXECUTION QUI PEUT DEVENIR REDHIBITOIRE SURTOUT S'IL Y A DES CONTRAINTES DE TEMPS REEL. EN REPONSE A CE PROBLEME, NOUS AVONS DEVELOPPE UNE METHODE DE REDUCTION DE LEXIQUE POUR LA RECONNAISSANCE DE MOTS MANUSCRITS HORS-LIGNE. CETTE METHODE SE BASE SUR L'ESTIMATION D'UNE BORNE SUPERIEURE, A PARTIR D'HEURISTIQUES, POUR LA PROBABILITE DE VRAISEMBLANCE DE L'IMAGE AVEC UNE ENTREE DU LEXIQUE OU PLUSIEURS. LA TECHNIQUE DE REDUCTION CONSISTE A ELIMINER DES ENTREES DU LEXIQUE, SUPPOSES ELOIGNEES, AU FUR ET A MESURE QUE NOUS TROUVONS DANS LE DICTIONNAIRE DES MOTS PROCHES DE L'IMAGE EN ENTREE. LES TESTS ONT MONTRE QUE LE TAUX DE RECONNAISSANCE DE LA METHODE APPROCHE CELUI DE LA METHODE EXHAUSTIVE MAIS LE TAUX MOYEN D'ELAGAGE (69%) RESTE MODESTE.

Reconnaissance hors-ligne par modélisation markovienne de mots manuscrits dans un vocabulaire ouvert

Reconnaissance hors-ligne par modélisation markovienne de mots manuscrits dans un vocabulaire ouvert PDF Author: Cherki Farouz
Publisher:
ISBN:
Category :
Languages : fr
Pages : 436

Get Book Here

Book Description
NOUS DECRIVONS DANS CE MEMOIRE UN SYSTEME DE RECONNAISSANCE DE MOTS MANUSCRITS HORS-LIGNE SANS CONTRAINTE DANS UN GRAND VOCABULAIRE. LA REALISATION D'UN TEL SYSTEME A NECESSITE DE REPONDRE AUX DEUX PROBLEMES SUIVANTS: LE PREMIER PROBLEME PORTE SUR LA DIMINUTION DU TAUX DE RECONNAISSANCE, OBSERVE QUAND IL S'AGIT DE RECHERCHER LE MOT CORRESPONDANT A UNE IMAGE DANS UN GRAND LEXIQUE. LA REPONSE APPORTEE A CE PROBLEME PASSE PAR UNE MEILLEURE CARACTERISATION DE L'IMAGE POUR MIEUX RENSEIGNER LE MODULE DE RECONNAISSANCE. NOUS AVONS DEVELOPPE DANS LE CADRE DE CETTE THESE UNE METHODE D'EXTRACTION DE CARACTERISTIQUES, QUI A PARTIR D'UNE IMAGE DE MOT SEGMENTEE, DETERMINE UNE DESCRIPTION POUR REPRESENTER LE MOT. CETTE REPRESENTATION EST DEDUITE DE L'ETIQUETAGE DES SEGMENTS (ENTITES RESULTANT DE LA PHASE DE SEGMENTATION) A PARTIR D'UN ALPHABET APPELE ENSEMBLE DE GRAPHEMES. UN GRAPHEME EST UNE ENTITE POUVANT CORRESPONDRE A UN MORCEAU DE LETTRE, UNE LETTRE COMPLETE OU DES LETTRES JOINTES. L'ALPHABET DES GRAPHEMES EST CONSTRUIT DANS UNE PHASE PRECEDENTE A PARTIR D'UN ECHANTILLON D'APPRENTISSAGE. L'ETIQUETAGE DES DIFFERENTS SEGMENTS DE L'IMAGE TIENT COMPTE DU CONTEXTE LOCAL DANS LEQUEL LES SEGMENTS S'INSCRIVENT. CETTE IDEE NOUS A PERMIS DE CONSTRUIRE UNE DESCRIPTION PERTINENTE DE L'IMAGE QUI EST FOURNIE PAR LA SUITE AUX MODELES DE MARKOV CACHES POUR ESTIMER LA PROBABILITE DE VRAISEMBLANCE DE L'IMAGE AVEC CHAQUE ENTREE DU LEXIQUE. L'APPLICATION D'UNE TELLE METHODE A DONNE DES TAUX DE RECONNAISSANCE TRES INTERESSANTS ET A MONTRE UNE CERTAINE ROBUSTESSE FACE A L'AUGMENTATION DE LA TAILLE DU LEXIQUE. LE DEUXIEME PROBLEME SOULEVE QUAND IL S'AGIT DE REALISER UNE RECONNAISSANCE DANS UN GRAND VOCABULAIRE PORTE SUR LE TEMPS D'EXECUTION QUI PEUT DEVENIR REDHIBITOIRE SURTOUT S'IL Y A DES CONTRAINTES DE TEMPS REEL. EN REPONSE A CE PROBLEME, NOUS AVONS DEVELOPPE UNE METHODE DE REDUCTION DE LEXIQUE POUR LA RECONNAISSANCE DE MOTS MANUSCRITS HORS-LIGNE. CETTE METHODE SE BASE SUR L'ESTIMATION D'UNE BORNE SUPERIEURE, A PARTIR D'HEURISTIQUES, POUR LA PROBABILITE DE VRAISEMBLANCE DE L'IMAGE AVEC UNE ENTREE DU LEXIQUE OU PLUSIEURS. LA TECHNIQUE DE REDUCTION CONSISTE A ELIMINER DES ENTREES DU LEXIQUE, SUPPOSES ELOIGNEES, AU FUR ET A MESURE QUE NOUS TROUVONS DANS LE DICTIONNAIRE DES MOTS PROCHES DE L'IMAGE EN ENTREE. LES TESTS ONT MONTRE QUE LE TAUX DE RECONNAISSANCE DE LA METHODE APPROCHE CELUI DE LA METHODE EXHAUSTIVE MAIS LE TAUX MOYEN D'ELAGAGE (69%) RESTE MODESTE.

Reconnaissance hors-ligne par modelisation markovienne de mots manuscrits dans un vocabulaire ouvert

Reconnaissance hors-ligne par modelisation markovienne de mots manuscrits dans un vocabulaire ouvert PDF Author: Cherki Farouz
Publisher:
ISBN:
Category :
Languages : fr
Pages : 0

Get Book Here

Book Description


MODELISATION MARKOVIENNE DE L'ECRITURE MANUSCRITE APPLICATION A LA RECONNAISSANCE DES ADRESSES POSTALES

MODELISATION MARKOVIENNE DE L'ECRITURE MANUSCRITE APPLICATION A LA RECONNAISSANCE DES ADRESSES POSTALES PDF Author: ABDENAIM.. EL YACOUBI
Publisher:
ISBN:
Category :
Languages : fr
Pages : 307

Get Book Here

Book Description
NOUS DECRIVONS DANS CE DOCUMENT UNE NOUVELLE METHODE DE MODELISATION DE L'ECRITURE POUR LA RECONNAISSANCE DE MOTS OU DE LOCUTIONS MANUSCRITES. LA TECHNIQUE PROPOSEE CONSISTE A REALISER UNE CARACTERISATION STATISTIQUE DE L'ECRITURE FONDEE SUR LES MODELES DE MARKOV. LE SYSTEME MIS AU POINT APPARTIENT A LA FAMILLE DES SYSTEME OMNI-SCRIPTEUR DE RECONNAISSANCE HORS-LIGNE DES MOTS MANUSCRITS SANS CONTRAINTE DANS UN VOCABULAIRE OUVERT MAIS LIMITE DYNAMIQUEMENT. LE CARACTERE REEL DE L'APPLICATION NOUS EXPOSE A PLUSIEURS DIFFICULTES TELLES QUE LA PRESENCE DE TOUS LES TYPES D'ECRITURE POSSIBLES (BATON, CURSIF, MIXTE), LA VARIATION DANS LES STYLES D'ECRITURE (ECRITURE PENCHEE, TAILLE VARIABLE, ETC.), LE PHENOMENE FREQUENT DES VARIANTES D'ECRITURE, OU ENCORE LES ERREURS DES SCRIPTEURS LORS DE LA REDACTION D'UNE PHRASE OU D'UN MOT. EN REVANCHE, L'APPLICATION ADMET QUELQUES CARACTERISTIQUES POSITIVES QUI FACILITENT LA TACHE DE RECONNAISSANCE. NOTAMMENT, LES LOCUTIONS SONT COMPOSES DE PLUSIEURS MOTS, ET SONT DONC CODES SUR PLUSIEURS CARACTERES. CETTE REDONDANCE REDUIT CONSIDERABLEMENT L'AMBIGUITE ENTRE LES FORMES SOUMISES A LA RECONNAISSANCE. D'AUTRE PART, DES PHRASES DIFFERENTES POSSEDENT RAREMENT DES MOTS COMMUNS, CE QUI AUGMENTE LES CHANCES DE DISCRIMINATION ENTRE LES DIFFERENTS CANDIDATS. NOUS FONDONS NOTRE SYSTEME SUR UNE APPROCHE DE SEGMENTATION BASEE SUR LA RECONNAISSANCE GUIDEE PAR LEXIQUE ET UTILISANT LES MODELES DE MARKOV CACHES. CETTE APPROCHE ADMET UN CARACTERE GLOBAL EN CE SENS QU'ELLE PRIVILEGIE LES DECISIONS DOUCES PAR RAPPORT AUX DECISIONS DURES. LA MODELISATION MARKOVIENNE PERMET D'INTEGRER PLUSIEURS NIVEAUX DE CONNAISSANCE AU SEIN D'UNE REPRESENTATION UNIQUE. CES NIVEAUX CORRESPONDENT A LA RECONNAISSANCE AU NIVEAU CARACTERE, AU NIVEAU MOT, AUX CONNAISSANCES A PRIORI SUR LE LANGAGE DE L'APPLICATION CONSIDEREE, ETC. LES DIFFERENTES ETAPES DU SYSTEME INTERAGISSENT POUR DELIVRER UNE DECISION LORS DE LA RECONNAISSANCE. POUR VALIDER NOTRE METHODE, NOUS AVONS DEVELOPPE UN SYSTEME COMPLET POUR LA RECONNAISSANCE DES MOTS MANUSCRITS DANS LES ADRESSES POSTALES. CE SYSTEME PERMET DE RECONNAITRE ET DE LOCALISER CONJOINTEMENT LE NOM DE VOIE DANS UNE LIGNE DE DISTRIBUTION ET POSSEDE LA CAPACITE D'ETABLIR UNE DECISION DE REJET EN CAS D'AMBIGUITE OU SI LA LIGNE TRAITEE NE CORRESPOND PAS A UNE LIGNE DE DISTRIBUTION. LES TESTS D'EVALUATION SUR DES IMAGES OBTENUES A PARTIR DES ENVELOPPES DU COURRIER REEL DONNENT DES RESULTATS TRES ENCOURAGEANTS ET PROUVENT LA ROBUSTESSE DE NOTRE SYSTEME. DANS LA PREMIERE PARTIE DE CE RAPPORT, NOUS DONNONS UNE VUE GENERALE DU PROBLEME DE LA RECONNAISSANCE DE L'ECRITURE MANUSCRITE EN DISCUTANT LES PROBLEMES RENCONTRES ET LES DIFFERENTES APPROCHES UTILISEES DANS LE DOMAINE. LA SECONDE PARTIE DECRIT DANS L'ORDRE CHRONOLOGIQUE LES DIFFERENTES PHASES DE TRAITEMENT QUI COMPOSENT NOTRE SYSTEME : LES PRETRAITEMENTS, LA SEGMENTATION DES MOTS EN CARACTERES, L'EXTRACTION DE PRIMITIVES ET LA RECONNAISSANCE.

Reconnaissance hors ligne de mots manuscrits cursifs par l'utilisation de systèmes hybrides et de techniques d'apprentissage automatique

Reconnaissance hors ligne de mots manuscrits cursifs par l'utilisation de systèmes hybrides et de techniques d'apprentissage automatique PDF Author: Rami Al Hajj Mohamad
Publisher:
ISBN:
Category :
Languages : fr
Pages : 162

Get Book Here

Book Description
La reconnaissance automatique hors ligne des mots écrits permet d'améliorer l'interaction entre l'homme et la machine dans beaucoup d'applications notamment la bureautique et les tâches de traitement automatique de documents telles que le tri automatique du courrier, l'enregistrement et la vérification des chèques bancaires. La reconnaissance hors ligne des mots manuscrits cursifs, tels que ceux écrits en arabe, reste toujours un problème ouvert. Les difficultés inhérentes à la reconnaissance sont la normalisation de l'écriture, la segmentation des mots en éléments de base ainsi que la modélisation de ces éléments. Concevoir un système pour la reconnaissance automatique hors ligne des mots manuscrits est l'objectif des travaux de recherche de cette thèse. L'approche proposée est de type analytique, sans segmentation explicite des mots en ses caractères constituants, et est basée sur une modélisation stochastique de type MMC (Modèles de Markov Cachés). La méthode adoptée est à deux étapes : une étape de reconnaissance dans laquelle différents types de caractéristiques sont examinés, et une étape pour la combinaison des classifieurs en post-traitement dans laquelle différentes stratégies de combinaison sont appliquées. Les classifieurs combinés en post-traitement prennent en considération les inclinaisons, les positions erronées des marques diacritiques et les chevauchements pouvant exister dans l'écriture manuscrite. Le système de référence basé sur la méthode proposée a montré de trés bonnes performances à la compétition organisée à ICDAR 05, où des systèmes à l'état de l'art ont été comparés et examinés sur la base de référence IFN/ENIT.

Reconnaissance Des Mots Arabes Manuscrits Hors Ligne

Reconnaissance Des Mots Arabes Manuscrits Hors Ligne PDF Author: Nesrine Trimeche
Publisher: Omniscriptum
ISBN: 9786131580727
Category :
Languages : fr
Pages : 108

Get Book Here

Book Description
La reconnaissance d'ecriture manuscrite arabe reste toujours un probleme ouvert. Ceci a cause des difficultes auxquelles sont confrontes les chercheurs et les developpeurs, telles que la variabilite de la forme du style et l'inclinaison de l'ecriture. Compte tenu de la nature cursive et connectee de l'ecriture arabe manuscrite, nous presentons a travers ce travail notre contribution aux recherches sur l'etude de la reconnaissance de l'ecriture manuscrite. La contribution principale de notre travail est la proposition des solutions techniques permettant la realisation d'un systeme de reconnaissance. Pour cela, nous proposons des procedures des pretraitements et de segmentation du mot en des caracteres arabes. Dans ce rapport nous sommes interesses principalement a construire un modele de reseau bayesien dynamique pour la reconnaissance de l'ecriture arabe manuscrite. Ce modele a montre une grande robustesse a la modelisation de l'ecriture cursive. Adapte a la hierarchie du mot arabe bidimensionnel, ce modele est base sur un mariage entre le Modele Markov Cache et le reseau bayesien hierarchique. Cette structure a ete fixee en se basant sur plusieurs parametres."

Reconnaissance de mots manuscrits cursifs par modèles de Markov cachés en contexte

Reconnaissance de mots manuscrits cursifs par modèles de Markov cachés en contexte PDF Author: Anne-Laure Bianne-Bernard
Publisher:
ISBN:
Category :
Languages : fr
Pages : 165

Get Book Here

Book Description
L'objectif de cette thèse est d'élaborer un système de reconnaissance de mots manuscrits pouvant être appris et appliqué sur différents styles d'écriture. L'approche utilisée est une approche analytique: les mots sont découpés en sous-parties (caractères) à modéliser. Le découpage est effectué de manière implicite par l'utilisation de fenêtres glissantes qui permettent de transformer les images de mots en séquences. La méthode choisie pour apprendre les modèles de caractères utilise les modèles de Markov cachés (HMMs). Chaque caractère est représenté par un HMM de type Bakis, ce qui permet d'absorber les variations d'écriture entre scripteurs. Les mots sont reconstruits ensuite par concaténation des modèles qui les composent. Dans cette thèse, le choix est fait de chercher à améliorer la modélisation HMM de caractères en agissant au coeur même des modèles. A cette fin, une nouvelle approche est proposée, qui utilise l'aspect contextuel pour la modélisation : un caractère est modélisé en fonction de son contexte et son modèle est nommé trigraphe. La prise en compte de l'environnement d'un caractère pour sa modélisation implique cependant une multiplication des paramètres HMMs à apprendre sur un nombre souvent restreint de données d'observation. Une méthode originale de regroupement de paramètres est proposée dans ces travaux : le clustering d'états par position à l'aide d'arbres binaires de décision. Ce type de clustering, inédit dans les systèmes de reconnaissance de l'écriture, permet au système de réduire le nombre de paramètres tout en conservant l'un des principaux attraits des HMMs : l'utilisation d'un lexique de test indépendant de celui d'apprentissage.

Modèles markoviens uni- et bidimensionnels pour la reconnaissance de l'écriture manuscrite hors-ligne

Modèles markoviens uni- et bidimensionnels pour la reconnaissance de l'écriture manuscrite hors-ligne PDF Author: George Saon
Publisher:
ISBN:
Category :
Languages : fr
Pages : 159

Get Book Here

Book Description
Cette thèse porte sur l'étude de modélisations stochastiques markoviennes de nature et dimension variables et sur leur application à la reconnaissance de l'écriture manuscrite hors-ligne dans un vocabulaire réduit. Pour les modèles ID, une comparaison est faite entre les HMMs (discrets et semi-continus ) et le modèle à base de trajectoires stochastiques (STM). Les modèles pseudo-2D ou planaires constituent une étape intermédiaire importante dans l'extension de l'appariement élastique au plan. L'accent est mis ensuite sur l'utilisation des champs aléatoires causaux où nous introduisons un nouveau modèle appelé NSHP-HMM. Les propriétés de ce modèle ainsi que les expérimentations effectuées sur la reconnaissance de caractères (imprimés et manuscrits), chiffres manuscrits et mots manuscrits non-contraints dans un vocabulaire réduit sont traitées en détail. L'étude des mécanismes d'apprentissage et des stratégies de reconnaissance est transversale à toutes les modélisations considérées. Dans cette lignée, des réflexions sur la combinaison de classifieurs et sur l'étude du rejet sont émises. Un calcul de complexité accompagné d'éléments liés à l'implémentation montre la faisabilité des modèles proposés dans le cadre d'une application réelle.

The Application of Hidden Markov Models in Speech Recognition

The Application of Hidden Markov Models in Speech Recognition PDF Author: Mark Gales
Publisher: Now Publishers Inc
ISBN: 1601981201
Category : Automatic speech recognition
Languages : en
Pages : 125

Get Book Here

Book Description
The Application of Hidden Markov Models in Speech Recognition presents the core architecture of a HMM-based LVCSR system and proceeds to describe the various refinements which are needed to achieve state-of-the-art performance.

Multiple Classifier Systems

Multiple Classifier Systems PDF Author: Carlo Sansone
Publisher: Springer Science & Business Media
ISBN: 3642215564
Category : Computers
Languages : en
Pages : 382

Get Book Here

Book Description
This book constitutes the refereed proceedings of the 10th International Workshop on Multiple Classifier Systems, MCS 2011, held in Naples, Italy, in June 2011. The 36 revised papers presented together with two invited papers were carefully reviewed and selected from more than 50 submissions. The contributions are organized into sessions dealing with classifier ensembles; trees and forests; one-class classifiers; multiple kernels; classifier selection; sequential combination; ECOC; diversity; clustering; biometrics; and computer security.

Livestock Policy Analysis

Livestock Policy Analysis PDF Author: International Livestock Research Institute
Publisher: ILRI (aka ILCA and ILRAD)
ISBN: 9789291460038
Category : Animal industry
Languages : en
Pages : 268

Get Book Here

Book Description
Policy concepts; Identification of policy issues; Production systems, supply and demand; Market, price and trade policies; Marketing and distribution systems; Budget and manpower planning; Land tenure police for the livestock sector; Policy analysis report writing and communication; Livestock production and marketing in alphabeta - a case study.