Reconnaissance hors ligne de mots manuscrits cursifs par l'utilisation de systèmes hybrides et de techniques d'apprentissage automatique

Reconnaissance hors ligne de mots manuscrits cursifs par l'utilisation de systèmes hybrides et de techniques d'apprentissage automatique PDF Author: Rami Al Hajj Mohamad
Publisher:
ISBN:
Category :
Languages : fr
Pages : 162

Get Book Here

Book Description
La reconnaissance automatique hors ligne des mots écrits permet d'améliorer l'interaction entre l'homme et la machine dans beaucoup d'applications notamment la bureautique et les tâches de traitement automatique de documents telles que le tri automatique du courrier, l'enregistrement et la vérification des chèques bancaires. La reconnaissance hors ligne des mots manuscrits cursifs, tels que ceux écrits en arabe, reste toujours un problème ouvert. Les difficultés inhérentes à la reconnaissance sont la normalisation de l'écriture, la segmentation des mots en éléments de base ainsi que la modélisation de ces éléments. Concevoir un système pour la reconnaissance automatique hors ligne des mots manuscrits est l'objectif des travaux de recherche de cette thèse. L'approche proposée est de type analytique, sans segmentation explicite des mots en ses caractères constituants, et est basée sur une modélisation stochastique de type MMC (Modèles de Markov Cachés). La méthode adoptée est à deux étapes : une étape de reconnaissance dans laquelle différents types de caractéristiques sont examinés, et une étape pour la combinaison des classifieurs en post-traitement dans laquelle différentes stratégies de combinaison sont appliquées. Les classifieurs combinés en post-traitement prennent en considération les inclinaisons, les positions erronées des marques diacritiques et les chevauchements pouvant exister dans l'écriture manuscrite. Le système de référence basé sur la méthode proposée a montré de trés bonnes performances à la compétition organisée à ICDAR 05, où des systèmes à l'état de l'art ont été comparés et examinés sur la base de référence IFN/ENIT.

Reconnaissance hors ligne de mots manuscrits cursifs par l'utilisation de systèmes hybrides et de techniques d'apprentissage automatique

Reconnaissance hors ligne de mots manuscrits cursifs par l'utilisation de systèmes hybrides et de techniques d'apprentissage automatique PDF Author: Rami Al Hajj Mohamad
Publisher:
ISBN:
Category :
Languages : fr
Pages : 162

Get Book Here

Book Description
La reconnaissance automatique hors ligne des mots écrits permet d'améliorer l'interaction entre l'homme et la machine dans beaucoup d'applications notamment la bureautique et les tâches de traitement automatique de documents telles que le tri automatique du courrier, l'enregistrement et la vérification des chèques bancaires. La reconnaissance hors ligne des mots manuscrits cursifs, tels que ceux écrits en arabe, reste toujours un problème ouvert. Les difficultés inhérentes à la reconnaissance sont la normalisation de l'écriture, la segmentation des mots en éléments de base ainsi que la modélisation de ces éléments. Concevoir un système pour la reconnaissance automatique hors ligne des mots manuscrits est l'objectif des travaux de recherche de cette thèse. L'approche proposée est de type analytique, sans segmentation explicite des mots en ses caractères constituants, et est basée sur une modélisation stochastique de type MMC (Modèles de Markov Cachés). La méthode adoptée est à deux étapes : une étape de reconnaissance dans laquelle différents types de caractéristiques sont examinés, et une étape pour la combinaison des classifieurs en post-traitement dans laquelle différentes stratégies de combinaison sont appliquées. Les classifieurs combinés en post-traitement prennent en considération les inclinaisons, les positions erronées des marques diacritiques et les chevauchements pouvant exister dans l'écriture manuscrite. Le système de référence basé sur la méthode proposée a montré de trés bonnes performances à la compétition organisée à ICDAR 05, où des systèmes à l'état de l'art ont été comparés et examinés sur la base de référence IFN/ENIT.

Etude et réalisation d'un système adaptatif pour la reconnaissance en ligne de mots manuscrits

Etude et réalisation d'un système adaptatif pour la reconnaissance en ligne de mots manuscrits PDF Author: Laurent Duneau
Publisher:
ISBN:
Category :
Languages : fr
Pages : 215

Get Book Here

Book Description
L'utilisation du stylo comme interface homme-machine nécessite la mise au point de systèmes de reconnaissance performants. De plus, pour améliorer le confort de l'utilisateur, et donc, sa productivité, il est très souhaitable de pouvoir identifier des mots manuscrits cursifs, dans lesquels les lettres ne sont pas obligatoirement séparées les unes des autres. Nous proposons ici un système qui effectue simultanément reconnaissance et segmentation en lettres, pour un vocabulaire prédéfini de plusieurs dizaines de milliers de mots. La solution envisagée repose sur un ensemble de prototypes de lettres, ainsi que sur une recherche heuristique, dirigée par le lexique. La principale originalité de ce système est sa grande capacité d'apprentissage. Celui-ci peut en effet apprendre automatiquement l'écriture d'un utilisateur donné, directement à partir d'un échantillon de quelques dizaines à quelques centaines de mots manuscrits. Cette opération est fondée sur un module qui permet de segmenter en lettres un ensemble de mots étiquettés, sans intervention humaine. En suivant le même principe, notre système est également capable de s'adapter à une nouvelle écriture au cours de son utilisation. Cette adaptation continue permet d'obtenir des taux de reconnaissance supérieurs à 95%, pour un vocabulaire de près de 25000 mots.

Architecture et apprentissage d'un système hybride neuro-markovien pour la reconnaissance de l'écriture manuscrite en-ligne

Architecture et apprentissage d'un système hybride neuro-markovien pour la reconnaissance de l'écriture manuscrite en-ligne PDF Author: Émilie Poisson
Publisher:
ISBN:
Category :
Languages : fr
Pages : 394

Get Book Here

Book Description
Les travaux présentés dans le cadre de cette thèse portent sur l'étude, la conception, le développement et le test d'un système de reconnaissance de mots manuscrits non contraints en-ligne pour une application omni-scripteurs. Le système proposé repose sur une architecture hybride neuro-markovienne comportant d'une part, un réseau de neurones à convolution (TDNN et/ou SDNN), et d'autre part des modèles de Markov à états cachés (MMC). Le réseau de neurones a une vision globale et travaille au niveau caractère, tandis que le MMC s'appuie sur une description plus locale et permet le passage du caractère au niveau mot. Nous avons d'abord étudié le système de reconnaissance au niveau caractère isolé (digits, majuscules, minuscules) et optimisé les architectures des réseaux en termes de performances et de taille. La seconde partie du travail a porté sur le passage au niveau mot. Ici, l'effort a consisté avant tout à la définition d'un schéma d'apprentissage global au niveau mot qui permet d'assurer la convergence globale du système, en définissant une fonction d'objectif qui mixe des critères basés modèle générateur (typiquement par maximum de vraisemblance) et des critères discriminants (de type maximum d'information mutuelle). Les différentes résultats présentés (sur les bases MNIST, IRONOFF, UNIPEN) montrent l'influence des principaux paramètres du système, soit en termes de topologie, de sources d'information, de modèles d'apprentissage (nombre d'états, pondération des critères, durée)

CONTRIBUTION A LA LECTURE DE DOCUMENTS PAPIER MANUSCRITS

CONTRIBUTION A LA LECTURE DE DOCUMENTS PAPIER MANUSCRITS PDF Author: Zsolt Wimmer
Publisher:
ISBN:
Category :
Languages : fr
Pages : 246

Get Book Here

Book Description
CETTE THESE EST CONSACREE A LA RECONNAISSANCE DE DOCUMENTS PAPIER MANUSCRITS DANS LE CONTEXTE PARTICULIER DE LA LECTURE AUTOMATIQUE DES EN-TETES DE TELECOPIE. CES EN-TETES PORTENT DEUX PRINCIPAUX TYPES D'INFORMATIONS : DES CHAMPS NUMERIQUES (NUMEROS DE TELEPHONE ET NUMEROS DE TELECOPIE) ET DES CHAMPS CURSIFS (NOM DU DESTINATAIRE ET DE L'EXPEDITEUR). DEUX STRATEGIES DIFFERENTES ONT ETE ELABOREES POUR TRAITER CES DEUX TYPES D'INFORMATION. LE SYSTEME DE RECONNAISSANCE DE NUMEROS DE TELEPHONE SE COMPOSE DE MODULES DE SEGMENTATION SIMPLES SUPERVISES PAR UN GESTIONNAIRE. CELUI-CI PROPOSE DES RETOURS SUR LA SEGMENTATION EN FONCTION DU RESULTAT DU MODULE DE RECONNAISSANCE. LA RECONNAISSANCE ET LE REJET SONT REALISES PAR DES RESEAUX DE NEURONES. LE SYSTEME NEURONAL PREDICTIF POUR LA RECONNAISSANCE HORS-LIGNE DE MOTS EST BASE SUR UN MODELE DE MARKOV CACHE (HMM) HYBRIDE. LE MODELE DE MARKOV DE MOT EST CONSTITUE PAR L'AGENCEMENT DES HMMS DES LETTRES COMPOSANT CE MOT. EN EFFECTUANT UN BALAYAGE GAUCHE-DROITE SUR L'IMAGE DU MOT ET DE PAR LA NATURE GAUCHE-DROITE DU HMM, DES MORCEAUX SUCCESSIFS DE L'IMAGE SONT MODELISES PAR DIFFERENTS RESEAUX DE NEURONES MULTICOUCHES. AU COURS DE L'APPRENTISSAGE, UNE SEGMENTATION DYNAMIQUE DE L'IMAGE DU MOT PRESENTE EST UTILISEE POUR ENTRAINER LES RESEAUX DE NEURONES PRESENTS DANS CHAQUE HMM DE LETTRE. LA RECONNAISSANCE EST EFFECTUEE PAR SEGMENTATION ADAPTATIVE DANS LE CADRE D'UNE COMPETITION ENTRE LES MODELES DE LETTRE. UNE METHODE DE PRESELECTION DU LEXIQUE PERMET DE REDUIRE CONSIDERABLEMENT LA DIMENSION DE CELUI-CI ET AINSI D'ACCELERER LA RECONNAISSANCE. LES DIFFERENTS ASPECTS DE L'ETUDE PRESENTEE SONT APPROFONDIS TANT SUR LE PLAN BIBLIOGRAPHIQUE QUE SUR LE PLAN ALGORITHMIQUE. ILS ONT CONDUIT A LA MISE AU POINT DE METHODES DE RECONNAISSANCE ROBUSTES QUI ONT ETE VALIDEES EXPERIMENTALEMENT SUR NOS BASES DE DONNEES, CORRESPONDANT A DES PERFORMANCES SATISFAISANTES, MONTRANT PAR-LA L'INTERET DE NOS APPROCHES.

Reconnaissance de mots manuscrits par systèmes hybrides

Reconnaissance de mots manuscrits par systèmes hybrides PDF Author: Emmanuel Augustin
Publisher:
ISBN:
Category :
Languages : fr
Pages : 188

Get Book Here

Book Description
Ce mémoire présente un système de lecture de mots manuscrits isolés, appartenant à un lexique, avec des techniques combinées réseaux de neurones (RN) et modèles de Markov cachés (MMC). Les RN et les MMC ont été abondamment étudiés pour la reconnaissance de la parole entre autre. Leur maitrise a motivé depuis 10 ans de nombreux travaux pour combiner les atouts des deux outils, en discrimination et en modélisation des séquences. Quelques systèmes sont présentés pour la parole ou l'écrit. Le principe des systèmes hybrides RN et MMC est présenté avec son apprentissage itératif selon l'algorithme expectation maximisation (EM). Ce système pemet de remplacer la qualification vectorielle des MMC discrets, classification non supervisée qui perd beaucoup d'information, par un RN....

Reconnaissance Des Mots Arabes Manuscrits Hors Ligne

Reconnaissance Des Mots Arabes Manuscrits Hors Ligne PDF Author: Nesrine Trimeche
Publisher: Omniscriptum
ISBN: 9786131580727
Category :
Languages : fr
Pages : 108

Get Book Here

Book Description
La reconnaissance d'ecriture manuscrite arabe reste toujours un probleme ouvert. Ceci a cause des difficultes auxquelles sont confrontes les chercheurs et les developpeurs, telles que la variabilite de la forme du style et l'inclinaison de l'ecriture. Compte tenu de la nature cursive et connectee de l'ecriture arabe manuscrite, nous presentons a travers ce travail notre contribution aux recherches sur l'etude de la reconnaissance de l'ecriture manuscrite. La contribution principale de notre travail est la proposition des solutions techniques permettant la realisation d'un systeme de reconnaissance. Pour cela, nous proposons des procedures des pretraitements et de segmentation du mot en des caracteres arabes. Dans ce rapport nous sommes interesses principalement a construire un modele de reseau bayesien dynamique pour la reconnaissance de l'ecriture arabe manuscrite. Ce modele a montre une grande robustesse a la modelisation de l'ecriture cursive. Adapte a la hierarchie du mot arabe bidimensionnel, ce modele est base sur un mariage entre le Modele Markov Cache et le reseau bayesien hierarchique. Cette structure a ete fixee en se basant sur plusieurs parametres."

RECONNAISSANCE DE CARACTERES MANUSCRITS

RECONNAISSANCE DE CARACTERES MANUSCRITS PDF Author: LAURENT.. HEUTTE
Publisher:
ISBN:
Category :
Languages : fr
Pages : 250

Get Book Here

Book Description
CETTE THESE TRAITE DE LA RECONNAISSANCE DE CARACTERES MANUSCRITS PROVENANT DE LA SEGMENTATION D'UN MOT OU D'UNE CHAINE DE CARACTERES NUMERIQUES DANS LE CONTEXTE PARTICULIER DE LA LECTURE AUTOMATIQUE DE CHEQUES ET D'ENVELOPPES POSTALES. LE PREMIER CHAPITRE PRESENTE UN ETAT DE L'ART DANS LE DOMAINE DE LA RECONNAISSANCE DE L'ECRIT ET NOTAMMENT LES ETAPES CONCERNANT LA CONCEPTION D'UN SYSTEME DE RECONNAISSANCE DE CARACTERES. LE DEUXIEME CHAPITRE TRAITE DE LA RECONNAISSANCE PROPREMENT DITE. APRES UNE ANALYSE DETAILLEE DES DIFFERENTES METHODES PROPOSEES DANS LA LITTERATURE, LES DEUX METHODES RETENUES, LA SEPARATION LINEAIRE ET LA DISTANCE DE MAHALANOBIS, SONT DECRITES. LE TROISIEME CHAPITRE EST CONSACRE A LA DEFINITION DES CARACTERISTIQUES ET A LA CONSTRUCTION DU VECTEUR REPRESENTANT CHAQUE CARACTERE. LES FAMILLES DE CARACTERISTIQUES RETENUES, INCLUANT A LA FOIS DES MESURES STATISTIQUES ET DES PRIMITIVES STRUCTURELLES, SONT DETECTEES A PARTIR DE DIFFERENTES REPRESENTATIONS DU CARACTERE. UN ALGORITHME DE RECHERCHE D'UNE COMBINAISON OPTIMALE REPRESENTATION/FAMILLE DE CARACTERISTIQUES EST PRESENTE. LE CHOIX DE LA DIMENSION DU VECTEUR ET LE PROBLEME DES COMPOSANTES MANQUANTES POUR CERTAINES OBSERVATIONS SONT DISCUTES. LE DERNIER CHAPITRE PRESENTE LES DIFFERENTES APPLICATIONS DANS LESQUELLES LES TRAVAUX DE LA THESE ONT ETE INTEGRES. LES DEUX PREMIERES APPLICATIONS CONCERNENT LA LECTURE AUTOMATIQUE DES ENVELOPPES POSTALES AMERICAINES ET PLUS SPECIALEMENT LA RECONNAISSANCE DE GRAPHEMES ISSUS DE LA SEGMENTATION DES MOTS MANUSCRITS CURSIFS AINSI QUE LA RECONNAISSANCE DES CHIFFRES PROVENANT DE LA SEGMENTATION DU CODE POSTAL. LA TROISIEME APPLICATION CONCERNE LA LECTURE AUTOMATIQUE DES CHEQUES POSTAUX FRANCAIS ET PLUS PARTICULIEREMENT LA RECONNAISSANCE DES CHIFFRES ISSUS DE LA SEGMENTATION DES DEUX MONTANTS NUMERIQUES. LES DIFFERENTS ASPECTS DE L'ETUDE PRESENTEE SONT APPROFONDIS TANT SUR LE PLAN BIBLIOGRAPHIQUE QUE SUR LE PLAN ALG ORITHMIQUE. ILS ONT CONDUIT A LA MISE AU POINT DE METHODES DE RECONNAISSANCE ROBUSTES QUI ONT ETE VALIDEES EXPERIMENTALEMENT SUR D'IMPORTANTES BASES DE CARACTERES ET DE MOTS MANUSCRITS

Reconnaissance de mots manuscrits cursifs par modèles de Markov cachés en contexte

Reconnaissance de mots manuscrits cursifs par modèles de Markov cachés en contexte PDF Author: Anne-Laure Bianne-Bernard
Publisher:
ISBN:
Category :
Languages : fr
Pages : 165

Get Book Here

Book Description
L'objectif de cette thèse est d'élaborer un système de reconnaissance de mots manuscrits pouvant être appris et appliqué sur différents styles d'écriture. L'approche utilisée est une approche analytique: les mots sont découpés en sous-parties (caractères) à modéliser. Le découpage est effectué de manière implicite par l'utilisation de fenêtres glissantes qui permettent de transformer les images de mots en séquences. La méthode choisie pour apprendre les modèles de caractères utilise les modèles de Markov cachés (HMMs). Chaque caractère est représenté par un HMM de type Bakis, ce qui permet d'absorber les variations d'écriture entre scripteurs. Les mots sont reconstruits ensuite par concaténation des modèles qui les composent. Dans cette thèse, le choix est fait de chercher à améliorer la modélisation HMM de caractères en agissant au coeur même des modèles. A cette fin, une nouvelle approche est proposée, qui utilise l'aspect contextuel pour la modélisation : un caractère est modélisé en fonction de son contexte et son modèle est nommé trigraphe. La prise en compte de l'environnement d'un caractère pour sa modélisation implique cependant une multiplication des paramètres HMMs à apprendre sur un nombre souvent restreint de données d'observation. Une méthode originale de regroupement de paramètres est proposée dans ces travaux : le clustering d'états par position à l'aide d'arbres binaires de décision. Ce type de clustering, inédit dans les systèmes de reconnaissance de l'écriture, permet au système de réduire le nombre de paramètres tout en conservant l'un des principaux attraits des HMMs : l'utilisation d'un lexique de test indépendant de celui d'apprentissage.

Reconnaissance automatique de l'écriture arabe manuscrite

Reconnaissance automatique de l'écriture arabe manuscrite PDF Author: Leila Chergui
Publisher: Presses Academiques Francophones
ISBN: 9783838149400
Category :
Languages : fr
Pages : 240

Get Book Here

Book Description
Le travail presente dans cet ouvrage est consacre a la conception d'une nouvelle base de mots arabes manuscrits representant des noms des communes algeriennes, et au developpement et l'evaluation d'un nouveau systeme de reconnaissance hors-ligne de mots arabes manuscrits base sur une combinaison de trois classifieurs neuronaux qui sont: un Perceptron Multi-Couches, un reseau a base de fonctions radiales et un reseau Fuzzy ART. Le systeme propose utilise une methode de reconnaissance globale. Pour cela, plusieurs etapes de pretraitement sont appliquees aux images de mots, incluant: un lissage, une normalisation, une squelettisation, un redressement et une extraction de contour. Trois types de moments geometriques ont ete utilises comme primitives, a savoir: les moments de Hu, les moments de Tchebichef et les moments de Zernike ont ete utilises; chacun d'eux a ete exploite par un classifieur neuronal different. L'evaluation du systeme de reconnaissance propose a ete menee sur deux bases de mots: IFN/ENIT et notre base nouvellement concue. Les resultats obtenus sont satisfaisant et comparable a des travaux pertinents realises dans le domaine de la reconnaissance du script arabe.

Reconnaissance hors-ligne de l'écriture cursive par l'utilisation de modèles perceptifs et neuronaux

Reconnaissance hors-ligne de l'écriture cursive par l'utilisation de modèles perceptifs et neuronaux PDF Author: José Ruiz Pinales
Publisher:
ISBN:
Category :
Languages : fr
Pages : 352

Get Book Here

Book Description
CETTE THÈSE PORTE SUR L'APPLICATION DE MODÈLES PERCEPTIFS ET NEURONAUX AU PROBLÈME DE LA RECONNAISSANCE HORS-LIGNE DE L'ÉCRITURE CURSIVE. DANS UN PREMIER TEMPS, NOUS ABORDONS LE PROBLÈME DE L'EXTRACTION DE CARACTÉRISTIQUES PAR L'UTILISATION D'UNE TECHNIQUE ROBUSTE DE DÉTECTION DE DROITES. PUIS, NOUS APPLIQUONS CETTE MÉTHODE AU PROBLÈME DE LA RECONNAISSANCE DE CARACTÈRES CURSIFS SEGMENTÉS. NOUS UTILISONS ENSUITE CETTE MÉTHODE POUR LA RECONNAISSANCE HOLISTIQUE DE MOTS CURSIFS AINSI QU'À LA RECONNAISSANCE DE LEURS PREMIÈRES ET DERNIÈRES LETTRES. NOUS NOUS INTÉRESSONS ENFIN À LA MISE AU POINT D'UN MODÈLE PERCEPTIF POUR LA RECONNAISSANCE DE MOTS CURSIFS. NOTRE MÉTHODE D'EXTRACTION DE CARACTÉRISTIQUES EST CAPABLE DE CAPTURER UNE GRANDE PARTIE DE L'INFORMATION CONTENUE DANS LA PARTIE SINGULIÈRE DU MOT CURSIF (ASCENDANTS, DESCENDANTS ET BOUCLES) ET PRÉSENTE UNE TRÈS BONNE TOLÉRANCE AU BRUIT ET AUX DÉCONNEXIONS DU TRACÉ. LE MODÈLE D'ACTIVATION INTERACTIF EST CAPABLE DE MODÉLISER L'ACCÈS LEXICAL, L'EFFET DE SUPÉRIORITÉ DU MOT ET L'EFFET DE FRÉQUENCE. L'EFFET DE SUPÉRIORITÉ DU MOT PEUT D'AILLEURS ÊTRE EN PARTIE ATTRIBUÉ A LA RÉGULARITÉ DES CHAINES DE LETTRES. NOUS AVONS PROPOSÉ L'UTILISATION D'UNE ÉTAPE DE PRÉ-RECONNAISSANCE DE CHAINES DE LETTRES ET UNE ÉTAPE DE RECONNAISSANCE DE MOTS BASÉE SUR UN PROCESSUS D'ACTIVATION INTERACTIF AFIN DE PRENDRE EN COMPTE CES EFFETS. LA RECONNAISSANCE ÉTANT CONTRAINTE PAR LES EXTRÉMITÉS DU MOT, LES LETTRES EXTERNES SONT DE CE FAIT MIEUX RECONNUES QUE LES LETTRES INTERNES. AINSI, NOUS POUVONS SIMULER UN PROCESSUS DE RECONNAISSANCE ALLANT DE L'EXTÉRIEUR VERS L'INTÉRIEUR DU MOT NOUS AVONS VALIDÉ NOS MÉTHODES POUR UNE TÂCHE DE RECONNAISSANCE DÉ CARACTÈRES CURSIFS SEGMENTÉS ET UNE TÂCHE DE RECONNAISSANCE DE MOTS CURSIFS ISOLÉS POUR LESQUELLES NOUS AVONS OBTENU DES RÉSULTATS INTÉRESSANTS.