Toward robust information extraction models for multimedia documents

Toward robust information extraction models for multimedia documents PDF Author: Ali Reza Ebadat
Publisher:
ISBN:
Category :
Languages : fr
Pages : 161

Get Book Here

Book Description
L'énorme quantité de documents multimédias constamment générés incite au développement de méthodes d'analyse automatique. Dans ce cadre, notre objectif est de faciliter ce processus en extrayant des informations à partir de n'importe quel texte relatif à ces documents. En outre, nous voulons des techniques suffisamment robustes pour traiter des données bruitées et de petite taille. Pour ce faire, nous utilisons des techniques simples nécessitant peu de connaissances externes comme une garantie de robustesse. Plus précisément, nous utilisons des techniques inspirées de la recherche d'information et de l'analyse statistique. Dans cette thèse, nous montrons expérimentalement que des techniques simples, sans connaissance a priori peuvent être utiles pour extraire efficacement les informations à partir du texte. Dans notre cas, ces bons résultats ont été obtenus en choisissant une représentation adaptée pour les données au lieu d'exiger de traitements complexes.