Extraction de structure de documents manuscrits non contraints par Champs Aléatoires Conditionnels 2D

Autor:	Montreuil, Florent, Grosicki, Emmanuèle, Nicolas, Stéphane, Heutte, Laurent
Přispěvatelé:	Laboratoire d'Informatique, de Traitement de l'Information et des Systèmes (LITIS), Institut national des sciences appliquées Rouen Normandie (INSA Rouen Normandie), Institut National des Sciences Appliquées (INSA)-Normandie Université (NU)-Institut National des Sciences Appliquées (INSA)-Normandie Université (NU)-Université de Rouen Normandie (UNIROUEN), Normandie Université (NU)-Université Le Havre Normandie (ULH), Normandie Université (NU), CEP Arcueil (DGA/CTA/DT/GIP), Délégation Générale pour l'Armement, Equipe Apprentissage (DocApp - LITIS), Normandie Université (NU)-Institut national des sciences appliquées Rouen Normandie (INSA Rouen Normandie)
Jazyk:	francouzština
Rok vydání:	2009
Předmět:	programmation dynamique 2D documents manuscrits non contraints [INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing champs aléatoires conditionnels segmentation analyse d'images de documents modèles markoviens [SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing
Zdroj:	Actes du XXIIe colloque GRETSI (traitement du signal et des images) XXIIe colloque GRETSI (traitement du signal et des images) XXIIe colloque GRETSI (traitement du signal et des images), Sep 2009, Dijon, France. http://hdl.handle.net/2042/29097, ⟨10.4267/2042/29097⟩
DOI:	10.4267/2042/29097⟩
Popis:	National audience; Cette article décrit une nouvelle approche utilisant des Champs Aléatoires Conditionnels (CACs) pour extraire la mise en page de documents manuscrits non contraints. Dans cette approche, l'extraction de la mise en page est considérée comme une tâche d'étiquetage consistant à assigner une étiquette à chaque pixel de l'image du document. Le modèle CAC donne directement accès à la probabilité conditionnelle globale d'un étiquetage de l'image sachant des caractéristiques image et des connaissances a priori sur la structure du document modélisées. Pour déterminer l'étiquetage optimal, un point clé de notre modèle est l'implémentation de l'algorithme d'inférence optimal de Programmation Dynamique 2D. Ce modèle a été testé sur 1250 lettres manuscrites de la base RIMES. De bons résultats ont été obtenus montrant la capacité de cette approche à extraire la mise en page d'un document complexe à partir d'informations de différentes natures. (morphologiques, spatiales, ...)
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=dedup_wf_001::271ecff6cdc1a508542941f073a5d472 https://hal.archives-ouvertes.fr/hal-00509221 Zobrazit plný text záznamu