Extraction de structure de documents manuscrits non contraints par Champs Aléatoires Conditionnels 2D
Autor: | Montreuil, Florent, Grosicki, Emmanuèle, Nicolas, Stéphane, Heutte, Laurent |
---|---|
Přispěvatelé: | Laboratoire d'Informatique, de Traitement de l'Information et des Systèmes (LITIS), Institut national des sciences appliquées Rouen Normandie (INSA Rouen Normandie), Institut National des Sciences Appliquées (INSA)-Normandie Université (NU)-Institut National des Sciences Appliquées (INSA)-Normandie Université (NU)-Université de Rouen Normandie (UNIROUEN), Normandie Université (NU)-Université Le Havre Normandie (ULH), Normandie Université (NU), CEP Arcueil (DGA/CTA/DT/GIP), Délégation Générale pour l'Armement, Equipe Apprentissage (DocApp - LITIS), Normandie Université (NU)-Institut national des sciences appliquées Rouen Normandie (INSA Rouen Normandie) |
Jazyk: | francouzština |
Rok vydání: | 2009 |
Předmět: | |
Zdroj: | Actes du XXIIe colloque GRETSI (traitement du signal et des images) XXIIe colloque GRETSI (traitement du signal et des images) XXIIe colloque GRETSI (traitement du signal et des images), Sep 2009, Dijon, France. http://hdl.handle.net/2042/29097, ⟨10.4267/2042/29097⟩ |
DOI: | 10.4267/2042/29097⟩ |
Popis: | National audience; Cette article décrit une nouvelle approche utilisant des Champs Aléatoires Conditionnels (CACs) pour extraire la mise en page de documents manuscrits non contraints. Dans cette approche, l'extraction de la mise en page est considérée comme une tâche d'étiquetage consistant à assigner une étiquette à chaque pixel de l'image du document. Le modèle CAC donne directement accès à la probabilité conditionnelle globale d'un étiquetage de l'image sachant des caractéristiques image et des connaissances a priori sur la structure du document modélisées. Pour déterminer l'étiquetage optimal, un point clé de notre modèle est l'implémentation de l'algorithme d'inférence optimal de Programmation Dynamique 2D. Ce modèle a été testé sur 1250 lettres manuscrites de la base RIMES. De bons résultats ont été obtenus montrant la capacité de cette approche à extraire la mise en page d'un document complexe à partir d'informations de différentes natures. (morphologiques, spatiales, ...) |
Databáze: | OpenAIRE |
Externí odkaz: |