Estimació de la grandària de la 'bounding box' de paraules en text manuscrit des de la seua transcripció

Autor: Maroto Llamas, Javier
Jazyk: Spanish; Castilian
Rok vydání: 2022
Předmět:
Zdroj: RiuNet. Repositorio Institucional de la Universitat Politécnica de Valéncia
instname
Popis: [ES] Debido al incremento en los documentos manuscritos digitalizados, estimar el tamaño de las palabras escritas por un autor resulta relevante en el campo de la visión por computador, pues permite estimar el tamaño de las ventanas de búsqueda en las imágenes. Siendo un modelo de Query-by-String, permite la búsqueda de cualquier palabra aunque no esté en los datos de entrenamiento. Esto tiene aplicaciones tanto en el procesado de documentos como en la detección de palabras clave o el reconocimiento de entidades nombradas. En este trabajo, se estudia este problema y se realiza una aproximación aplicando distintas técnicas, métodos y clasificadores de aprendizaje automático. Se expone así el conjunto de datos obtenido, la metodología usada para obtener los resultados y los resultados finales, que dentro de las limitaciones son bastante favorables [EN] Due to the increase in digitized handwritten documents, estimating the size of the words written by an author is relevant in the field of computer vision, as it allows estimating the size of search windows in images. Being a Query-By-String model, it allows the search of any word even if it was not included in the training dataset. This has key applications in document processing tasks such as keyword spotting or named-entity recognition. In this work, this problem is studied and an approximation is made by applying different techniques, methods and classifiers of machine learning. The dataset obtained, the methodology used to obtain the results and the final results, which within the limitations are quite favorable, are thus presented.
Databáze: OpenAIRE