Modelo hierárquico para classificação e agrupamento de imagens utilizando combinação de descritores e vocabulário visual semântico/Vinicius Von Glehn de Filippo ; orientador: Zenilton Kleber Gonçalves do Patrocínio Júnior
Autor: | Filippo, Vinicius Von Glehn de |
---|---|
Přispěvatelé: | Patrocínio Júnior, Zenilton Kleber Gonçalves do Orientador, Pontifícia Universidade Católica de Minas Gerais.Programa de Pós-Graduação em Informática Instituição |
Jazyk: | portugalština |
Rok vydání: | 2015 |
Předmět: | |
Zdroj: | Biblioteca Digital de Teses e Dissertações da PUC_MINAS Pontifícia Universidade Católica de Minas Gerais (PUC MINAS) instacron:PUC_MINS |
Popis: | Dissertação (mestrado) - Pontifícia Universidade Católica de Minas Gerais, Programa de Pós-Graduação em Informática Bibliografia: f. 117-120 Resumo: Neste trabalho foi proposta uma estrutura em dois níveis para indexação e recuperação de imagens, combinando de forma hierárquica, seus descritores de características (globais e/ou locais), por meio de estruturas de indexação métricas, de modo a explorar tanto os aspectos de classificação quanto agrupamento mantendo a capacidade de recuperação. O nível superior ou das categorias armazena os descritores de classe das imagens e as referencias para as demais estruturas de indexação que estão no nível inferior ou dos objetos, onde são armazenados os descritores de identificação das imagens. Para realização do agrupamento, é necessário a definição de um valor de raio de abrangência que define quais elementos pertencem a um mesmo agrupamento ou categoria. A estrutura de indexação utilizada foi a Slim-Tree por se tratar de uma estrutura balanceada, dinâmica e projetada para reduzir os problemas de sobreposição de regiões. Para descrição das características das imagens testadas, foram utilizados o GIST e Bag Of Features gerando descritores de 960 dimensões e descritores semânticos reduzidos com 100 dimensões, utilizando vocabulários visuais semânticos. Foram construídas diversas estruturas em dois níveis para que fossem indexadas as várias combinações desses descritores. Para comparar o modelo proposto com as técnicas normalmente utilizadas de classificação e agrupamento foram utilizados a Slim-Tree (sem divisão de níveis) e o K-means, respectivamente. Os testes realizados mostraram que apesar do modelo proposto não ter apresentado resultados superiores em todos os casos, atingiu bons resultados com a vantagem de possibilitar tanto a classificação quanto o agrupamento em uma única estrutura, além de apresentar tempos médios de execução reduzidos para recuperação, nos casos dos descritores semânticos reduzidos. Além disso, ainda apresentou as vantagens da extração automatizada das características das imagens sem a necessidade da supervisão, dispensou também a utilização de aprendizado de máquina que além de consumir muito tempo para treinamento ainda apresenta a dificuldade da obtenção de uma base de dados previa e adequadamente rotulada, demonstrou que é possível através da utilização dos conceitos de análise semântica latente com a aplicação da decomposição de valores singulares é possível obter bons resultados com descritores semânticos reduzidos, tornando todo o processo muito mais ágil e eficiente. Abstract: The propose of this work is a two level indexing and retrieval structure that combine image feature descriptors (local and/or global ones) in a hierarchical mode using metric index structures, in order to explore classification and clustering without loosing the retrieval capacity. The above level called class level, store the image classes and links to other indexing structures in the bottom level called object level, where the identifiers descriptors are stored. A range radius definition is necessary to deal with clustering in order to decide which objects belongs to each class. The Slim Tree was the used metric structure because it is balanced, dynamic and able to deal with region overlapping problems. To describe the image features the choice were GIST and Bag of Features descriptors. They yield 960 dimension descriptors and 100 semantic reduced dimension descriptors using semantic visual vocabulary. Many two level structures were build to receive the combine descriptors. In order to compare the proposed model with the traditional classification and clustering approaches the choice were using Slim-Tree (without split levels) and the K-means. Experiments showed despite the propose model couldn't achieve the best results every cases, good results were achieved including the advantages of possibiliting classification and clustering at the same structure. Good medium execution times results also achieved by the semantic reduced descriptors. Other advantages achieves when using the propose model can be cited as dispensing learn machine and the possible use of latent semantic analysis concepts applying single value decomposition in order to turn all process more agile and efficient. |
Databáze: | OpenAIRE |
Externí odkaz: |