Extensão do bag-of-visual-features para incorporar informação espacial na descrição de características de acordo com a percepção visual humana
Autor: | Soares, Robson de Carvalho |
---|---|
Přispěvatelé: | Guliato, Denise, Barcelos, Célia Aparecida Zorzo, Silva, Ilmério Reis da, Torres, Ricardo da Silva |
Rok vydání: | 2022 |
Předmět: | |
Zdroj: | Repositório Institucional da UFU Universidade Federal de Uberlândia (UFU) instacron:UFU |
Popis: | Bag-of-visual-features is a well-known approach for pattern classication and contentbased image retrieval. The entire image is described by a normalized histogram of frequencies of visual words. In this case, objects of interest on large background area or on dierent background scenes, may not be correctly recognized. In this work we propose to extract the relevant scenes of the image (foreground) according to the human being visual perception using the saliency map approach. In our proposal, the histogram is built on weight visual words according to the saliency map on two approaches, fuzzy and binary, to incorporate a distinguish between information of background and foreground. Our method was tested on databases that contain images with dierent conditions of illumination, color, rigid and scale transformations, and changes of the background. The analysis of the results demonstrates that our proposal presents signicant improvements over other tested approaches. Bag-of-visual-features é uma abordagem bem conhecida pela classicação de padrões e recuperação de imagens por conteúdo. Toda a imagem é descrita por um histograma normalizado de frequências de palavras visuais. Neste caso, objetos de interesse em grandes áreas e/ou diferentes cenas de fundo, podem não ser corretamente reconhecidos. Neste trabalho, propomos extrair as partes relevantes da imagem (foreground) de acordo com a percepção visual humana utilizando a abordagem de extração de mapas de saliências. Em nossa proposta, o histograma é construído ponderando as palavras visuais de acordo com o mapa de saliência em duas abordagens, fuzzy e binária, incorporando uma distinção entre informação de fundo (background) e primeiro plano (foreground). Nosso método foi testado usando bases de dados de imagens com diferentes condições de iluminação, cores, posicionamento, escala, e mudanças de fundo. A análise dos resultados demonstra que a nossa proposta apresenta melhorias signicativas sobre outras abordagens testadas. Mestre em Ciência da Computação |
Databáze: | OpenAIRE |
Externí odkaz: |