Detecção de estímulo visual usando múltiplas fóveas

Autor: Medeiros, Petrúcio Ricardo Tavares de
Přispěvatelé: Carvalho, Bruno Motta de, Clua, Esteban Walter Gonzalez, Alsina, Pablo Javier, César Júnior, Roberto Marcondes, Gonçalves, Luiz Marcos Garcia, Gomes, Rafael Beserra
Jazyk: portugalština
Rok vydání: 2020
Předmět:
Zdroj: Repositório Institucional da UFRN
Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
Popis: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES A técnica de multifoveamento permite adicionar vários focos na imagem, os quais podem ser explorados como pontos de atenção visual em contextos de detecção, identificação e/ou reconhecimento de objetos. Entretanto, a utilização da técnica de multifoveamento exige o conhecimento da posição dos estímulos visuais. Neste trabalho propomos uma nova abordagem de detectação dos estímulos visuais fazendo uso da estrutura das múltiplas fóveas. Para isso, utilizamos estratégias matemáticas adaptadas ao contexto de visão computacional, que levam em consideração a distribuição das fóveas para estimar a localização dos estímulos visuais na imagem. As estratégias matemáticas adotadas foram a descida do gradiente (campo de potencial), máximo verossimilhança, multilateração, trilateração e coordenadas baricêntricas. Os resultados mostram que os algoritmos convergem para a posição do estímulo visual, com excessão do algoritmo de interseção de potenciais locais devido a sensibilidade aos mínimos locais. Além disso, os algoritmos que utilizam campo de potencial exigem mais tempo de processamento e recursos computacionais em comparação com as outras estratégias. Contudo, é possível afirmar que três fóveas são suficientes para estimar a posição de um estímulo visual na imagem fazendo uso dos algoritmos de trilateração e coordenadas baricêntricas. Concluímos que o multifoveamento associado às estratégias matemáticas pode ser aplicado na detecção visual e apresenta convergência com no mínimo três fóveas. The multifoveation technique allows to add several focus in the image, which can be explored as points of visual attention in contexts of object detection, identification and/or recognition. However, the use of multifoveation technique requires knowledge of the position of the visual stimuli. In this work we propose a new approach to detect visual stimuli using the structure of multiple foveas. For this, we use mathematical strategies adapted to the context of computer vision, which consider the distribution of the foveas to estimate the localization of the visual stimuli in the image. The mathematical strategies adopted were the gradient descent (potential field), maximum likelihood, multilateration, trilateration and barycentric coordinates. The results show that the algorithms converge to the position of the visual stimulus, with the exception of the intersection of potential locations algorithm due to sensitivity to local minimums. In addition, algorithms that use the potential field to require more processing time and computational resources compared to other strategies. However, it is possible to affirm that three foveas are enough to estimate the position of the visual stimulus in the image using the trilateration and barycentric coordinates algorithms. We conclude that the multifoveation associated with mathematical strategies can be applied in visual detection and converges with at least three foveas.
Databáze: OpenAIRE