Segmentação interativa de imagens : de algoritmos baseados em grafos à anotação de características
Autor: | Bragantini, Jordão, 1996 |
---|---|
Přispěvatelé: | Falcão, Alexandre Xavier, 1966, Guimarães, Silvio Jamil Ferzoli, Ponti Junior, Moacir Pereira, Universidade Estadual de Campinas. Instituto de Computação, Programa de Pós-Graduação em Ciência da Computação, UNIVERSIDADE ESTADUAL DE CAMPINAS |
Rok vydání: | 2021 |
Předmět: | |
Zdroj: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
Popis: | Orientador: Alexandre Xavier Falcão Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação Resumo: Nos últimos anos, algoritmos de aprendizado de máquina se tornaram a abordagem predominante para resolução de diversas tarefas de visão computacional e processamento de imagens, dado um conjunto de exemplos (i.e., dados rotulados). O desempenho desses algoritmos está altamente correlacionado com a diversidade de exemplos e qualidade das rótulos, especialmente nos métodos baseados em redes neurais, que requerem uma quantidade significativa de dados. Notavelmente, a rotulação de segmentos nas imagens requerem um grande esforço para produzir anotações de alta qualidade, devido à unidade de anotação, pixels, recorrendo a metodologias interativas para o auxílio do usuário, as quais são o tema central desta tese. O problema de segmentação de imagem interativa envolve duas tarefas fortemente acopladas: reconhecimento, e delineamento de objetos. Neste contexto, o reconhecimento de objetos se refere à sinalização de uma região de interesse e sua atribuição de um rótulo. O delineamento é responsável por delimitar com precisão o limite (i.e., contorno) do objeto. Na vasta literatura de métodos interativos de segmentação de imagem, um usuário humano é empregado inicialmente para reconhecer os objetos de interesse, uma vez que, esta tarefa requer um maior esforço cognitivo. Com esta informação inicial, a máquina realiza a tarefa mais trabalhosa de delinear milhares de pixels. A partir desta estratégia colaborativa entre homem e máquina para segmentação interativa de imagens, este estudo contribui com os seguintes pontos: Dynamic Trees: Estendemos o operador Transformada Imagem-Floresta, propondo uma nova metodologia que atualiza os pesos do grafo da imagem conforme a segmentação é calculada, obtendo resultados de alta qualidade na segmentação da imagem a partir de marcadores inseridos pelo usuário. Grabber: Os métodos interativos existentes baseados em aprendizado profundo aproximam a forma do objeto de interesse com pouca interação do usuário; no entanto, esses não conseguem concluir a segmentação de forma eficaz devido à incapacidade de delinear os detalhes com precisão. O Grabber serve como ferramenta para finalizar o delineamento do contorno a partir de qualquer máscara de segmentação. Anotação de segmentos no espaço das características: Investigamos outro paradigma de anotação de segmentos, onde a etapa de delineamento ocorre antes do reconhecimento manual --- a metodologia proposta apresenta resultados promissores para a segmentação de imagens em maior escala --- e abre novos rumos de pesquisa. Em resumo, investigamos a literatura existente de segmentação interativa de imagens, contribuindo com a introdução de novos algoritmos que realizam a segmentação a partir de marcadores e contornos, e propondo um novo paradigma para a anotação de imagens em larga escala Abstract: In recent years, machine learning algorithms that solve problems from a collection of examples (i.e., labeled data), have grown to be the predominant approach for solving computer vision and image processing tasks. These algorithms' performance is highly correlated with the abundance of examples and their quality, especially methods based on neural networks, which are significantly data-hungry. Notably, image segmentation annotation requires extensive effort to produce high-quality labeling due to the fine-scale of the units (pixels) and resorts to interactive methodologies to provide user assistance, being the central theme of this thesis. The interactive image segmentation problem involves two tightly coupled tasks, object recognition and delineation. In our context, object recognition concerns signaling that a region is of interest and assigning a label to it. Delineation is responsible for precisely delimitating the object's boundaries. In the vast literature of interactive image segmentation methods, a human user is employed to recognize the objects of interest first, which requires a more significant cognitive effort. With this initial input, the machine performs the cumbersome task of delineating thousands of pixels. From this collaborative strategy between human and machine employed for interactive image segmentation, this study contributes the following: Dynamic Trees: We build upon the existing framework of the Image Foresting Transform, proposing a novel methodology that updates the weights of the image graph as the segmentation is computed, obtaining remarkable results on the image segmentation from user inserted markers. Grabber: Existing deep learning-based interactive methods approximate the object of interest shape with minor user input; however, they fail to effectively finish the segmentation due to the inability to delineate the boundaries precisely. Grabber, serve as a tool to resume the contour delineation from any segmentation mask. Feature Space Annotation: We investigate another paradigm of segment annotation, where the delineation step occurs before the manual recognition --- the proposed methodology shows promising results for segmenting images at a larger scale --- and opens up new research directions. In summary, we investigate the existing literature on interactive image segmentation, contributing to it by introducing novel algorithms that performs the segmentation from markers and contours, and finally proposing a new paradigm for image annotation at scale Mestrado Ciência da Computação Mestre em Ciência da Computação CAPES 001 |
Databáze: | OpenAIRE |
Externí odkaz: |