Análise de neural architecture search para detecção de objetos

Autor: Sidrim, Cícera Vanessa Marques Sampaio, 1996
Přispěvatelé: Avila, Sandra Eliza Fontes de, 1982, Boccato, Levy, Vargas, Aurea Rossy Soriano, Universidade Estadual de Campinas. Instituto de Computação, Programa de Pós-Graduação em Ciência da Computação, UNIVERSIDADE ESTADUAL DE CAMPINAS
Rok vydání: 2022
Předmět:
Zdroj: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
Popis: Orientador: Sandra Eliza Fontes de Avila Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação Resumo: Uma das etapas do processo de automação do aprendizado de máquina (AutoML, do inglês Automated Machine Learning) é a busca da arquiteturas de redes neurais (NAS, do inglês Neural Architecture Search), que consiste na construção de arquiteturas de redes neurais profundas de forma automatizada. O objetivo principal dessa tecnologia é reduzir os esforços manuais e o tempo gasto nessa etapa, gerando automaticamente uma arquitetura propícia para um determinado conjunto de dados. A primeira rede do tipo NAS proposta surgiu em 2017 e exigia um alto poder computacional para ser executada. Desde então, várias melhorias foram propostas com o intuito de reduzir o custo computacional das NAS, tais como novas estratégias de busca baseadas em algoritmos evolutivos e em descida do gradiente, além de novas formas de avaliar uma rede gerada por uma NAS. Apesar dos avanços, ainda não vivemos a realidade onde os esforços e custos são reduzidos, e os resultados são surpreendentes. Nesta dissertação, investigamos a literatura de modo a identificar soluções baseadas em NAS para a tarefa de detecção de objetos. Consideramos um cenário de execução com poucos dados e uma infraestrutura menos robusta em relação aos experimentos relatados na literatura, apresentando assim uma visão mais realista do uso da NAS, trazendo à tona dificuldades enfrentadas e justificando o porquê de ainda não estarmos vivendo esta realidade. Nossas investigações foram realizadas em quatro redes NAS (DetNAS, SP-NAS, PC-DARTS + SSD e NAS without training) e duas ferramentas open-source de AutoML (H2O.ai e UFOD). Executamos a rede YOLOv5 em quatro diferentes datasets (Isoladores, Blood Cell Count and Detection, Aquarium e Ox- ford Pets). Os resultados da YOLOv5 foram comparados com os resultados da SP-NAS, única rede NAS para detecção de objetos cuja execução foi factível considerando as limitações existentes (poder computacional, disponibilidade e funcionamento do código) durante a etapa de experimentos. Para todas as bases de dados, os resultados da SP-NAS não superaram a YOLOv5 Abstract: One of the steps in the machine learning automation process (AutoML) is the Neural Architecture Search (NAS), which consists of building deep neural network architectures in an automated way. The main objective of this technology is to reduce manual efforts and the time spent in this step, automatically generating an appropriate architecture for a given dataset. The pioneering NAS network appeared in 2017 and required high computational power. Since then, several improvements have been proposed to reduce the computational cost of NAS, such as new search strategies based on evolutionary algorithms and gradient descent and, as well as to evaluate a network generated by a NAS. Despite advances, we still do not live in a reality where efforts and costs are reduced, and the results are surprising. In this Master thesis, we investigate the literature to identify NAS-based solutions for object detection tasks, taking into account a scenario with few data and a less robust infrastructure concerning the experiments reported in the literature, thus presenting a more realistic view of its use, bringing to light the difficulties faced and justifying why we are not yet living this reality. We investigated four NAS networks (DetNAS, SP-NAS, PC-DARTS + SSD, NAS without training) and two open-source AutoML tools (H2O.ai and UFOD). We executed the YOLOv5 network in 4 different datasets (Insulators, BCCD, Aquarium, and Oxford Pets). The results of YOLOv5 were compared with the results of SP-NAS, the only NAS network for object detection whose execution was feasible given the existing limitations (computational power, availability, and code functioning) during the experiments stage. For all datasets, the SP-NAS results did not outperform YOLOv5 Mestrado Ciência da Computação Mestra em Ciência da Computação CAPES 001
Databáze: OpenAIRE