Redes neurais convolucionais aplicadas à inspeção de componentes do vagão ferroviário

Autor: ROCHA, Rafael de Lima
Přispěvatelé: SILVA, Cleison Daniel, GOMES, Ana Claudia da Silva
Jazyk: portugalština
Rok vydání: 2020
Předmět:
Zdroj: 1 CD-ROM
Repositório Institucional da UFPA
Universidade Federal do Pará (UFPA)
instacron:UFPA
Popis: O vagão ferroviário é um dos patrimônios mais importantes em uma empresa mineradora, onde toneladas de minério são transportados por este diariamente, além disso, o vagão ferroviário pode ser utilizado para o transporte de pessoas. Por isso, a inspeção de defeitos em componentes estruturais do vagão ferroviário é uma atividade de suma importância, possibilitando evitar problemas na logística da ferrovia, assim como prevenir acidentes. A tarefa de inspeção é realizada visualmente por um técnico operacional que está exposto a acidentes no local em que a inspeção é realizada, além da possibilidade de erro humano devido ao estresse, fadiga e outros. O pad é componente ferroviário analisado neste trabalho, onde este é responsável pela suspensão primária, papel que é importante na dinâmica dos vagões. Assim, o intuito deste trabalho é utilizar técnicas de aprendizado profundo, especificamente redes neurais convolucionais (CNN) para a realização da inspeção do componente. A CNN classifica a imagem do componente estrutural analisado em relação aos possíveis estados em que ele se encontra na ferrovia, pad ausente, pad não danificado e pad danificado. Além disso, pretende-se investigar a contribuição da imagem do componente no domínio da frequência obtida através da magnitude e fase da transformada discreta de Fourier (DFT) da imagem original (domínio espacial) no processo de classificação da CNN. As técnicas de equalização de histograma e o aumento do número de imagens através do data augmentation também são examinadas, de modo a avaliar suas colaborações na melhoria no desempenho de classificação. Os resultados da inspeção do pad por CNN demonstram-se bastante inspiradores, em especial quando é utilizada a imagem espacial do componente em conjunto da imagem da magnitude da DFT da imagem de origem como entradas da CNN, que se demonstram superiores quando é utilizada somente a imagem original (espacial) do componente, atingindo uma acurácia de classificação de 95,65%. Em especial, o método que utiliza o aumento do número de imagens de treinamento pelo data augmentation e as imagens do domínio espacial e da frequência (magnitude) é o que alcança a maior acurácia, com 97,47%, que representa aproximadamente 385,5 imagens classificadas corretamente de um total de 395,2 imagens. The railcar is one of the most important assets in a mining company, where tons of ore are transported daily by it, besides, the railcar can be used to transport people. Therefore, the inspection of defects in structural components of the railcar is a very important activity, making it possible to avoid problems in railway logistics, as well as to prevent accidents. The inspection task is performed visually by an operating technician who is exposed to accidents where the inspection is performed, in addition to the possibility of human error due to stress, fatigue, and others. The pad is a rail component analyzed in this work, where it is responsible for the primary suspension, a role that is important in the railcar dynamics. Thus, the purpose of this work is to use deep learning techniques, specifically convolutional neural networks (CNN) for the component inspection. CNN classifies the image of the structural component analyzed concerning the possible state it is in the railway, absent pad, undamaged pad, and damaged pad. Also, it intends to investigate the contribution of the component image in the frequency domain obtained through the magnitude and phase of the discrete Fourier transform (DFT) of the original image (spatial domain) in the CNN classification process. Histogram equalization and increasing the number of images through data augmentation techniques are also examined to evaluate their collaborations in improving classification performance. The results of CNN inspection of the pad prove to be quite inspiring, especially when the spatial component image is used together with the DFT magnitude image of the original image as CNN inputs, which are superior when only the original (spatial) image of the component is used, achieving a classification accuracy of 95.65%. In particular, the method that uses the increase in the number of training images by the data augmentation and the spatial domain and frequency (magnitude) images achieves the highest accuracy, with 97.47%, which represents approximately 385.5 correctly classified images from a total of 395.2 images.
Databáze: OpenAIRE