Construção de um sensor virtual para a classificação de emissões de dióxido de enxofre em uma caldeira Kraft via algoritmo k-NN (k-Nearest Neighbours)

Autor: Paolla Marlene Caetano da Cunha
Přispěvatelé: Gustavo Matheus de Almeida, Giovani Guimarães Rodrigues, Roberto da Costa Quinino
Jazyk: portugalština
Rok vydání: 2021
Předmět:
Zdroj: Repositório Institucional da UFMG
Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
Popis: CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior O desenvolvimento industrial é um dos principais fatores para regulamentações ambientais em geral. Certificações que padronizam a gestão e parâmetros do processo foram consolidados no mundo todo, e hoje são vistos como obrigatórios para a operação industrial sustentável. O desenvolvimento de modelos baseados em dados se fortaleceu a partir da geração massiva de dados pelos processos industriais em geral em todo o mundo, dado o avanço das áreas de instrumentação, informática e banco de dados. Esse avanço contribui então para a disseminação de aplicações de ciência de dados no setor industrial. Uma sub-área da ciência de dados diz respeito aos métodos de aprendizado de máquina, que geralmente são de simples implementação e obtidos diretamente a partir de conjuntos de dados. Esse trabalho explorou um problema de classificação pelo método supervisionado denominado de k-vizinhos mais próximos (k-NN; k-Nearest Neighbors), com o foco em emissões de gases poluentes à saúde humana e ao meio ambiente. De modo específico, propõe a construção de um sensor virtual baseado em dados para o monitoramento e, por conseguinte, para o controle de emissões de dióxido de enxofre (SO2) em caldeiras de recuperação química do setor de celulose kraft. Em relação à metodologia, foi apresentado o comportamento do método com uma variável de entrada, com subconjuntos de preditores e com um comitê de modelos (ensemble learning), para seis classes de SO2. Os resultados apresentados são satisfatórios, o que é importante para gerar confiança em implementações industriais. O comitê de modelos apresentou a melhor performance, com acurácia de 92% e média geométrica de 94,75% sobre o conjunto (independente) de teste. Industrial development is one of the main factors for environmental regulations in general. Certifications that standardize management and process parameters have been consolidated worldwide and are now seen as mandatory for sustainable industrial operation. The development of data-driven models has been strengthened by the massive generation of data by industrial processes in general all over the world, given the advances in the areas of instrumentation, informatics, and databases. This advance then contributes to the spread of data science applications in the industrial sector. One sub-area of data science concerns machine learning methods, which are usually simple to implement and are directly obtained from data sets. This work explored a supervised k-nearest neighbours (KNN) classification problem, focusing on gas emissions that pollute human health and the environment. Specifically, it proposes the construction of a soft sensor based on data for monitoring and, consequently, controlling sulphur dioxide (SO2) emissions in chemical recovery boilers in the kraft pulp industry. Regarding the methodology, the behaviour of the method with one input variable, with subsets of predictors, and with an ensemble learning, for six classes of SO2 was presented. The results presented are satisfactory, which is important to generate confidence in industrial implementations. The ensemble learning showed the best performance, with accuracy of 92% and geometric mean of 94.75% over the (independent) test set.
Databáze: OpenAIRE