Computational Intelligence Techniques for Development of Soft Sensors in Industrial Processes

Autor: Pedrosa, Tomás Miranda
Přispěvatelé: Mendes, Jerôme Amaro Pires, Araújo, Rui Alexandre de Matos
Jazyk: portugalština
Rok vydání: 2022
Předmět:
Popis: Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia Nos dias de hoje, com a presença da Indústria 4.0 e de Big Data, um dos grandes interesses das empresas, dos cientistas de dados e não só, passa por explorar o grande volume de dados que são adquiridos e armazenados pela indústria. Os processos industriais incluem vários sensores físicos que têm como função registar as variáveis processuais (temperaturas, pressões, condutividades, abertura ou fecho de válvulas, etc.) para se poder monitorizar e controlar as várias fases do processo, no entanto, algumas variáveis não se conseguem determinar sem se recorrer a análises laboratoriais. Por esta via, acarretam-se custos às empresas, as medidas por vezes são impraticáveis, podendo ocorrer perda de informação do estado do sistema em tempo real, o que consequentemente pode levar à degradação do produto final.Aqui entra uma solução que cada vez mais está a ganhar o seu espaço no mundo industrial e que demonstra, pelos seus resultados, ser o presente e o futuro no que toca à previsão de variáveis. Falamos do sensor virtual, uma ferramenta que é desenvolvida com software capaz de estimar a variável de qualidade do processo (variável de saída - target) através de um modelo aprendido com base em dados históricos. Estes dados são normalmente fornecidos ou acedidos à base de dados do processo ou do laboratório. Quando trabalhamos com dados industriais temos de ter em conta que nem sempre os dados estão prontos a serem utilizados diretamente no modelo preditivo, há todo um conjunto de tarefas para implementar, como a criação de uma base de dados que armazene os dados necessários da empresa, a própria limpeza dos dados (dados em falta ou falha, outliers, ruído, etc.), a seleção de variáveis de entrada e a seleção do modelo preditivo. Existem diversas categorias de métodos preditivos na literatura, de forma a lidar com essa diversidade focou-se em três delas: métodos de seleção de variáveis, métodos de regularização e métodos de regressão por vetores de suporte. Para que fosse possível estudar estas categorias referidas e construir um procedimento comparativo entre elas, desenvolveu-se uma metodologia comparativa na qual todos os métodos são testados com o mesmo conjunto de dados para que partissem do mesmo pé de igualdade. Esta metodologia é uma validação-cruzada que estima os hiper-parâmetros de cada modelo de regressão e avalia a capacidade preditiva de cada um.Em termos gerais, a análise feita com os conjuntos de dados disponíveis em repositórios públicos demonstram que os modelos de regressão por vetores de suporte apresentaram os melhores resultados, no entanto o desempenho obtido pela maioria dos modelos estudados foi interessante. Assim, podemos concluir que podem ser de facto ferramentas importantes no apoio a processos operacionais, tornando o caminho mais prático e o produto final mais eficiente. Nowadays, with the presence of Industry 4.0 and Big Data, one of the great interests of companies, data scientists and others, is to explore the large volume of data that is acquired and stored by the industry. The industrial processes include several physical sensors whose function is to record process variables (temperatures, pressures, conductivities, opening or closing of valves, etc.) in order to monitor and control the various stages of the process, however some variables cannot be determined without resorting to laboratory analysis. In this way, costs are incurred for companies, the measures are sometimes impracticable, and information on the state of the system can be lost in real time, which consequently can lead to the degradation of the final product.Here comes a solution that is increasingly gaining space in the industrial world and that, through its results, demonstrates that it is the present and the future when it comes to predicting variables. We are talking about the soft sensor, a tool that is developed with software capable of estimating the process quality variable (output variable - target) through a model learned based on historical data. This data is normally provided or accessed from the process or laboratory database. When working with industrial data, we must bear in mind that the data is not always ready to be used directly in the predictive model, there is a whole set of tasks to implement, such as creating a database that stores the company's necessary data, the cleaning of the data itself (missing or faulty data, outliers, noise), input variable selection and model selection.There are several predictive models in the literature, in order to deal with this diversity, we focused on three of them: variable selection methods, penalized regression methods and support vector machines. To be able to study these mentioned regression models and build a comparative procedure between them, a comparative methodology was developed in which all models are tested with the same set of data so that they start from the same level of equality. This methodology is a cross-validation that estimates the parameters and hyper-parameters of each model and evaluates the predictive capacity of each one.In general terms, the analysis performed with datasets available in public repositories demonstrate that the support vector regression methods presented the best results, however the performance obtained by most of the regression models studied was interesting. Thus, we can conclude that they can in fact be important tools in supporting operational processes, making the path more practical and the final product more efficient.
Databáze: OpenAIRE