Evaluation of concept drift detection approaches for stock market forecasting
Autor: | Cocovilo Filho, Luis Fernando Panicachi, 1997 |
---|---|
Přispěvatelé: | Coelho, Guilherme Palermo, 1980, Boccato, Levy, Dias, Ulisses Martins, Universidade Estadual de Campinas. Faculdade de Tecnologia, Programa de Pós-Graduação em Tecnologia, UNIVERSIDADE ESTADUAL DE CAMPINAS |
Jazyk: | portugalština |
Rok vydání: | 2022 |
Předmět: | |
Zdroj: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
Popis: | Orientador: Guilherme Palermo Coelho Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Tecnologia Resumo: O mercado de ações é um importante segmento da economia que movimenta diariamente um grande volume de ativos, devido às transações realizadas entre empresas de capital aberto e investidores. Diversos fatores influenciam direta e indiretamente os valores dessas transações, o que pode gerar variações abruptas. Essa oscilação é um problema para aqueles que estudam esse nicho e buscam formas de se estimar valores futuros de ações, o que significaria uma vantagem para maximização de lucros na compra e vendas de ações. O problema é ainda maior quando uma série histórica de valores de ações apresenta o fenômeno de mudança de conceito, ou seja, quando os padrões de valores vão mudando ao longo do tempo. Neste trabalho, buscou-se avaliar se a presença de mecanismos capazes de lidar com mudanças de conceito em preditores baseados em aprendizado de máquina melhora a capacidade de predição de valores futuros de ações. A partir de uma base de dados históricos de 10 ações negociadas na bolsa de valores brasileira, coletados em um período de 20 anos, foi verificada a ocorrência de mudança de conceito em tais séries temporais e comparados os desempenhos de preditores baseados em diferentes paradigmas: Random Forests (RF), Support Vector Machines (SVM), K-Nearest Neighbors (KNN), Online Sequential Extreme Learning Machines (OS-ELM), Dynamic and Online Ensemble for Regression (DOER) e Ensemble of Online Learners With Substituiton of Models (EOS). Dentre esses, OS-ELM, DOER e EOS possuem mecanismos para lidar com mudanças de conceito. Os resultados mostraram que, apesar de as estrategias que incorporam mecanismos para tratamento de mudança de conceito demandarem um maior tempo computacional, elas também tendem a apresentar menores erros de predição. De acordo com o teste estatístico de Bergmann-Hommel foi possível observar que os modelos SVM e RF com uma versão ajustada possuem desempenho similares aos de modelos que lidam com mudança de conceito Abstract: The stock market is an important segment of the economy that circulates a large volume of assets due to transactions between open-ended companies and investors. Several factors, directly and indirectly, affect these transaction values, which can generate abrupt variations. The stock value fluctuation is a problem for those who search for ways to predict future stocks values, which would mean an advantage for profits maximization in buying and selling stocks. The problem becomes even harder when the stock values series presents the concept drift phenomenon, where patterns change over time. In this work, we evaluated whether mechanisms that deal with concept drift in machine learning-based predictors improve their stock market forecasting capabilities. From a historic database of 10 stocks negotiated in the Brazilian stock exchange, considering a time period of 20 years, we verified the occurrence of concept drift and compared the performance of predictors based in different paradigms: Random Forests (RF), Support Vector Machines (SVM), K-Nearest Neighbors (KNN), Online Sequential Extreme Learning Machines (OS-ELM), Dynamic and Online Ensemble for Regression (DOER) and Ensemble of Online Learners With Substitution of Models (EOS). Among these, OS-ELM, DOER and EOS explicitly deal with concept drift. The obtained results showed that, despite the higher computational time required by strategies that include mechanisms for handling concept drift, such strategies also tend to yield smaller predictions errors. Besides, according to the Bergmann-Hommel’s statistical test, it was possible to observe that SVM and RF with an adjusted version models achieve similar performances to models that deal with the concept drift Mestrado Sistemas de Informação e Comunicação Mestre em Tecnologia CAPES 001 |
Databáze: | OpenAIRE |
Externí odkaz: |