Uso de redes de função de base radial e cadeias de markov para detecção online de mudanças de conceito em fluxos contínuos de dados

Autor: Lobão Neto, Ruivaldo Azevedo
Přispěvatelé: Rios, Ricardo Araújo, Curilem, Gloria Millaray, Taddeo, Marcelo Magalhães
Jazyk: portugalština
Rok vydání: 2019
Předmět:
Zdroj: Repositório Institucional da UFBA
Universidade Federal da Bahia (UFBA)
instacron:UFBA
Popis: Submitted by RUIVALDO AZEVEDO L. NETO (rneto@rneto.net) on 2021-04-15T13:25:19Z No. of bitstreams: 1 monografia.pdf: 3255659 bytes, checksum: a234fae0a84f3cb24a981403cb6d6523 (MD5) Approved for entry into archive by Solange Rocha (soluny@gmail.com) on 2021-06-28T18:23:10Z (GMT) No. of bitstreams: 1 monografia.pdf: 3255659 bytes, checksum: a234fae0a84f3cb24a981403cb6d6523 (MD5) Made available in DSpace on 2021-06-28T18:23:10Z (GMT). No. of bitstreams: 1 monografia.pdf: 3255659 bytes, checksum: a234fae0a84f3cb24a981403cb6d6523 (MD5) A quantidade de informações produzidas por sistemas computacionais tem crescido de forma acentuada nas últimas décadas. Uma parcela expressiva dessas informações é produzida na forma de fluxos contínuos, que são sequências constantes e potencialmente infinitas de dados. Esses fluxos são, em sua maioria, não-estacionários, podendo sofrer alterações na distribuição dos dados ou no contexto do processo gerador. Estas alterações são denominadas mudanças de conceito e podem impactar negativamente a performance de modelos de aprendizado aplicados. Para mitigar este problema, pesquisadores vêm desenvolvendo métodos especializados na detecção de mudanças de conceito. Entretanto, os métodos propostos apresentam limitações ao serem aplicados em alguns cenários de fluxos contínuos como, por exemplo, a necessidade de rotulação por especialistas e a incapacidade de atender às restrições de tempo de processamento e de uso dos recursos computacionais desses cenários. Visando superar essas limitações, este trabalho apresenta um novo método de detecção de mudanças de conceito, denominado RBFChain, baseado em Redes de Função de Base Radial (RBF) e Cadeias de Markov. Resumidamente, as redes RBF realizam, em sua camada intermediária, um processo de ativação que, implicitamente, produz grupos a partir das observações recebidas ao longo do tempo. De maneira complementar, as cadeias de Markov permitem modelar as transições entre esses grupos. Mudanças de conceito são, então, detectadas quando o grupo ativo é alterado e a probabilidade da transição, no modelo markoviano, excede um limiar. O método apresentado se diferencia dos trabalhos existentes por detectar mudanças em tempo de execução, de forma computacionalmente eficiente e independente de rótulos. Para avaliar o método RBFChain como um detector de mudanças de conceito viável, uma análise de sensibilidade, precisão e tolerância ao ruído foi realizada usando conjuntos de dados sintéticos, e seus resultados foram comparados com os principais algoritmos disponíveis na literatura. Além disso, a técnica foi aplicada a um problema real de classificação de fixações e sacadas na atividade de monitoramento ocular. Com essa aplicação, foi possível investigar e propor uma solução para um problema relevante que envolve a área de Neurociência e Computação. Os resultados obtidos com os conjuntos de dados sintéticos sugerem que o RBFChain é estatisticamente melhor ou equivalente aos principais detectores presentes na literatura. Ademais, a técnica desenvolvida apresentou bons resultados quando aplicada ao problema de monitoramento ocular, sendo capaz de classificar fixações e sacadas em tempo real e com precisão equivalente ao estado da arte. The amount of information produced by computer systems has grown dramatically in recent decades. A significant share of this volume is produced as data streams, which are constant and potentially infinite sequences. Most of these streams are non-stationary and may vary over time. These changes are called concept drifts and can negatively impact the performance of applied learning models. To mitigate this problem, researchers developed specialized methods for detecting concept drifts. However, the proposed methods have limitations when applied in scenarios with data streams, such as the need for expert labeling or the inability to meet the processing time and computational resource constraints of these scenarios. This work proposes a new detection method based on Radial Basis Function Networks (RBF) and Markov Chains, called RBFChain. RBF networks perform, in their intermediate layer, an activation process that implicitly produces groups of observations received over time. Simultaneously, the Markov Chain models the transitions between groups in the formed cluster. Concept drifts are detected when the active group of the cluster changes, and the probability of this transition in the Markov model exceeds a threshold. The proposed method differs from existing works in that it detects changes at run time, in a computationally efficient and independent of labels way. To assess RBFChain as a viable concept drift detector, an analysis of sensitivity, accuracy, and noise tolerance was performed using synthetic datasets, and results were compared to the main algorithms available in the literature. Also, the technique was applied to the fixation and saccade classification problem in eye-tracking: a relevant issue for different areas of knowledge, because many behavioral experiments use this information as an analysis factor. Results with synthetic datasets suggest that RBFChain is statistically better or equivalent to the main detectors present in the literature. Moreover, the developed method presented good results when applied to the eye-tracking problem, being able to classify fixations and saccades in real-time and with accuracy equivalent to the state of the art.
Databáze: OpenAIRE