Dynamic selection of classifiers based on complexity mea sures

Autor: Schmeing, Ederson
Přispěvatelé: Brun, André Luiz, Silva, Ronan Assumpção, Catarina, Adair Santa, Garcia, Rodolfo Botto de Barros
Jazyk: portugalština
Rok vydání: 2022
Předmět:
Zdroj: Biblioteca Digital de Teses e Dissertações do UNIOESTE
Universidade Estadual do Oeste do Paraná (UNIOESTE)
instacron:UNIOESTE
Popis: Submitted by Edineia Teixeira (edineia.teixeira@unioeste.br) on 2022-12-08T14:33:59Z No. of bitstreams: 2 Ederson _Schmeing.2022.pdf: 2336447 bytes, checksum: 6eac5592281e2bb45c8728b6fa0f07d4 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Made available in DSpace on 2022-12-08T14:33:59Z (GMT). No. of bitstreams: 2 Ederson _Schmeing.2022.pdf: 2336447 bytes, checksum: 6eac5592281e2bb45c8728b6fa0f07d4 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2022-08-26 Object classification is a task in the field of pattern recognition. It consists of assigning a class, among several possible ones, to an unknown object. This process is accomplished by classifiers. They are mathematical functions built from the training of the classifiers, which make use of the data of a given problem to obtain learning. Monolithic classifiers find difficulty in more difficult classification scenarios. They may not cover the full range of variability of the problem. Multiple Classifier Systems (MCS) have been an option in order to improve the performance of the classification task before the monolithic approach. For this, the MCS’s employ several specialist classifiers in different regions of the problem. The idea is that, from a set of different classifiers, it is possible to absorb the variability presented by the problems. However, not all of them are always used in the classification step, being necessary the step of selection of classifiers from the set. For this task, the dynamic selection has shown to be promising. The architecture with which classification systems are built influences their performance. The difficulty of the classification problem is also related to the complexity of the data. It impacts the way the classifiers act and information about it is obtained from the complexity measures. Studies show that to solve a difficult classification problem, a better understanding of data complexity can be interesting for classifier selection. Thus, in this work, we evaluate the complexity measures as selection criteria for the dynamic selection of classifiers. Modifying classical literature approaches results in higher accuracy of 39.51% of the cases by adding the complexity measures, while maintaining the original approach corresponds to 28.4%. Ties were present in 35.8%. This work also presents the information gain of 14 complexity measures, which suggest some drawbacks of using some of them. A classificação de objetos é uma tarefa da área de Reconhecimento de Padrões. Ela consiste em atribuir uma classe, dentre várias possíveis, a um objeto desconhecido. Esse processo é realizado por meio de classificadores. Eles são funções matemáticas formuladas a partir do treinamento do(s) classificador(es), que fazem uso dos dados de um determinado problema para realizar a aprendizagem. Classificadores monolíticos encontram dificuldade em cenários mais difíceis de classificação. Eles podem não atender a todo o espaço de variabilidade do problema. Um Sistema de Múltiplos Classificadores (SMC) têm sido uma opção para tentar melhorar desempenho da tarefa de classificação em relação à abordagem monolítica. Para isso, o SMC emprega diversos classificadores especialistas em regiões distintas do problema. A ideia é que, a partir de um conjunto de diferentes classificadores se consiga absorver as variabilidades apresentadas pelos problemas. No entanto, nem sempre todos eles são empregados na etapa de classificação, sendo necessária a etapa de seleção de classificadores do conjunto. Para esta tarefa a seleção dinâmica dos classificadores tem se mostrado promissora. A arquitetura com que são construídos os sistemas de classificação influencia no seu desempenho. Outra dificuldade do problema de classificação está relacionada à complexidade dos dados. Ela impacta na forma que os classificadores atuam e as informações acerca dela é obtida a partir das medidas de complexidades. Estudos demostram que para resolver um problema difícil de classificação, uma melhor compreensão da complexidade dos dados pode ser interessante para seleção de classificadores. Assim, neste trabalho, avaliamos as medidas de complexidade como critérios base para a seleção dinâmica de classificadores. A modificação das abordagens clássicas da literatura resulta em maior acurácia de 39, 51% dos casos quando adicionamos as medidas de complexidade. Enquanto a abordagem original corresponde a 28, 4%. Empates estiveram presentes em 35, 8% dos casos testados. Este trabalho também apresenta o ganho de informação de 14 medidas de complexidade, o que sugere algumas desvantagens do uso de algumas delas.
Databáze: OpenAIRE