A FRAMEWORK FOR GENERATING BINARY SPLITS IN DECISION TREES

Autor: FELIPE DE ALBUQUERQUE MELLO PEREIRA
Jazyk: angličtina
Rok vydání: 2018
Zdroj: Repositório Institucional da PUC_RIOPontifícia Universidade Católica do Rio de JaneiroPUC_RIO.
Druh dokumentu: masterThesis
Popis: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
CONSELHO NACIONAL DE DESENVOLVIMENTO CIENTÍFICO E TECNOLÓGICO
Nesta dissertação é apresentado um framework para desenvolver critérios de split para lidar com atributos nominais multi-valorados em árvores de decisão. Critérios gerados por este framework podem ser implementados para rodar em tempo polinomial no número de classes e valores, com garantia teórica de produzir um split próximo do ótimo. Apresenta-se também um estudo experimental, utilizando datasets reais, onde o tempo de execução e acurácia de métodos oriundos do framework são avaliados.
In this dissertation we propose a framework for designing splitting criteria for handling multi-valued nominal attributes for decision trees. Criteria derived from our framework can be implemented to run in polynomial time in the number of classes and values, with theoretical guarantee of producing a split that is close to the optimal one. We also present an experimental study, using real datasets, where the running time and accuracy of the methods obtained from the framework are evaluated.
Databáze: Networked Digital Library of Theses & Dissertations