Redução de reticulados conceituais
Autor: | Sérgio Mariano Dias |
---|---|
Přispěvatelé: | Newton Jose Vieira, Loïc Pascal Gilles Cerf, Luis Enrique Zárate, Wagner Meira Junior |
Jazyk: | portugalština |
Rok vydání: | 2016 |
Předmět: | |
Zdroj: | Repositório Institucional da UFMG Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
Popis: | Um formalismo importante para representação, extração e análise de conhecimento é proporcionado pela chamada análise formal de conceitos (AFC), uma abordagem baseada na matematização da noção de conceito, bem como na organização dos conceitos em uma hierarquia conceitual. Na AFC, a complexidade do reticulado conceitual, em função do número de conceitos formais e/ou cardinalidade da relação de cobertura, vem a se mostrar um dos problemas mais significativos. O fato de que todos os relacionamentos entre os conceitos abstraídos do contexto formal estejam presentes no reticulado é apropriado em termos de completude, mas resulta, em geral, num grande volume de relacionamentos, sobrecarregando em demasia o reticulado. Na verdade, a AFC induz a uma complexidade combinatória potencialmente alta, e as estruturas obtidas, até mesmo de um pequeno conjunto de dados podem tornar-se proibitivamente grandes. Em particular, os aspectos essenciais, aqueles que efetivamente são procurados, podem estar imersos em um emaranhado de detalhes menos importantes. Nesta tese, quarenta técnicas de redução de reticulados conceituais, selecionadas dentre as mais representativas, são analisadas e divididas em três classes. A análise é feita com base em sete dimensões, cada uma delas consistindo de um conjunto de características. Efetuando-se a análise através da própria AFC, considerações são realizadas acerca de complexidade computacional, viabilidade e qualidade do reticulado conceitual resultante. A análise das principais técnicas mostrou uma lacuna em técnicas com a capacidade de abstrair e generalizar o conhecimento expresso por um contexto formal. Dada essa constatação, propõe-se aqui uma técnica de redução com tais capacidades, e que não exige, ao contrário de outras técnicas, a computação dos conceitos formais do reticulado conceitual original. A técnica, que tem uma complexidade computacional satisfatória, substitui grupos de objetos similares por objetos representativos, sendo a similaridade medida com base nas relevâncias dos atributos. O estudo das técnicas existentes mostrou também a ausência de uma metodologia para análise das mesmas que fosse independente de suas características e do domínio de aplicação que se tivesse em mente. Propõe-se aqui uma metodologia de análise independente de aplicação. Ela é baseada no uso de implicações como expressão do conhecimento retratado por um contexto formal. A metodologia permite a identificação do conhecimento que é preservado, eliminado, inserido e/ou transformado por uma técnica de redução. Quatro índices complementares são indicados para integrar a metodologia. An important formalism for knowledge representation, extraction and analysis is provided by the so-called formal concept analysis (FCA), an approach based on the mathematisation of the notion of concept and on the organization of concepts in a conceptual hierarchy.In FCA, the complexity of the concept lattice, as a function of the number of formal concepts and/or cardinality of the cover relation, is one of the most significant problems. The fact that all relationships between the concepts extracted from a formal context are present in the concept lattice is appropriate in terms of completeness, but generally results in a large number of relationships, thus overloading too much the lattice. In fact, FCA induces a potentially high combinatorial complexity, and the structures obtained, even from a small dataset, may become prohibitively large. In particular, key aspects, those that are indeed important, may be immersed in a maze of less relevant details.In this thesis, forty reduction techniques of concept lattices, selected from the most representative, are analyzed and divided into three classes. The analysis is based on seven dimensions, each consisting of a set of characteristics. Performing an analysis through AFC itself, considerations are made about computational complexity, feasibility and quality of the resulting concept lattice.The analysis of the main techniques showed a gap in techniques with the ability to abstract and generalize the knowledge expressed by a formal context. Given this finding, it is proposed here a reduction technique with such capabilities, and which does not require, unlike other techniques, the computation of the formal concepts of the original concept lattice. The technique, which has a satisfactory computational complexity, replaces groups of similar objects by representative objects, the similarity being measured on the basis of the relevance of attributes.The study of existing techniques also showed the absence of a methodology for analysis which was independent of its characteristics and intended application domain. Its is proposed here an application independent methodology of analysis. It is based on the use of implications as an alternative expression of the knowledge portrayed by a formal context. The methodology allows the identification of which knowledge is preserved, deleted, inserted and/or transformed by a reduction technique. Four complementary indexes are indicated to integrate the methodology. |
Databáze: | OpenAIRE |
Externí odkaz: |