Um modelo de descoberta de conhecimento baseado na correlação de elementos textuais e expansão vetorial aplicado à engenharia e gestão do conhecimento

Autor: Gonçalves, Alexandre Leopoldo
Jazyk: portugalština
Rok vydání: 2006
Předmět:
Zdroj: Repositório Institucional da UFSCUniversidade Federal de Santa CatarinaUFSC.
Druh dokumentu: Doctoral Thesis
Popis: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia de Produção.
Made available in DSpace on 2012-10-22T12:02:17Z (GMT). No. of bitstreams: 1 236626.pdf: 1327610 bytes, checksum: 70c4b88490427aa2965227baac67009d (MD5)
Atualmente as informações textuais, disponíveis nos mais variados formatos, constituem-se como um importante recurso uma vez que mapeiam parte considerável das atividades diárias nas organizações. Nesse sentido, os desafios residem em como sintetizar grandes volumes de informação e em como revelar, através de processos automáticos ou semi-automáticos, o conhecimento latente inerente aos documentos, objetivando auxiliar o estabelecimento de estratégias que promovam suporte aos gestores organizacionais. Para tal, o presente trabalho propõe um modelo de descoberta de conhecimento baseado na correlação de elementos textuais e na expansão de unidades de análise chamado Latent Relation Discovery (LRD). O processo de correlação identifica, considerando-se um elemento textual de origem, o conjunto de elementos textuais mais relacionados. Esses relacionamentos são então utilizados na expansão de unidades de análise, ou seja, na redefinição do contexto de documentos. A avaliação do modelo é realizada em cinco cenários comparando-se LRD com outros métodos, entre eles, Latent Semantic Indexing (LSI), Phi-squared, Mutual Information e derivação deste, e Z score. No primeiro cenário o modelo proposto foi aplicado à recuperação de informação e, em seguida, à tarefa de agrupamento de documentos. Os demais cenários utilizaram informação provida por avaliadores humanos e por um mecanismo de busca tradicional para mensurar o grau de aderência entre os pares de elementos textuais e os métodos acima mencionados. Em todos os cenários, LRD apresentou melhores resultados em relação aos demais métodos. A principal contribuição do trabalho reside na definição de um modelo de correlação e expansão vetorial com o intuito de descobrir relacionamentos latentes entre elementos textuais, promover melhoramentos na representação de documentos e fornecer suporte a aplicações de Engenharia e Gestão do Conhecimento.
Databáze: Networked Digital Library of Theses & Dissertations