Uso de informações lingüísticas na etapa de pré - processamento em mineração de textos
Autor: | Silva, Cassiana Fagundes da |
---|---|
Jazyk: | portugalština |
Rok vydání: | 2004 |
Předmět: | |
Zdroj: | Repositório Institucional da UNISINOSUniversidade do Vale do Rio dos SinosUNISINOS. |
Druh dokumentu: | masterThesis |
Popis: | Made available in DSpace on 2015-03-05T13:53:43Z (GMT). No. of bitstreams: 0 Previous issue date: 27 Nenhuma Este trabalho apresenta estudos, com realização de experimentos e análise de resultados, da aplicação de informações lingüísticas na etapa de pré-processamento no processo de Mineração de Textos para as tarefas de Categorização e Agrupamento de Documentos. Usualmente, o pré-processamento utilizado no processo de Mineração de Textos para estas tarefas consiste na remoção de termos irrelevantes (tais como, preposição, artigos, pronomes, entre outros), normalização morfológica e seleção dos termos (ao que denominamos baseado em métodos usuais). Propõe-se, ao longo deste trabalho, um pré-processamento que faz o uso de informações lingüísticas, ou seja, um préprocessamento baseado em combinações gramaticais, visando avaliar a repercussão do uso dessas informações nos resultados de tarefas de Mineração de Textos. Foram realizados diversos experimentos para a validação da abordagem proposta junto à língua portuguesa. O corpus utilizado nos experimentos consiste de um extrato do corpus NILC (Núcleo Inter |
Databáze: | Networked Digital Library of Theses & Dissertations |
Externí odkaz: |