Intégration de Composants de Text Mining
Autor: | Grivel, Luc |
---|---|
Přispěvatelé: | Grivel, Luc |
Jazyk: | francouzština |
Rok vydání: | 2003 |
Předmět: |
[SHS.INFO.INGE]Humanities and Social Sciences/Library and information sciences/domain_shs.info.inge
hypertexte text mining traitement du langage naturel [SHS.INFO.CONF]Humanities and Social Sciences/Library and information sciences/domain_shs.info.conf extraction information hypertext classification [SHS.INFO.INGE] Humanities and Social Sciences/Library and information sciences/domain_shs.info.inge cartographie [SHS.INFO.CONF] Humanities and Social Sciences/Library and information sciences/domain_shs.info.conf information extraction natural language processing mapping Fouille de données textuelles clustering |
Zdroj: | International Journal of Information Sciences for Decision Making International Journal of Information Sciences for Decision Making, University of South Toulon-Var, 2003 |
ISSN: | 1265-499X |
Popis: | The goal of this paper is to show the interest of combining various text analysis techniques (shallow parsing, semantic analysis, etc.) and some information access techniques (indexing, classification, clustering, mapping)) to developp an information analysis system to be used and customized by non-specialists of documentary languages. The paper shows how these techniques can be integrated to for a process chain including : XML reformating, information extraction, clustering, mapping. L'objectif de cet article est de montrer l'intérêt de l'emploi combiné de techniques d'analyse du texte (segmentation, lexicale, syntaxique, sémantique) et de diverses techniques d'accès à l'information (index, classification, catégorisation, cartographie) pour le développement d'un système de recherche et d'analyse d'information qui soit adapté à des non-spécialistes des langages documentaires et qui s'intègre dans un processus de veille. L'article montre comment ces techniques interviennent dans les fonctions d'un système d'analyse de l'information. L'originalité se situe dans l'approche (intégration de composants de text mining) qui est détaillée : reformatage XML des documents, visualisation des résultats, en passant par l'extraction des caractéristiques des documents et la classification. |
Databáze: | OpenAIRE |
Externí odkaz: |