Analyse et expansion des textes en question-réponse
Autor: | Bernard Jacquemin |
---|---|
Přispěvatelé: | Institut des Sciences Cognitives (ISC), Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS), Groupe d'Études et de Recherche Interdisciplinaire en Information et COmmunication (GERiiCO) - EA 4073 (GERIICO ), Université de Lille, Gérard Purnelle, Cédrick Fairon, Anne Dister, Ecole Doctorale 268 (ED 268) |
Jazyk: | francouzština |
Rok vydání: | 2004 |
Předmět: |
[SHS.STAT]Humanities and Social Sciences/Methods and statistics
[SHS.INFO]Humanities and Social Sciences/Library and information sciences désambiguïsation sémantique dérivation morpho-syntaxique dictionnaires sémantiques analyse du sens synonymie expansion de requête [INFO.INFO-IR]Computer Science [cs]/Information Retrieval [cs.IR] question-réponse ACM: H3 H4 H5 paraphrase [SHS.LANGUE]Humanities and Social Sciences/Linguistics recherche d'information |
Zdroj: | Le poids des mots. Actes des septièmes Journées internationales d’Analyse statistique des Données Textuelles (JADT04) Le poids des mots. Actes des septièmes Journées internationales d’Analyse statistique des Données Textuelles (JADT04), Mar 2004, Louvain-la-Neuve, Belgique. pp.633-641 HAL Bernard Jacquemin |
Popis: | This paper presents an original methodology to consider question answering. We noticed that query expansion is often incorrect because of a bad understanding of the question. But the automatic good understanding of an utterance is linked to the context length, and the question are often short. This methodology proposes to analyse the documents and to construct an informative structure from the results of the analysis and from a semantic text expansion. The linguistic analysis identifies words (tokenization and morphological analysis), links between words (syntactic analysis) and word sense (semantic disambiguation). The text expansion adds to each word the synonyms matching its sense and replaces the words in the utterances by derivatives, modifying the syntactic schema if necessary. In this way, whatever enrichment may be, the text keeps the same meaning, but each piece of information matches many realisations. The questioning method consists in constructing a local informative structure without enrichment, and matches it with the documentary structure. If a sentence in the informative structure matches the question structure, this sentence is the answer to the question.; Cet article présente une méthode originale d'envisager la tâche de question-réponse. Nous avons remarqué que l'expansion de requête est souvent erronée du fait d'une mécompréhension de la question. Mais la bonne compréhension d'un énoncé est fonction de la taille du contexte, et les question sont souvent courtes. Notre approche propose d'analyser les documents et de construire une structure informationnelle en utilisant les résultats de l'analyse ainsi que l'enrichissement sémantique des textes. Une analyse linguistique identifie les mots (segmentation et analyse morphologique), les liens entre les mots (analyse syntaxique) et le sens des mots (désambiguïsation sémantique lexicale). L'expansion de texte adjoint à chaque mot les synonymes qui correspondent à son acception contextuelle et remplacent les mots des énoncés par leurs dérivés, modifiant si nécessaire la structure syntaxique de la phrase. De la sorte, quel que soit l'enrichissement utilisé, le texte conserve la même signification, tandis que chaque élément d'information obtient de nombreuses actualisations. La procédure d'interrogation consiste à construire une structure informationnelle locale à la question sans effectuer d'enrichissement, et à faire lui faire correspondre un ou plusieurs fragments de la structure documentaire. Si une phrase de la structure informationnelle documentaire correspond à celle de la question, cette phrase contient la réponse à la question. |
Databáze: | OpenAIRE |
Externí odkaz: |