Desambiguación léxica mediante marcas de especificidad

Autor: Montoyo Guijarro, Andrés
Rok vydání: 2002
Předmět:
Zdroj: RUA. Repositorio Institucional de la Universidad de Alicante
Universidad de Alicante (UA)
Popis: Directores de la tesis: Manuel Palomar Sanz (Universidad de Alicante) y German Rigau Claramunt (Universitat Politècnica de Catalunya) Esta tesis presenta un método para resolver la ambigüedad léxica pura (semántica) en textos de dominios no registrados en cualquier lengua que tenga un repositorio de sentidos organizado como una base de conocimiento léxica. A este método de resolución de la ambigüedad léxica pura propuesto se denomina Método de Marcas de Especificidad y se basa en el uso de conocimiento lingüístico (información léxica y morfológica) y de conocimiento a partir de las relaciones léxicas y semánticas de la taxonomía de nombres de la base de conocimiento léxica WordNet. Además, se presenta la aplicación del método de Marcas de Especificidad con el objetivo de enriquecer semánticamente WordNet con etiquetas de dominio o categorías de otros sistemas de clasificación. This thesis presents a method for the automatic disambiguating of nouns, using the notion of Specification Marks and employing the noun taxonomy of the WordNet lexical knowledge base. The method resolves the lexical ambiguity of nouns in any sort of text, and although it relies on the semantic relations (Hypernymy and Hyponymy) and the hierarchic organization of WordNet, it does not, however, require any sort of training process, no hand-coding of lexical entries, nor the hand-tagging of texts. Besides, this thesis presents a new method to enrich semantically WordNet with categories from general domain classification systems. The method is performed in two consecutive steps. First, a lexical knowledge word sense disambiguation process. Second, a set of rules to select the main concepts as representatives of each category. The method has been applied to label automatically WordNet synsets with Subject Codes from a standard news agencies classification system. Esta investigación ha sido parcialmente financiada por el Ministerio de Ciencia y Tecnología a través del proyecto TIC2000-0664-C02-01/02.
Databáze: OpenAIRE