Uso de Internet para aumentar la cobertura de un sistema de adquisición léxica del ruso
Autor: | Oliver González, Antoni, Castellón Masalles, Irene, Màrquez Villodre, Lluís |
---|---|
Jazyk: | Spanish; Castilian |
Rok vydání: | 2003 |
Předmět: | |
Zdroj: | RUA. Repositorio Institucional de la Universidad de Alicante Universidad de Alicante (UA) |
Popis: | En este artíiculo presentamos una metodología para la adquisición de recursos léxicos a partir de corpus sin anotar. Esta metodología está demostrando ser de una gran eficacia para lenguas que, como el ruso, presentan una morfología rica y de tipo predominantemente concatenativa. La metodología puede aplicarse tanto a la creación de nuevos recursos léxicos como en la ampliación de recursos léxicos ya existentes. Presentamos asimismo una extensión de la metodología que realiza consultas automáticas a Internet para adquirir aquellas entradas para las cuales no existe suficiente información en nuestro corpus. This paper present a methodology for the automatic acquisition of lexical resources from raw corpora. This methodology has proved to be efficient for those languages that, like Russian, present a rich and mainly concatenative morphology. This method can be applied in the creation of new resources, as well as in the enrichment of existing resources. We also present an extension of the system that uses automatic querying to Internet to acquire those entries for which we have not enough information in our corpus. Esta investigación se ha llevado a cabo con el apoyo de los proyectos INTERLINGUA (Universitat Oberta de Catalunya e IN3-IR266) y HERMES (TIC2000-0335-C03-02). |
Databáze: | OpenAIRE |
Externí odkaz: |