Etiquetario morfosintáctico del SLI para corpus de lengua gallega : aplicación al corpus
Autor: | Aguirre Moreno, José Luis, Álvarez Lugrís, Alberto, Gómez Guinovart, Xavier |
---|---|
Jazyk: | Spanish; Castilian |
Rok vydání: | 2002 |
Předmět: | |
Zdroj: | RUA. Repositorio Institucional de la Universidad de Alicante Universidad de Alicante (UA) |
Popis: | En este artículo se presenta un etiquetario morfosintáctico completo y normalizado para etiquetar corpus lingüísticos de lengua gallega. La elaboración de este etiquetario, diseñado por el Seminario de Lingüística Informática (SLI) de la Universidad de Vigo siguiendo estrictamente las recomendaciones de EAGLES (Leech y Wilson, 1996, incluye la creación de un etiquetario intermedio que nos permite establecer una correspondencia entre la información gramatical para el gallego codificada en el CLUVI (Corpus Lingüístico de la Universidad de Vigo)y la que se encuentra codificada en el formato estándar de EAGLES en corpus de otras lenguas. In this article we present a complete and normalized morphosyntactic tagset for the annotation of linguistic corpora in Galician. The elaboration of this tagset, designed by the Computational Linguistics Group (SLI)of the University of Vigo, following strictly the EAGLES recommendations (Leech and Wilson, 1996), includes the creation of an intermediate tagset that allows us to establish a correspondence between the grammatical information encoded for Galician in the CLUVI (Linguistic Corpus of the University of Vigo) and the information encoded in the EAGLES standard format in corpora of other languages Este trabajo ha sido financiado por la Xunta de Galicia, dentro de los proyectos "Desenvolvemento e aplicación de técnicas de anàlise lingüístico-computacional de corpus orais e escritos para o procesamento do CLUVI (Corpus Lingüístico da Universidade de Vigo)" (PGIDT01PXI30203PR)i "Estudio e adquisicíón de recursos básicos de lingüística computacional do galego para a elaboración e mellora de aplicacións informáticas de tecnoloxía lingüística" (ref. PGIDT01TICC06E). |
Databáze: | OpenAIRE |
Externí odkaz: |