Adquisición automática de información léxica y morfosintáctica a partir de corpus sin anotar: aplicación al serbocroata y ruso

Autor: Oliver González, Antoni, Castellón Masalles, Irene, Màrquez Villodre, Lluís
Jazyk: Spanish; Castilian
Rok vydání: 2002
Předmět:
Zdroj: O2, repositorio institucional de la UOC
Universitat Oberta de Catalunya (UOC)
RUA. Repositorio Institucional de la Universidad de Alicante
Universidad de Alicante (UA)
Popis: En este artículo presentamos una metodología para la adquisición automática de información léxica y morfosintáctica a partir de corpus sin anotar. El sistema utiliza información sobre la morfología flexiva de la lengua a tratar, así como información léxica y morfosintáctica de las palabras pertenecientes a clases no flexivas y de las palabras cuya flexión no corresponde a paradigmas regulares. Se trata de un sistema en desarrollo por lo que las evaluaciones que incluímos son preliminares. This paper presents a methodology for the automatic acquisition of lexical and morpho-syntactic information from raw corpora. The system uses information about the inflectional morohology of the language and lexical and morho-syntactic information of the words belonging to non-inflectional categories and of the words not belonging to regular paradigms. En aquest article presentem una metodologia per a l'adquisició automàtica d'informació lèxica i morfosintàctica a partir de corpus sense anotar. El sistema utilitza informació sobre la morfologia flexiva de la llengua a tractar, així com informació lèxica i morfosintàctica de les paraules pertanyents a classes no flexives i de les paraules la flexió de les quals no correspon a paradigmes regulars. Es tracta d'un sistema en desenvolupament pel que les avaluacions que incloem són preliminars.
Databáze: OpenAIRE