Hacia una extracción automática de colocaciones en definiciones de verbos de un diccionario explicativo en español

Autor: Castro-Sánchez, Noé Alejandro, Cruz Domínguez, Irasema, Sidorov, Grigori, Martínez Rebollar, Alicia
Jazyk: Spanish; Castilian
Rok vydání: 2015
Předmět:
Zdroj: Revista signos, Volume: 48, Issue: 88, Pages: 174-196, Published: AUG 2015
Popis: En este artículo presentamos un método para identificar colocaciones de manera automática en definiciones de verbos extraídas del diccionario explicativo de la Real Academia Española (R AE) con el fin de probar que las colocaciones pueden identificarse aplicando heurísticas sencillas que consideran solo criterios semánticos en contextos textuales bien estructurados, como es el caso de las definiciones lexicográficas. Los candidatos a colocaciones se caracterizan porque están situados al inicio de las definiciones y tienen como particularidad que la base de la colocación candidata pertenece a la familia léxica del verbo definido (1.347 casos). La evaluación de las combinaciones de palabras obtenidas se realizó de manera semiautomática, considerando criterios estadísticos y sintáctico-semánticos. Ésta arrojó como resultado que el 61% de las combinaciones de palabras extraídas de esta manera son colocaciones, logrando alcanzar una cobertura del 36%. In this paper we present a method for identifying collocations in an automatic way in verb definitions extracted from the explanatory dictionary of the Royal Spanish Academy, in order to test that collocations can be identified by applying simple heuristics considering only semantic criteria in well-structured textual contexts, as lexicographic definitions are presented. The method identifies candidates for collocations located at the beginning of the definitions that have a special feature: the base of the candidate collocation belongs to the lexical family of the defined verb (1,347 cases). The evaluation of the obtained word combinations was performed both manually and automatically following various statistical and syntactic-semantic criteria. The results of our experiment show that 61% of the extracted verb combinations are collocations, obtaining a recall of 36%.
Databáze: OpenAIRE