Verb SCF extraction for Spanish with dependency parsing
Autor: | Padró, M., Núria Bel, Garí, A. |
---|---|
Jazyk: | angličtina |
Rok vydání: | 2013 |
Předmět: | |
Zdroj: | RUA. Repositorio Institucional de la Universidad de Alicante Universidad de Alicante (UA) Scopus-Elsevier |
Popis: | En este artículo presentamos los resultados de nuestros experimentos en producción automática de léxicos con información de patrones de subcategorización verbal para castellano. La investigación se llevó a cabo en el marco del proyecto PANACEA de adquisición automática de información léxica que redujera al máximo la intervención humana. En nuestros experimentos, se utilizó una cadena de diferentes herramientas que incluía ‘crawling’ de textos de un dominio particular, normalización y limpieza de los textos, segmentación, identificación de unidades, etiquetado categorial y análisis de dependencias antes de, finalmente, la extracción de los patrones de subcategorización. Los resultados obtenidos muestran una gran dependencia de la calidad de los analizadores de dependencias aunque, no obstante, están en línea con los resultados obtenidos en experimentos similares para otras lenguas. In this paper we present the results of our experiments in automatic production of verb subcategorization frame lexica for Spanish. The work was carried out in the framework of the PANACEA project aiming at the automatic acquisition of lexical information reducing at maximum human intervention. In our experiments, a chain of different tools was used: domain focused web crawling, automatic cleaning, segmentation and tokenization, PoS tagging, dependency parsing and finally SCFs extraction. The obtained results show a high dependency on the quality of the results of the intervening components, in particular of the dependency parsing, which is the focus of this paper. Nevertheless, the results achieved are in line with the state-of-the-art for other languages in similar experiments. This work was funded by the European Project PANACEA (FP7-ICT-2010- 248064). |
Databáze: | OpenAIRE |
Externí odkaz: |