Nested mention detection in Spanish based on expansion
Autor: | Puchol Blasco, Marcel, Martínez-Barco, Patricio |
---|---|
Přispěvatelé: | Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos, Procesamiento del Lenguaje y Sistemas de Información (GPLSI) |
Rok vydání: | 2011 |
Předmět: | |
Zdroj: | RUA. Repositorio Institucional de la Universidad de Alicante Universidad de Alicante (UA) |
Popis: | La detección de menciones es el primer módulo utilizado en los sistemas de resolución de la correferencia. Debido a que los errores se van acarreando de un módulo a otro, es importante que los resultados obtenidos por este módulo sean los mejores posibles. Dentro del campo de la detección de menciones, las menciones anidadas son las más difíciles de detectar. En este artículo presentamos un sistema de detección de menciones anidadas basado en expansión, un nuevo modelo de detección de elementos de Procesamiento de Lenguaje Natural anidados basado en aprendizaje automático. Los resultados obtenidos por nuestro sistema son superiores al 72 % de medida-F en el corpus AnCora. No podemos comparar directamente nuestros resultados con otros sistemas debido a que no existen como tales, pero si comparamos la medida-F media obtenida por otros sistemas en la detección de todo tipo de menciones (no solo menciones anidadas), y que nosotros estamos tratando con las menciones más difíciles, conseguimos resultados favorables. Mention detection is the first module used in coreference resolution systems. Due to that, it is important that the results obtained by this module are as high as possible. Within the field of mention detection, nested mentions are the most difficult ones to detect. In this paper, we present a nested mention detection system based on expansion, a new model for detecting nested elements in NLP based on machine learning. The results obtained by our system are above the 72 % in F-measure in AnCora corpus. We can not compare directly our results with other systems, since there are not exist, but if we consider that the average F-measure obtained by other systems for all mention (not only nested mentions), and that we are dealing with the most difficult mentions, we achieve good results. Este artículo está parcialmente financiado por el Ministerio de Ciencia e Innovación - Gobierno de España (beca no. TIN2009-13391-C04-01), y Conselleria d’Educació - Generalitat Valenciana (beca no. PROMETEO/2009/119). |
Databáze: | OpenAIRE |
Externí odkaz: |