The influence of context during the categorization and discrimination of Spanish and Portuguese person names
Autor: | Kozareva, Zornitsa Petrova, Vázquez, Sonia, Montoyo, Andres |
---|---|
Jazyk: | angličtina |
Rok vydání: | 2007 |
Předmět: | |
Zdroj: | RUA. Repositorio Institucional de la Universidad de Alicante Universidad de Alicante (UA) |
Popis: | Este artículo presenta un nuevo método para la categorización y la discriminación de nombres propios utilizando como fuente de información la similitud semántica. Para establecer las relaciones semánticas entre las palabras que forman el contexto donde aparece la entidad que queremos categorizar o discriminar, nuestro método utiliza la semántica latente. Se han realizado diferentes experimentos donde se ha estudiado la influencia del contexto y la robustez de nuestra aproximación sobre distintos números de ejemplos. La evaluación se ha realizado sobre textos en español y portugués. Los resultados obteniendos son 90% para español y 82% para portugués en categorización y un 80% para español y un 65% para portugués en discriminación. This paper presents a method for fine-grained categorization and discrimination of person names on the basis of the semantic similarity information. We employ latent semantic analysis which establishes the semantic relations between the words of the context in which the named entities appear. We carry out several experimental studies in which we observe the influence of the context and the robustness of our approach with different number of examples. Our approach is evaluated with Spanish and Portuguese. The experimental results are encouraging, reaching 90% for the Spanish and 82% for the Portuguese person name categorization, and 80% for the Spanish and 65% for the Portuguese NE discrimination of six conflated names. This research has been funded by QALLME number FP6 IST-033860 and TEXT-MESS number TIN2006-15265-C06-01. |
Databáze: | OpenAIRE |
Externí odkaz: |