Autor: |
David Tomás, José Luis Vicedo |
Jazyk: |
Catalan; Valencian<br />English<br />Spanish; Castilian<br />Basque<br />Galician<br />Portuguese |
Rok vydání: |
2009 |
Předmět: |
|
Zdroj: |
Linguamática, Vol 1, Iss 2 (2009) |
Druh dokumentu: |
article |
ISSN: |
1647-0818 |
Popis: |
Este artículo presenta una aproximacíon a la clasificación automática de preguntas en español y catalán. El sistema de clasificación está basado en el algoritmo SVM y en el uso de diferentes funciones kernel, empleando únicamente características textuales superficiales que permiten la obtencíon de un sistema fácilmente adaptable a diferentes idiomas. Se ha realizado un estudio sobre el correcto a juste de parámetros de los kernels, la precisíon de los mismos, la definicíon de distintos vectores de características de aprendizaje y el rendimiento en función del idioma de trabajo. Adicionalmente, se ha experimentado con el algoritmo LIBLINEAR, aplicado aquí por vez primera a la tarea de clasificación de preguntas. Con este algoritmo, así como con los kernels definidos, se han obtenido valores de precisión por encima del 80 % para los dos idiomas tratados, superando a otros algoritmos tradicionales de clasificación. Para el entrenamiento y evaluación del sistema se ha desarrollado un corpus paralelo de 2.393 preguntas en inglés, español y catalán. |
Databáze: |
Directory of Open Access Journals |
Externí odkaz: |
|