Generació automàtica de resums de textos especialitzats: experimentacions en llengua catalana

Autor: Jorge Vivaldi, Iria da Cunha Fanego, Juan-Manuel Torres-Moreno, Patricia Velázquez-Morales
Jazyk: Catalan; Valencian
Rok vydání: 2010
Zdroj: Terminàlia; Núm. 1 : juliol 2010; p. 26-32
BASE-Bielefeld Academic Search Engine
Popis: En aquest article presentem un nou algoritme per al resum automàtic de textos especialitzats, que combina recursos terminològics (l'ús de l'extractor de termes YATE) i semàntics (consulta de l'ontologia lèxica EuroWordNet). Apliquem l'algoritme a un corpus de textos mèdics en català i n'avaluem els resums automàtics produïts, amb el sistema FRESA, tot comparant-los amb sengles resums baseline i amb els resums d'un altre resumidor automàtic, el sistema OTS. L'algoritme proposat obté prou bons resultats, però el potencial de millora és, segons el nostre parer, molt alt.
In this article we present a new algorithm for the automatic summarisation of specialized texts, which combines terminological resources (YATE as a terminology extractor) and semantic resources (EuroWordNet as a lexical ontology). We apply this algorithm to a corpus of medical texts in Catalan and we evaluate the automatic summaries produced with the system FRESA, comparing them with baseline summaries and with results of another automatic summary system, the OTS. The new algorithm yields adequate results, but the potential for improvement is, in our view, very high.
Databáze: OpenAIRE