Problemática actual del procesamiento computacional anafórico: el caso de FreeLing 4.1

Autor: Andrés Felipe Grajales Ramírez, Jorge Mauricio Molina Mejia
Jazyk: Spanish; Castilian
Rok vydání: 2019
Předmět:
Zdroj: Lenguaje, Volume: 47, Issue: 2 Supplement 1, Pages: 537-568, Published: DEC 2019
Popis: Resumen En este artículo, presentamos el caso del procesamiento computacional automático de la anáfora y de la problemática que genera dicho tratamiento. Para ello, nos hemos fundamentado en el etiquetador FreeLing 4.1, y en su módulo para el tratamiento de correferentes textuales; analizando, en este caso, un corpus para la enseñanza del español a estudiantes extranjeros. Con el fin de establecer el análisis y los problemas suscitados por este analizador automático, se ha establecido una definición y una tipología anafórica propias, que surgen a partir de varias lecturas y teorías provenientes del campo de la lingüística textual. El artículo finaliza con el análisis estadístico que muestra los diferentes problemas generados en el reconocimiento de dichos tipos de anáforas y de su implicación en el posterior etiquetado de redes correferenciales. Abstract In this article, we present the case of automatic computational processing of the anaphora and the problem generated by such processing. To do this, we have relied on the FreeLing 4.1 tagger, and its module for the treatment of textual coreference; analyzing, in this case, a corpus for teaching Spanish to foreign students. In order to establish the analysis and problems raised by this automatic analyzer, a definition and anaphoric typology of our own has been established, which arise from various readings and theories from textual linguistics field. The article concludes with the statistical analysis showing the different problems generated in the recognition of these types of anaphora and their involvement in the subsequent tagging of coreferential networks. Résumé Dans cet article, nous présentons le cas du traitement automatique des anaphores et de la problématique générée par ce type de traitement informatique. Pour ce faire, nous avons travaillé à partir de l’étiqueteur FreeLing 4.1, et de son module pour le traitement de la coréférence textuelle. Grâce à celui-ci, nous avons analysé un corpus dédié à l’enseignement de l’espagnol vis-à-vis des apprenants étrangers. Ayant pour but d’établir l’analyse et les problèmes suscités par cet analyseur automatique, nous y avons établi une définition, ainsi qu’une typologie personnelle ; qui apparaissent à la suite de nos lectures et de théories provenant du champ de la linguistique textuelle. À la fin, notre article montre l’analyse statistique et les différents problèmes produits dans la reconnaissance de ce type d’anaphores, ainsi que de leur possible implication dans le postérieur étiquetage de réseaux coréférentiels.
Databáze: OpenAIRE