UnderRL Tagger: un etiquetador gramatical para lenguas infrasoportadas tecnológicamente y lenguas minoritarias
Autor: | José Luis Pemberty Tamayo, Jorge Mauricio Molina Mejía, Víctor Julián Vallejo Zapata |
---|---|
Jazyk: | English<br />Spanish; Castilian<br />Portuguese |
Rok vydání: | 2023 |
Předmět: | |
Zdroj: | Forma y Función, Vol 36, Iss 2 (2023) |
Druh dokumentu: | article |
ISSN: | 0120-338X 2256-5469 |
DOI: | 10.15446/fyf.v36n2.101984 |
Popis: | En este artículo se presenta UnderRL Tagger, un programa informático de acceso libre diseñado para el etiquetado morfosintáctico (POS tagging) en lenguas que no cuentan con etiquetadores automáticos. El programa busca facilitar el trabajo con corpus en estas lenguas infrasoportadas tecnológicamente y en las lenguas minoritarias, aportando así a los procesos de revitalización desde la investigación descriptiva y las herramientas computacionales. UnderRL Tagger permite que el proceso manual de etiquetado se convierta poco a poco en automático gracias a un sistema que permite recordar y reutilizar las etiquetas, manejar grandes cantidades de textos y generar archivos de salida en formato XML con etiquetas basadas en el sistema estandarizado EAGLES. Este artículo muestra el proceso de modelado y elaboración del sistema, sus diferentes funcionalidades y las perspectivas de trabajos posteriores. |
Databáze: | Directory of Open Access Journals |
Externí odkaz: |