Creatividad computacional: diseño y desarrollo de un método para generación automática de descripciones asociadas a elementos de juegos de rol

Autor:	Rodríguez Segado, Alejandro Vicente
Přispěvatelé:	Lloret, Elena, Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Jazyk:	Spanish; Castilian
Rok vydání:	2021
Předmět:	Modelos de lenguaje Generación de lenguaje natural Creatividad computacional Procesamiento de lenguaje natural Language models Lenguajes y Sistemas Informáticos Lenguaje natural Lingüística computacional GPT-2 Creatividad
Zdroj:	RUA. Repositorio Institucional de la Universidad de Alicante Universidad de Alicante (UA)
Popis:	La capacidad creativa de las máquinas es un asunto que siempre ha despertado controversia, tanto en medios divulgativos, como en expertos en la materia. Hoy en día, pese a la proliferación de aplicaciones creativas en el campo de la creatividad computacional, las opiniones continúan estando divididas, algunas de ellas poniendo en duda el potencial creativo de las máquinas y tachándolas de “expertas falsificadoras”. Pero acaso, ¿no somos las personas también “expertos falsificadores”? Este trabajo, pretende experimentar con la capacidad creativa de las máquinas para la generación de lenguaje natural (GLN). Este campo pertenece a la disciplina conocida como lingüística computacional (LC) o procesamiento del lenguaje natural (PLN), cuyo propósito es entender y generar lenguaje natural. Así, con el fin de poner a prueba como se desenvuelven las máquinas con esta habilidad inherente en los humanos, se pretende diseñar un sistema capaz de generar automáticamente descripciones asociadas a juegos de rol. Tras una exhaustiva investigación del estado actual de la tarea de la GLN, el enfoque propuesto para abordar el sistema descrito se fundamenta en las tecnologías de vanguardia basadas en modelos de lenguaje neuronales (NLM: Neural Language Models), concretamente en el modelo GPT-2 de la arquitectura Transformer. Estas tecnologías se profundizan en el capítulo 3 de este trabajo. En el capítulo 7 se presenta una evaluación de los textos generados por el sistema, utilizando distintas técnicas de decodificación. A pesar de estar entrenado con una escasa cantidad de datos, el sistema es capaz de generar algunos textos creativos y gramaticalmente correctos. Como se precisa también en el capítulo 3, la cantidad de datos requeridos para entrenar un modelo de lenguaje desde cero, como en este caso, es extremadamente grande, por lo que los investigadores suelen utilizar modelos preentrenados. Puesto que la mayoría de los recursos para abordar la tarea de la GLN, así como otros campos de la LC, están en inglés, y el sistema propuesto es sumamente específico, la alternativa de recurrir a un modelo preentrenado se dificulta. Por estos motivos, el enfoque propuesto para este sistema es un entrenamiento desde cero (from scratch).
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=dedup_wf_001::f9c9d71e6210bbc809ae76712173765c https://hdl.handle.net/10045/118269 Zobrazit plný text záznamu