Análisis de sentimiento en tiempo real de mensajes de Twitch con algoritmos de clasificación

Autor: Sáenz Rubia, Raúl
Přispěvatelé: Ventura Royo, Carles, Diego Andilla, Ferran
Jazyk: Spanish; Castilian
Rok vydání: 2020
Předmět:
Zdroj: O2, repositorio institucional de la UOC
Universitat Oberta de Catalunya (UOC)
Popis: El análisis de sentimiento es un subcampo del Procesamiento del Lenguaje Natural cuyo objetivo es analizar textos subjetivos y extraer información de utilidad sobre la polaridad de sentimiento del autor a nivel de documento, de frase concreta o sobre el aspecto de un artículo o servicio de interés para el analista. En concreto, las redes sociales y páginas de micro-blogging como Twitter o Twitch se han convertido en fuentes inagotables de textos que pueden ser usados para analizar la opinión del público sobre aspectos tan variados como la política, economía o cualquier otro producto o servicio al instante. Twitch, en concreto, es una plataforma que ha crecido enormemente durante los últimos años, lo cual hace necesario mejorar la interacción con el público para desmarcarse de la competencia, y el chat de Twitch es una fuente de información que puede ayudar a los creadores de contenido a conocer la opinión de su audiencia. Sin embargo, actualmente no existen extensiones para el análisis de sentimiento en español para dicha plataforma, por lo que vemos una oportunidad para innovar. En este trabajo se utilizan métodos de aprendizaje profundo MLP y LSTM para la construcción de un clasificador de polaridad de sentimiento con tres niveles: positivo, neutro y negativo, con el que se obtienen resultados del 76% de exactitud media, lo cual es bastante aceptable teniendo en cuenta los obstáculos hallados en el análisis como la ambigüedad del lenguaje, el desconocimiento del contexto y las errores ortográficos, intencionados o no. Sentiment analysis is a subfield of Natural Language Processing whose objective is to analyze subjective texts and extract useful information about the author's polarity of feeling at the document level, of a specific phrase or about an aspect of an product or service of interest for the analyst. Specifically, social networks and micro-blogging pages such as Twitter or Twitch have become inexhaustible sources of texts that can be used to instaltly analyze public opinion on aspects as varied as politics, economy or any other product or service. Twitch, in particular, is a streaming platform that has grown tremendously in recent years, which makes it necessary to improve interaction with the public to get rid of the competition, and Twitch chat is a source of information that can help creators of content to know the opinion of your audience. However, there are currently no extensions for sentiment analysis in Spanish for this platform, so we see an opportunity to innovate.In this work, we use MLP and LSTM deep learning methods to develop a multi-class sentiment analysis classifier with three levels of polarity: positive, neutral and negative, with achieved average results of 75% in accuracy, which is a quite acceptable outcome considering the obstacles found in the analysis such as language ambiguity, unawareness of context and intentional or unintentional misspellings. L'anàlisi de sentiment és un subcampo del Processament del Llenguatge Natural l'objectiu del qual és analitzar textos subjectius i extreure informació d'utilitat sobre la polaritat de sentiment de l'autor a nivell de document, de frase concreta o sobre l'aspecte d'un article o servei d'interès per a l'analista. En concret, les xarxes socials i pàgines de micro-blogging com Twitter o Twitch s'han convertit en fonts inesgotables de textos que poden ser usats per a analitzar l'opinió del públic sobre aspectes tan variats com la política, economia o qualsevol altre producte o servei a l'instant. Twitch, en concret, és una plataforma que ha crescut enormement durant els últims anys, la qual cosa fa necessari millorar la interacció amb el públic per a desmarcar-se de la competència, i el xat de Twitch és una font d'informació que pot ajudar els creadors de contingut a conèixer l'opinió de la seva audiència. No obstant això, actualment no existeixen extensions per a l'anàlisi de sentiment en espanyol per a aquesta plataforma, per la qual cosa veiem una oportunitat per a innovar. En aquest treball s'utilitzen mètodes d'aprenentatge profund MLP i LSTM per a la construcció d'un classificador de polaritat de sentiment amb tres nivells: positiu, neutre i negatiu, amb el qual s'obtenen resultats del 76% d'exactitud mitjana, la qual cosa és bastant acceptable tenint en compte els obstacles trobats en l'anàlisi com l'ambigüitat del llenguatge, el desconeixement del context i les errors ortogràfics, intencionats o no.
Databáze: OpenAIRE