Classification of sentiments in e-commerce utilizando redes neurais artificiais
Autor: | Figueiredo, Ernanny |
---|---|
Přispěvatelé: | Miloca, Simone Aparecida, Villwock, Rosangela, Ito, Giani Carla |
Jazyk: | portugalština |
Rok vydání: | 2022 |
Předmět: | |
Zdroj: | Biblioteca Digital de Teses e Dissertações do UNIOESTE Universidade Estadual do Oeste do Paraná (UNIOESTE) instacron:UNIOESTE |
Popis: | Submitted by Neusa Fagundes (neusa.fagundes@unioeste.br) on 2022-03-24T11:29:25Z No. of bitstreams: 2 Ernanny_Figueiredo2022.pdf: 2434307 bytes, checksum: 7cb7c50c9a085f979de1f7d8d6c48782 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Made available in DSpace on 2022-03-24T11:29:25Z (GMT). No. of bitstreams: 2 Ernanny_Figueiredo2022.pdf: 2434307 bytes, checksum: 7cb7c50c9a085f979de1f7d8d6c48782 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2022-02-04 Every day, millions of people openly share their opinions on social media and comment sites about specific topics, products, services, etc. Several segments of the business market are interested in gaining information from this medium that is relevant to their business. One type of desired information is the identification of sentiments expressed by registered users in the form of opinions, as this shows agreement or disagreement related to the topic. Manual collection of such information is often not feasible due to the large amount of text. This is where machine learning techniques come into play, allowing you to organize, manage and extract knowledge so that the user of the solution can improve their business strategy. This work proposes an approach to the text classification problem applied to sentiment analysis to identify the polarity of the text, i.e., to know whether the opinion is positive or negative. The literature indicates several tools with different classifiers can be found in the ones used in this work are those whose built models incorporate classifiers based on artificial neural networks. The models were created and their performance was evaluated for a specific set of data containing the opinions of consumers who purchased health care products, with texts written in Portuguese. The effect of the preprocessing stages of the texts on the models was also studied. The results showed that artificial neural network solutions, both multilayer and recurrent, implemented in Python, reach an efficiency level close to the best and most widespread commercial tools for this task. Todos os dias, milhões de pessoas compartilham abertamente, nas redes sociais e páginas de comentários, suas opiniões sobre determinados assuntos, produtos, serviços, etc. Diversos segmentos do mercado empresarial têm interesse em extrair informações desse meio, que sejam relevantes para seu negócio. Um tipo de informação desejada é a identificação de sentimentos expressos pelos usuários registrados na forma de opiniões, já que isso demonstra a aceitação ou rejeição com relação ao assunto. A obtenção de tais informações de forma manual muitas vezes é inviável devido a grande quantidade de textos e ai entram as técnicas de aprendizado de máquina permitindo organizar, gerenciar e extrair conhecimento, possibilitando ao utilizador da solução melhorar sua estratégia de negócio. Este trabalho propõe uma abordagem para o problema de classificação de textos aplicado à análise de sentimentos, para identificar a polaridade do texto, ou seja, saber se a opinião é positiva ou negativa. A literatura indica diversas ferramentas com classificadores diferentes, sendo as utilizadas neste trabalho aquelas cujos modelos construídos incorporam classificadores baseados em redes neurais artificiais. Modelos foram construídos e seu desempenho avaliado para um grupo particular de dados que contém opiniões de consumidores que adquiriram produtos da área da saúde, com textos escritos na língua portuguesa. Também investigou-se o impacto das fases de pré-processamento do texto nos modelos. Os resultados mostraram que as soluções de redes neurais artificiais, tanto as multi camadas quanto as recorrentes, implementadas em Python, atingem um nível de eficiência próximo das melhores e mais difundidas ferramentas comerciais destinadas à esta tarefa. |
Databáze: | OpenAIRE |
Externí odkaz: |