Sumarização de Opinião com base em Abstract Meaning Representation

Autor: Marcio Lima Inácio
Přispěvatelé: Thiago Alexandre Salgueiro Pardo, Ariani Di Felippo, Ricardo Marcondes Marcacini, Norton Trevisan Roman
Rok vydání: 2021
Zdroj: Biblioteca Digital de Teses e Dissertações da USP
Universidade de São Paulo (USP)
instacron:USP
DOI: 10.11606/d.55.2021.tde-13092021-141741
Popis: A área de Mineração de Opiniões visa a processar automaticamente textos subjetivos que emitem a crítica do autor a respeito de alguma entidade (como produtos ou serviços). Essa área vem crescendo devido às grandes quantidades de dados produzidos na web, tendo como uma de suas aplicações a Sumarização de Opiniões, em que um sistema gera automaticamente um resumo dos principais comentários a respeito da entidade avaliada. Alguns trabalhos mais recentes propõem abordagens baseadas em análises semânticas mais profundas através do uso de representações semânticas, argumentando que essas análises produzem melhores resultados capazes de lidar com sentimentos e informações implícitas no texto. Entre as representações semânticas existentes na literatura, a Abstract Meaning Representation (AMR) vem ganhando notoriedade por se basear em recursos bem consolidados, como o PropBank, e por ter apresentado bons resultados em diversas tarefas, como a Sumarização Automática. Neste trabalho de mestrado, propõe-se fazer o uso da representação AMR na Mineração de Opinião, mais especificamente aplicada à Sumarização de Opiniões, abordando diferentes frentes de trabalho, como a anotação de um córpus de opiniões em AMR e uma análise dos resultados dessa anotação em comparação a textos jornalísticos, bem como o desenvolvimento de novos métodos de sumarização automática de opiniões baseados em AMR. Como principal resultado, foi possível verificar que o uso das representações semânticas explícitas auxiliou na seleção de informações para os resumos. Além disso, alguns dos novos métodos desenvolvidos se mostraram melhores quando comparados às tecnicas baseadas em AMR já existentes na literatura. Opinion Mining aims at automatically processing subjective texts which carry the sentiment of the author towards some entity (such as products or services). This area has been growing due to large amounts of data produced on the Web, having as one of its application Opinion Summarization, in which a system automatically generates a summary of the main commentaries concerning the evaluated entity. Some more recent works propose approaches based on deeper semantic analysis through the use of semantic representations, arguing that these analyses produce better results capable of dealing with implicit sentiments and information throughout the text. Among the semantic representations in the literature, Abstract Meaning Representation (AMR) has been gaining notoriety for being based on well-consolidated resources, such as the PropBank, and for having presented good results in many tasks, among which Automatic Summarization. In this project, we propose to make use of the AMR representation in Opinion Mining, more specifically applied to Opinion Summarization, addressing different work fronts, such as the annotation of an opinion corpus in AMR and and a comparative analysis of these annotation results to news texts, as well as the development of new AMR-based Automatic Opinion Summarization methods. As a main result, we could verify that including explicit semantic representations improved content selection for the summaries. Furthermore, some of our novel methods outperformed other AMR-based techniques from the literature.
Databáze: OpenAIRE