Information system for researching and evaluating user reviews of products

Jazyk: ruština
Rok vydání: 2022
Předmět:
DOI: 10.18720/spbpu/3/2022/vr/vr22-3990
Popis: Тема магистерской диссертации: «Информационная система для исследования и оценки отзывов пользователей о Ð¿Ñ€Ð¾Ð´ÑƒÐºÑ‚Ð°Ñ Â». Данная работа посвящена исследованию задач анализа мнений и анализа настроений, обнаружению спама мнений, а также созданию модулей обнаружения спама и анализа мнений на уровне отзыва и Ð¸Ñ Ð²Ð½ÐµÐ´Ñ€ÐµÐ½Ð¸ÑŽ. Задачи, которые были решены в этой работе: Демонстрация влияния спам-отзывов на результаты системы анализа мнений и важности включения модуля обнаружения спама. Создание модуля обнаружения спама, используя особенности, которые извлекаются из текста отзыва, и внедрение этой системы. Анализ роли систем анализа мнений на современном конкурентном рынке и различные области применения ÑÑ‚Ð¸Ñ ÑÐ¸ÑÑ‚ÐµÐ¼. Создание системы анализа мнений, способной определять ориентацию настроений в Ð¾Ñ‚Ð·Ñ‹Ð²Ð°Ñ , и внедрение этой системы. Анализ Ð¿Ð¾Ð»ÑƒÑ‡ÐµÐ½Ð½Ñ‹Ñ Ñ€ÐµÐ·ÑƒÐ»ÑŒÑ‚Ð°Ñ‚Ð¾Ð² тестирования Ð¿Ð¾ÑÑ‚Ñ€Ð¾ÐµÐ½Ð½Ñ‹Ñ Ð¼Ð¾Ð´ÑƒÐ»ÐµÐ¹ на основе показателей оценки. В Ñ Ð¾Ð´Ðµ выполнения этой работы будет показана важность мнений как движущей силы человеческого поведения и рынка в целом, а также будут исследованы решаемые задачи в области анализа мнений и различные Ð¿Ð¾Ð´Ñ Ð¾Ð´Ñ‹ к Ð¸Ñ Ñ€ÐµÑˆÐµÐ½Ð¸ÑŽ и уровни проведения задачи анализа мнений, а также будут предложена система анализа мнения, включающая в себя модули обнаружения спама и анализа настроений на уровне отзыва. Оба модуля были построены и реализованы с использованием языка программирования Python. Для этой цели были использованы 2 модели: модель машинного обучения для обнаружения спама, и модель глубокого обучения для анализа настроений. Модуль обнаружения спама обрабатывает данные и извлекает все нужные особенности из домена отзыва перед обучением модели, а модуль анализа настроений обрабатывает данные и переводит Ð¸Ñ Ð² числовые значения перед анализом. Кроме того, были использованы 2 Ð¾Ð±Ñ‰ÐµÐ´Ð¾ÑÑ‚ÑƒÐ¿Ð½Ñ‹Ñ Ð½Ð°Ð±Ð¾Ñ€Ð° Ð´Ð°Ð½Ð½Ñ‹Ñ Ð´Ð»Ñ обучения моделям машинного обучения и глубокого обучения. В результате эти две модели были оценены, чтобы продемонстрировать эффективность, надежность и удобство использования ÑÑ‚Ð¸Ñ Ð¼Ð¾Ð´ÐµÐ»ÐµÐ¹ наряду с предложенным Ð¿Ð¾Ð´Ñ Ð¾Ð´Ð¾Ð¼, а также Ð¸Ñ Ð³Ð¾Ñ‚Ð¾Ð²Ð½Ð¾ÑÑ‚ÑŒ к использованию в Ñ€ÐµÐ°Ð»ÑŒÐ½Ñ‹Ñ Ð¿Ñ€Ð¸Ð»Ð¾Ð¶ÐµÐ½Ð¸ÑÑ .
The subject of the graduate qualification work is «Information system for researching and evaluating user reviews of products». The given work is devoted studying the tasks of opinion analysis and sentiment analysis, the detection of opinion spam, as well as the creation of spam detection and opinion analysis modules at the review-level and their implementation. The research set the following goals: Demonstrating the impact of spam reviews on the results of the opinion analysis system and the importance of enabling the spam detection module. Creating a spam detection module using features that are extracted from the text of the review, and implementing this system. Analyzing the role of opinion analysis systems in the modern competitive market and various applications of these systems. Creating an opinion analysis system capable of determining the orientation of sentiment in reviews, and implementing this system. Analyzing the obtained test results of the constructed modules based on performance measures. In the course of this work, the importance of opinions as a driving force of human behavior and the market as a whole will be shown, as well as the researched tasks in the field of opinion analysis and various approaches to solving them and the levels of performing opinion analysis will be investigated, and an opinion analysis system will be proposed, including spam detection and sentiment analysis modules on the review-level. Both modules were built and implemented using Python programming language. For this purpose, 2 models were used: a machine learning model for spam detection, and a deep learning model for sentiment analysis. The spam detection module processes the data and extracts all the necessary features from the review- domain before training the model, and the sentiment analysis module processes the data and converts it to numeric values before analysis.In addition, 2 publicly available datasets were used to train machine learning and deep learning models. As a result, these two models were evaluated to demonstrate the effectiveness, reliability and usability of these models along with the proposed approach, as well as their readiness for use in real applications.
Databáze: OpenAIRE