Розробка рекомендаційної системи, заснованої на графі переходів
Jazyk: | angličtina |
---|---|
Rok vydání: | 2021 |
Předmět: | |
Zdroj: | Eastern-European Journal of Enterprise Technologies; Vol. 3 No. 4 (111) (2021): Mathematics and Cybernetics-applied aspects; 24-31 Eastern-European Journal of Enterprise Technologies; Том 3 № 4 (111) (2021): Математика и кибернетика-прикладные аспекты; 24-31 Eastern-European Journal of Enterprise Technologies; Том 3 № 4 (111) (2021): Математика та кібернетика-прикладні аспекти; 24-31 |
ISSN: | 1729-3774 1729-4061 |
Popis: | A recommendation system has been built for a web resource’s users that applies statistics about user activities to provide recommendations. The purpose of the system operation is to provide recommendations in the form of an orderly sequence of HTML pages of the resource suggested for the user. The ranking procedure uses statistical information about user transitions between web resource pages. The web resource model is represented in the form of a web graph; the user behavior model is shown as a graph of transitions between resource pages. The web graph is represented by an adjacency matrix; for the transition graph, a weighted matrix of probabilities of transitions between the vertices of the graph has been constructed. It was taken into consideration that user transitions between pages of a web resource may involve entering a URL in the address bar of a browser or by clicking on a link in the current page. The user’s transition between vertices in a finite graph according to probabilities determined by the weight of the graph’s edges is represented by a homogeneous Markov chain and is considered a process of random walk on the graph with the possibility of moving to a random vertex. Random Walk with Restarts was used to rank web resource pages for a particular user. Numerical analysis has been performed for an actual online store website. The initial data on user sessions are divided into training and test samples. According to the training sample, a weighted matrix of the probability of user transitions between web resource pages was constructed. To assess the quality of the built recommendation system, the accuracy, completeness, and Half-life Utility metrics were used. On the elements of the test sample, the accuracy value of 65‒68 % was obtained, the optimal number of elements in the recommendation list was determined. The influence of model parameters on the quality of recommendation systems was investigated. Разрабатывается рекомендательная система для пользователей веб-ресурса, в которой для формирования рекомендаций используется статистические данные о действиях пользователей. Целью системы является предоставление рекомендаций в виде упорядоченной последовательности HTML-страниц ресурса, которые предлагается посетить пользователю. Для выполнения ранжирования используется статистическая информация о переходах пользователей между страницами сайта. Модель веб-ресурса представляется в виде веб-графа, а модель поведения пользователя – в виде графа переходов между страницами ресурса. Веб-граф представлен матрицей смежности, для графа переходов строится взвешенная матрица вероятностей переходов между вершинами графа. При построении модели учитывается, что переходы пользователя по страницам веб-ресурса осуществляются путем ввода URL-адреса в строке браузера или путем перехода по ссылке на текущей странице. Последовательность переходов пользователя между вершинами в конечном графе в соответствии с вероятностями, которые определяются весами ребер графа, описана однородной цепью Маркова и представляет собой процесс случайного блуждания на графе с возможностью перехода в произвольную вершину. Ранжирование страниц веб-ресурса для конкретного пользователя осуществляется методом Random Walk with Restarts. Вычислительный эксперимент проведен для веб-сайта интернет магазина. Исходные данные о сессиях пользователей были разделены на обучающую и тестовую выборки. По данным обучающей выборки строится взвешенная матрица вероятностей переходов пользователей между страницами веб-ресурса. Для оценки качества построенной рекомендательной системы используются метрики точности, полноты и Half-life Utility. На элементах тестовой выборки получено значение точности 65–68%, определено оптимальное количество элементов в списке рекомендаций. Исследовано влияние параметров модели на качество рекомендательной системы Побудовано рекомендаційну систему для користувачів веб-ресурсу, яка для надання рекомендацій використовує статистичні данні про дії користувачів. Метою роботи системи є надання рекомендацій у вигляді впорядкованої послідовності HTML-сторінок ресурсу, які пропонується відвідати користувачеві. Для виконання процедури ранжування використовується статистична інформація про переходи користувачів між сторінками веб-ресурсу. Модель веб-ресурсу зображено у вигляді веб-графа, а модель поведінки користувача – у вигляді графа переходів між сторінками ресурсу. Веб-граф подається матрицею суміжності, для графа переходів побудовано зважену матрицю ймовірностей переходів між вершинами графа. Враховано, що переходи користувача між сторінками веб-ресурсу можуть здійснюватися шляхом вводу URL-адреси в адресний рядок браузера, або шляхом переходу за посиланням на поточній сторінці. Перехід користувача між вершинами у скінченному графі у відповідності до ймовірностей, які визначаються за вагою ребер графу, зображується однорідним ланцюгом Маркова и вважається процесом випадкового блукання на графі з можливістю переходу у випадкову вершину. Для ранжування сторінок веб-ресурсу для певного користувача використовується метод Random Walk with Restarts. Числовий аналіз виконано для існуючого веб-сайта інтернет магазина. Вихідні дані про користувацькі сесії поділено на навчальну та тестову вибірки. За даними навчальної вибірки було побудовано зважену матрицю ймовірності переходів користувачів між сторінками веб-ресурсу. Для оцінки якості побудованої рекомендаційної системи використано метрики точності, повноти та Half-life Utility. На елементах тестової вибірки отримано значення точності 65–68%, визначено оптимальну кількість елементів у списку рекомендацій. Досліджено вплив параметрів моделі на якість рекомендаційної систем |
Databáze: | OpenAIRE |
Externí odkaz: |