Explorando dinâmicas entre sessões para sequências longas de interações de sessão com Aprendizado por Reforço Profundo para Recomendação Ciente de Sessão

Autor: Gustavo Junior Escobedo Ticona
Přispěvatelé: Marcelo Garcia Manzato, Moacir Antonelli Ponti, Ricardo Araújo Rios, Rodrygo Luis Teodoro Santos
Jazyk: angličtina
Rok vydání: 2021
Předmět:
Zdroj: Biblioteca Digital de Teses e Dissertações da USP
Universidade de São Paulo (USP)
instacron:USP
Popis: Recommender systems are tools whose objective is to filter relevant content to users according to their preferences. Recently, due to the new demands of electronic business where most of users are not authenticated, Session-based recommender systems emerged. This approach models session data (e.g. sequences of interactions, item metadata) to predict which items will be relevant for the user during the current session. Session-aware approaches include representations from users past sessions to improve performance on fresh new sessions. However, current approaches only exploit these representations at the beginning of the session which in a long sequence of interactions does not take advantage of possible changes of interest during the same session. Consequently, in this research work, we explore the possibility of exploiting inter-session representations to improve recommendation performance. We proposed an adaptation of the Deep Deterministic Policy Gradient algorithm on a session-aware recommender model to train a policy that handles the interaction between the current intra-session state and inter-session representations. We performed several experiments on two datasets from different domains finding key factors that affect session-aware models performance. However, we could not find strong evidence to claim that inter-session dynamics can improve performance during long sequences of intra-session interactions. Sistemas de recomendação são ferramentas cujo objetivo é filtrar o conteúdo relevante para os usuários de acordo com suas preferências. Recentemente, devido às novas demandas de negócios eletrônicos em que a maioria dos usuários não estão autenticados, surgiram os sistemas de recomendação baseados em sessão. Esta abordagem modela dados da sessão (por exemplo, sequências de interações, metadados de itens) para predizer quais itens serão relevantes para o usuário durante a sessão atual. As abordagens cientes de sessão incluem representações de sessões anteriores de usuários para melhorar o desempenho em novas sessões. No entanto, eles usam apenas essas representações no início da sessão, sendo que em uma longa sequência de interações não aproveita as possíveis mudanças de interesse durante a propria sessão. Os modelos atuais pressupõem que essas mudanças ocorrem apenas no início de uma nova sessão, conseqüentemente neste trabalho de pesquisa exploramos a possibilidade de usar essas representações entre sessões para beneficiar o desempenho das recomendações durante sessões longas. Propusemos uma adaptação do algoritmo Deep Deterministic Policy Gradient em um modelo de recomendação ciente de sessão para treinar uma política que lida com a interação entre o estado intra-sessão atual e as representações inter-sessão. Realizamos experimentos em dois conjuntos de dados de diferentes domínios, encontrando os principais fatores que afetam o desempenho dos modelos cientes de sessão. No entanto, não pudemos encontrar evidências fortes para afirmar que as dinâmicas entre as sessões podem melhorar o desempenho durante longas sequências de interações entre as sessões.
Databáze: OpenAIRE