Exploração e explotação eficiente para recomendação sequencial de músicas

Autor:	Pedro Dalla Vecchia Chaves
Přispěvatelé:	Rodrygo Luis Teodoro Santos, Fabrício Murai Ferreira, Flávio Vinícius Diniz Figueiredo, Marcelo Garcia Manzato
Jazyk:	angličtina
Rok vydání:	2021
Předmět:	Online learning to rank Efficient exploration Computação – Teses Apredizado do computador – Teses Implicit feedback Recomendação online de músicas – Tese Sistemas de recomendação – Teses Adaptive exploitation Sequential music recommendation Aprendizado de ranqueamento – Teses
Zdroj:	Repositório Institucional da UFMG Universidade Federal de Minas Gerais (UFMG) instacron:UFMG
Popis:	Music streaming services heavily rely upon recommender systems to acquire, engage, and retain users. One notable component of these services are playlists, which can be dynamically generated in a sequential manner based on the user's feedback during a listening session. Online learning to rank approaches have recently been shown effective at leveraging such feedback to learn users' preferences in the space of song features. Nevertheless, these approaches can suffer from slow convergence as a result of their random exploration component and get stuck in local minima as a result of their session-agnostic exploitation component. To overcome these limitations, we propose a novel online learning to rank approach which efficiently explores the space of candidate recommendation models by restricting itself to the orthogonal complement of the subspace of previous underperforming exploration directions. Moreover, to help overcome local minima, we propose a session-aware exploitation component which adaptively leverages the current best model during model updates. Our thorough evaluation using simulated listening sessions from Last.fm demonstrates substantial improvements over state-of-the-art approaches regarding early-stage performance and overall long-term convergence. Os serviços de streaming de música dependem fortemente de sistemas de recomendação para adquirir, envolver e reter usuários. Um componente notável desses serviços são as listas de reprodução, que podem ser geradas dinamicamente de maneira sequencial com base no feedback do usuário durante uma sessão de escuta. Recentemente, métodos baseados em aprendizagem online para ranqueamento se mostraram eficazes ao aproveitar esse feedback para aprender as preferências dos usuários no espaço de representação vetorial de músicas. No entanto, essas abordagens podem sofrer de convergência lenta como resultado de seu componente de exploração aleatório e ficar presas em mínimos locais devido ao seu componente de explotação agnóstico à sessão. Para superar essas limitações, propomos um novo método de aprendizagem online para ranqueamento que explora com eficiência o espaço de modelos de recomendação candidatos, restringindo-se ao complemento ortogonal do subespaço de direções de exploração anteriores de baixo desempenho. Além disso, para ajudar a superar os mínimos locais, propomos um componente de explotação ciente de sessão que aproveita de forma adaptativa o melhor modelo atual durante as atualizações do modelo. Nossa criteriosa avaliação usando sessões de escuta simuladas na plataforma Last.fm demonstra melhorias substanciais em relação às abordagens estado da arte no desempenho em estágio inicial e convergência geral de longo prazo.
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=od______3056::3ef64013ca94c02ece6e700866a4b2d6 Zobrazit plný text záznamu