Towards Comprehensive Cluster-induced Methods for Recommender Systems
Autor: | da Silva Alves, Rodrigo Augusto |
---|---|
Jazyk: | angličtina |
Rok vydání: | 2022 |
Předmět: | |
Popis: | Recommender systems recommend items (e.g., movies, products, books) to users. In this thesis, we proposed two comprehensive and cluster-induced recommendation-based methods: Orthogonal Inductive Matrix Completion (OMIC) and Burst-induced Multi-armed Bandit (BMAB). Given the presence of side information, the first method is categorized as context-aware. OMIC is the first matrix completion method to approach the problem of incorporating biases, side information terms and a pure low-rank term into a single flexible framework with a well-principled optimization procedure. The second method, BMAB, is context-free. That is, it does not require any side data about users or items. Unlike previous context-free multi-armed bandit approaches, our method considers the temporal dynamics of human communication on the web and treats the problem in a continuous time setting. We built our models' assumptions under solid theoretical foundations. For OMIC, we provided theoretical guarantees in the form of generalization bounds by considering the distribution-free case: no assumptions about the sampling distribution are made. Additionally, we conducted a theoretical analysis of community side information when the sampling distribution is known and an adjusted nuclear norm regularization is applied. We showed that our method requires just a few entries to accurately recover the ratings matrix if the structure of the ground truth closely matches the cluster side information. For BMAB, we provided regret guarantees under mild conditions that demonstrate how the system's stability affects the expected reward. Furthermore, we conducted extensive experiments to validate our proposed methodologies. In a controlled environment, we implemented synthetic data generation techniques capable of replicating the domains for which OMIC and BMAB were designed. As a result, we were able to analyze our algorithms' performance across a broad spectrum of ground truth regimes. Finally, we replicated a real-world scenario by utilizing well-established recommender datasets. After comparing our approaches to several baselines, we observe that they achieved state-of-the-art results in terms of accuracy. Apart from being highly accurate, these methods improve interpretability by describing and quantifying features of the datasets they characterize. Empfehlungssysteme empfehlen den Benutzern Artikel (z.B. Filme, Produkte, B��cher). In dieser Arbeit stellen wir zwei umfangreiche und cluster-induzierte empfehlungsbasierte Methoden vor: Orthogonal Inductive Matrix Completion (OMIC) und (Burst-induced Multi-armed Bandit). Angesichts der vorhandenen Nebeninformationen wird die erste Methode als kontextbewusst eingestuft. OMIC ist die erste Methode zur Matrixvervollst��ndigung, die das Problem der Einbeziehung von Verzerrungen, Nebeninformationen und einem rein niederrangigen Term in einem einzigem flexiblen Framework mit einem fundierten Optimierungsverfahren angeht. Die zweite Methodik, BMAB, ist kontextfrei. Das bedeutet, dass sie keine Nebendaten ��ber Nutzer oder Artikel ben��tigt.Im Gegensatz zu vorherigen kontextfreien Ans��tzen mit Multi-armed Bandits, ber��cksichtigt unsere Methode die temporale Dynamik menschlicher Kommunikation im Internet und behandelt das Problem in einem kontinuierlichen Zeitrahmen.Wir haben die Annahmen unserer Modelle auf eine solide theoretische Grundlage gestellt. Indem wir den verteilungsfreien Fall betrachtet haben, haben wir f��r OMIC theoretische Garantien in Form von Generalisierungsschranken aufgestellt. F��r den Fall in dem die Datenverteilung bekannt ist und eine angepasste Kernnormregularisierung angewendet wird, haben wir dar��ber hinaus eine theoretische Analyse der Gemeinschaftsseiteninformationen durchgef��hrt. Wir haben gezeigt, dass unsere Methode nur wenige Matrixeintr��ge ben��tigt, um die Bewertungsmatrix genau wiederherzustellen, wenn die Struktur der Grundwahrheit (ground truth) nahezu mit der Seiteninformation des Clusters ��bereinstimmt. F��r BMAB haben wir unter milden Bedingungen R��ckgewinnungsgarantien entwickelt, die zeigen, wie die Stabilit��t des Systems die erwartete Belohnung beeinflusst. Des Weiteren haben wir umfangreiche Experimente durchgef��hrt, um unsere vorgestellten Methoden zu validieren. In einer kontrollierten Umgebung haben wir Techniken zur Erzeugung synthetischer Daten implementiert, die in der Lage sind, die Dom��nen zu replizieren, f��r die OMIC und BMAB entwickelt wurden. Nach dem Vergleich unserer Ans��tze mit verschiedenen Basisverfahren stellen wir fest, dass sie in Bezug auf Genauigkeit die besten Ergebnisse erzielen und einen neuen Stand der Technik darstellen. Abgesehen von ihrer hohen Genauigkeit verbessern diese Methoden die Interpretierbarkeit durch eine Beschreibung und Quantifizierung von Merkmalen der charakterisierten Datens��tze. |
Databáze: | OpenAIRE |
Externí odkaz: |