A Comparative Study of Autoencoder Approaches to the Data Sparsity Problem in Recommender Systems

Autor: BÖLÜK, Ecem, CİNGİZ, Mustafa Özgür
Jazyk: turečtina
Rok vydání: 2022
Předmět:
Zdroj: Volume: IDAP-2022 : International Artificial Intelligence and Data Processing Symposium, Issue: 177-184
Computer Science
Bilgisayar Bilimleri
ISSN: 2548-1304
Popis: Öneri sistemleri kullanıcıların geçmişteki tercihlerinden hareketle gelecekteki tercihlerini tahmin eden sistemlerdir. Fakat kullanıcılar her zaman tercihlerini sistemlere belirtmeyebilir. Bu durum, öneri sistemleri tasarlanırken karşılaşılan en büyük sorunlardan biri olan veri seyrekliğine neden olur. Derin öğrenme algoritmalarından otomatik kodlayıcılar, seyrek kullanıcı matrisini verilerden öğrendiği iç görülerden hareketle yeniden doldurarak veri seyrekliği probleminin çözülmesini sağlar. Bu çalışmada derin öğrenme algoritmalarından Temel Otomatik Kodlayıcı, Gürültü Giderici Otomatik Kodlayıcı, Seyrek Otomatik Kodlayıcı ve Varyasyonel Otomatik Kodlayıcı olmak üzere dört farklı otomatik kodlayıcı modeli kullanılarak veri seyrekliğine karşı performansları karşılaştırılmıştır. Veri seti olarak %93,6 oranında seyrek veri içeren MovieLens-100K veri seti kullanılmıştır. Otomatik kodlayıcı modelleri öğe tabanlı öneri sistemlerinde kullanıcı tabanlı öneri sistemlerine göre daha başarılı sonuçlar sağladığı gözlemlenmiştir. Öğe tabanlı öneri sistemlerde Temel Otomatik Kodlayıcı daha iyi performans sağlarken, kullanıcı tabanlı öneri sistemlerinde ise Temel Otomatik Kodlayıcı ve Seyrek Otomatik Kodlayıcı birbirlerine çok yakın bir performans sağladıkları gözlemlenmiştir.
Recommendation systems are systems that predict future preferences of users based on their past preferences. However, users may not always indicate their preferences to the systems. This causes data sparseness, which is one of the biggest problems when designing recommender systems. Autoencoders from deep learning algorithms solve the data sparsity problem by re-populating the sparse user matrix based on insights learned from the data. In this study, performances of deep learning algorithms were compared against data sparsity by using four different autoencoder models, namely Vanilla Autoencoder, Denoising Autoencoder, Sparse Autoencoder and Variational Autoencoder. The MovieLens-100K dataset, which contains 93.6% sparse data, was used as the data set. It has been observed that automatic encoder models provide more successful results in item-based recommendation systems than user based recommendation systems. It has been observed that Vanilla Autoencoder provides better performance in item-based recommendation systems, while Vanilla Autoencoder and Sparse Autoencoder provide very close performance in user-based recommendation systems.
Databáze: OpenAIRE