Improving the prediction of page access by using semantically enhanced clustering

Rok vydání: 2014
Popis: Web kullanıcılarının navigasyon davranışını etkileyebilir birçok parametre mevcuttur. İnternet kullanıcıları tarafından ziyaret edilebilir potansiyel bir sonraki sayfanın tahmin edilebilirliği önemlidir, çünkü bu bilgiler, söz konusu kullanıcı için ön yükleme veya sayfanın kişiselleştirilebilmesi için kullanılabilir. Bir sonraki web sayfasının belirlenmesi için başarılı yöntemlerden biri de kümeleme ile kullanıcıların davranış modelleri inşa etmektir. Kümelenme başarısı, navigasyon dizileri arasında benzerlik hesaplamak için kullanılan benzerlik ölçüsü ile doğrudan ilişkilidir. Bu tez, içerik tabanlı anlamsal benzerlik yöntemi ile standart kümeleme yöntemini genişletmek suretiyle bir sonraki web sayfasını belirlemek için yeni bir yaklaşım önermektedir. Önerilen yöntemin başarısı da gerçek hayat web günlüğü verileriyle kanıtlanmıştır.Anahtar kelimeler – varlıkbilim, kavram küme benzerliği, oturum benzerliği, dizi hizalama. There are many parameters that may affect the navigation behaviour of web users. Prediction of the potential next page that may be visited by the web user is important, since this information can be used for prefetching or personalization of the page for that user. One of the successful methods for the determination of the next web page is to construct behaviour models of the users by clustering. The success of clustering is highly correlated with similarity measure that is used for calculating the similarity among navigation sequences. This thesis proposes a new approach for determining the next web page by extending the standard clustering method with the content-based semantic similarity method. The success of the proposed method has also been shown through real life web log data.Keywords – Ontology, concept set similarity, session similarity, sequence alignment. 87
