Cure, agnes ve k-means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması

Autor: Demiralay, Meral, Çamurcu, Ali Yılmaz
Přispěvatelé: TR5913, Bölüm Yok
Jazyk: turečtina
Rok vydání: 2005
Předmět:
Popis: Bu çalışmada, hiyerarşik kümeleme algoritmalarından CURE (Clustering Using REpresentatives) ve AGNES (AGglomerative NEsting) ile bölümleyici kümeleme algoritmalarından çok sık kullanılan kmeans’ in sentetik veri setlerinde uygulanmasıyla elde edilen sonuçların karşılaştırması açıklanmaktadır. Gerçekleştirilen uygulamalarda, k-means algoritmasının ayrık ve sıkışık bulutlar halindeki kümeleri başarıyla bulduğu görülmüştür. Bu algoritma benzer büyüklükteki küresel kümeleri bulabilirken, çok büyük kümeleri küresel de olsa parçalara ayırmaktadır. AGNES algoritması uygulamaları bu algoritmanın küresel kümeleri etkili bir şekilde bulduğunu, ancak sıradışı noktalara karşı çok duyarlı olduğunu göstermiştir. CURE algoritması uygulamalarında bu algoritmanın farklı büyüklüklerde ve farklı şekillerdeki kümeleri sıradışı noktalardan etkilenmeden başarıyla bulduğu görülmüştür. Ancak, CURE algoritmasıyla elde edilen kümelerin giriş parametrelerinin değerlerinden etkilendiği saptanmıştır. In this study, applications on the synthetic datasets using hierarchical clustering algorithms, CURE (Clustering Using REpresentatives) and AGNES (AGglomerative NEsting), and a partitioning based clustering algorithm, k-means are compared. This applied study shows that k-means algorithm can find discrete and condensed clusters successfully. According to the results of k-means applications, this algorithm can be used to find similar sized and spherical clusters, but, it divides the big clusters into smaller partitions even they are spherical. Applications on AGNES algorithm show that AGNES can find spherical clusters effectively, but, it is very sensitive to the outliers. Applied studies on CURE algorithm show that this algorithm can find different sized and different shaped clusters effectively. On CURE applications, it is found out that, clustering process is not affected from outliers but it is very sensitive to the value of the input parameters.
Databáze: OpenAIRE