Perbaikan Kinerja Clustering K-Means pada Data Ekonomi Nelayan dengan Perhitungan Sum of Square Error (SSE) dan Optimasi nilai K cluster

Autor: Melgusen Soyano Pesulima, Leonardo Petra Refialy, Hervin Maitimu
Rok vydání: 2021
Předmět:
Zdroj: Techno.Com, Vol 20, Iss 2, Pp 321-329 (2021)
ISSN: 2356-2579
DOI: 10.33633/tc.v20i2.4572
Popis: Clustering adalah jenismetode statistik yang dipakai untuk mengelompokan banyak data atau objek ke dalam beberapa kelompok (cluster), sehingga objek-objek yang berada dalam satu kelompok akan mempunyai kemiripan yang tinggi. Clustering K-Means merupakan metode pembentukan cluster berbasis data, dimana objek secara acak dalam cluster pertama yang terbentuk dijadikan sebagai titik tengah/titik pusat (centroid). K-means merupakan jenis cluster yang memiliki tingkat ketelitian dan efisiensi yang baik. Kelemahan dalam algoritma k-Means yaitu dalam menganalisa dan menentukan Nilai K dalam mengklaster data pada suatu dataset yang tidak optimal akan menghasilkan cluster yang buruk. Sum of Square Error (SSE) merupakan hasil penjumlahan dari seluruh jarak masing-masing data dengan titik pusat clusternya. Semakin kecil nilai SSE yang didapat, semakin seragam data yang ada didalam masing-masing cluster, semakin baik cluster yang dihasilkan. Penelitian ini melakukan analisis cluster dengan K-means untuk menghasilkan kelompok cluster serta perhitungan nilai Sum of Square Error untuk setiap data dengan nilai K yang berbeda. Proses perhitungan nilai K dalam mencari nilai SSE yang minimum sehingga dapat dilakukan perhitungan selisih nilai SSE dari setiap nilai K cluster. Hasil perhitungan selisih tersebut sebagai penentu jumlah K cluster yang optimal dengan tingkat akurasi yang lebih baik. Kata kunci: Clustering, K-Means, Sum of Square Error.
Databáze: OpenAIRE