OPTIMASI PERFORMA CLUSTER K-MEANS MENGGUNAKAN SUM OF SQUARED ERROR (SSE)

  • Rena Nainggolan Universitas Methodist Indonesia
  • Gortap Lumbantoruan Universitas Methodist Indonesia

Abstract

K-Means merupakan suatu algoritma pengklasteran yang cukup sederhana yang mempunyai kemampuan mengelempokkan data dalam jumlah yang cukup besar, mempartisi dataset kedalam beberapa klaster k. Algoritmanya cukup mudah untuk diimplementasikan dan dijalankan, relative cepat, dan efisien. Disi lain K-Means masih memiliki beberapa kelemahan, yaitu dalam menentukan jumlah cluster. Hasil cluster yang terbentuk dari metode K-means ini sangatlah tergantung pada inisiasi nilai pusat awal cluster yang diberikan. Hal ini menyebabkan hasil clusternya berupa solusi yang sifatnya local optimal. Pada penelitian ini dilakukan untuk mengatasi kelemahan yang ada pada algoritma K-Means yaitu: perbaikan pada algoritma K-Means menghasilkan cluster yang lebih baik yaitu penerapan Sum Of Squared Error (SSE) untuk membatu K-Means Clustering dalam menetukan jumlah cluster yang paling optimum, dari proses modifikasi ini, diharapkan pusat cluster yang diperoleh nantinya akan menghasilkan cluster-cluster, dimana antar anggota cluster memiliki tingkat kemiripan yang tinggi. Perbaikan performa cluster K-Means akan diterapkan pada penentuan pusat cluster.

Published
2018-10-17