Perbandingan Metode K-Means Clustering Dan Metode Ward Dalam Mengelompokkan Pelangan Mall

  • Tia Iklima Universitas Ahmad Dahlan
  • Ardi Pujiyanta Universitas Ahmad Dahlan
Keywords: K-Means, Ward, Silhouette Coefficient, Clustering

Abstract

Bagi setiap perusahaan pelanggan adalah aspek yang penting, apalagi dalam dunia bisnis. Karena pelanggan berperan penting dalam kemajuan perusahaan salah satunya Mall. Oleh karena itu perlu dilakukannya analisa lebih lanjut untuk menganalisis data pelanggan. Namun dalam menganalisa data pelanggan perlu menggunakan metode yang tepat dalam proses pengelompokan data pelanggan. Dalam penelitian ini dilakukan perbandingan dua metode yang berbeda, yaitu metode K-means dan metode Ward. Dataset yang digunakan dalam penelitian ini mengandung pola tingkah laku dari masing-masing pelanggan. Untuk menghitung jarak minimum dari setiap data dalam cluster digunakan Euclidean Distance. Data pelanggan yang digunakan yaitu data        pelanggan Mall, yang diambil dari data public pada platform  Kaggle.com, yang terdiri dari 5 variabel yaitu CustomerID, Gender, Age, Total Earning, dan Spending Score, dengan jumlah data dari masing-masing parameter ialah sebanyak  1000 data. Hasil penelitian menunjukkan bahwa metode K-means dan metode Ward dapat     diterapkan pada dataset yang digunakan. Hasil pengelompokkan didapatkan 4 kelompok pelanggan yang berbeda. Nilai akurasi pada masing-masing metode dilakukan pengujian dengan menggunakan metode Silhouette Coefficient. Hasil pengelompokkan data pelanggan dengan metode K-means untuk nilai s(i) sebesar 0.67. Sedangkan nilai s(i) sebesar 0.81 untuk metode Ward. Berdasarkan hasil penelitian, untuk mengetahui kelompok pelanggan berdasarkan tingkat kemiripan setiap objek, penggunaan metode Ward lebih baik dibandingkan dengan metode  KMeans dalam proses Clustering pada dataset pelanggan Mall.

Downloads

Download data is not yet available.

Author Biography

Ardi Pujiyanta, Universitas Ahmad Dahlan

S-1 Teknik Nuklir UGM

S-2 Teknik Informatika UGM

S-3 Teknik Informatika UGM

References

[1] P. Guru, “Pengertian Bisnis.” https://pendidikan.co.id/pengertian-bisnis/ (accessed Sep. 17, 2023).
[2] Wikipedia, “Pusat perbelanjaan - Wikipedia bahasa Indonesia, ensiklopedia bebas.” https://id.wikipedia.org/wiki/Pusat_perbelanjaan (accessed Sep. 17, 2023).
[3] Aska, “Klasifikasi Jenis Mall dan Pusat Perbelanjaan,” Arsitur Studio. https://www.arsitur.com/2017/12/klasifikasi-jenis-mall-dan-pusat.html (accessed Sep. 17, 2023).
[4] S. Paembonan and H. Abduh, “Penerapan Metode Silhouette Coefficient untuk Evaluasi Clustering Obat,” PENA Tek. J. Ilm. Ilmu-Ilmu Tek., vol. 6, no. 2, p. 48, 2021, doi: 10.51557/pt_jiit.v6i2.659.
[5] N. Putu, E. Merliana, and A. J. Santoso, “ANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING,” pp. 978–979, 2015.
[6] M. Paramadina, S. Sudarmin, and M. K. Aidid, “Perbandingan Analisis Cluster Metode Average Linkage dan Metode Ward (Kasus: IPM Provinsi Sulawesi Selatan),” VARIANSI J. Stat. Its Appl. Teach. Res., vol. 1, no. 2, p. 22, 2019, doi: 10.35580/variansiunm9357.
[7] N. Afdhaliah, “Perbandingan Kinerja Algoritma Ward Dan Algoritma K-Means Dengan Uji Silhouette Coefficient,” Universitas Hasanuddin, 2020.
[8] H. Gunawan and V. Purwayoga, “Data Mining Menggunakan Algoritma K-Means Clustering Untuk Mengetahui Potensi Penyebaran Virus Corona Di Kota Cirebon,” J. Sisfokom (Sistem Inf. dan Komputer), vol. 11, no. 1, pp. 1–8, 2022, doi: 10.32736/sisfokom.v11i1.1316.
[9] H. Hikmah, F. Fardinah, L. Qadrini, and E. Tande, “Analisis Klaster Pengelompokan Kecamatan di Sulawesi Barat Berdasarkan Indikator Pendidikan,” Saintifik, vol. 8, no. 2, pp. 188–196, 2022, doi: 10.31605/saintifik.v8i2.383.
[10] I. N. Hasanah and A. Sofro, “Analisis Cluster Berdasarkan Dampak Ekonomi Di Indonesia Akibat Pandemi Covid-19,” MATHunesa J. Ilm. Mat., vol. 10, no. 2, pp. 239–248, 2022, doi: 10.26740/mathunesa.v10n2.p239-248.
[11] R. D. Firdaus, T. G. Laksana, and R. D. Ramadhani, “Pengelompokan Data Persediaan Obat Menggunakan Perbandingan Metode K-Means Dengan Hierarchical Clustering Single LinkageFirdaus, Rahmatika Diana Laksana, Tri Ginanjar Ramadhani, Rima Dias,” J. Informatics, Inf. Syst. Softw. Eng. Appl., vol. 2, no. 1, pp. 33–48, 2019.
[12] N. K. Zuhal, “Study Comparison K-Means Clustering dengan Algoritma Hierarchical Clustering,” Pros. Semin. Nas. Teknol. dan Sains, vol. 1, pp. 200–205, 2022, [Online]. Available: https://jurnal.dharmawangsa.ac.id/index.php/djtechno/article/view/966/867.
[13] M. Benri, H. Metisen, and S. Latipa, “Analisis Clustering Menggunakan Metode K-Means Dalam Pengelompokkan Penjualan Produk Pada Swalayan Fadhila,” J. Media Infotama, vol. 11, no. 2, pp. 110–118, 2015, [Online]. Available: https://core.ac.uk/download/pdf/287160954.pdf.
[14] R. T. S. Muhammad Hariyanto, “Clustering pada Data Mining untuk Mengetahui Potensi Penyebaran Penyakit DBD Menggunakan Metode Algoritma K-Means dan Metode Perhitungan Jarak Euclidean Distance,” Sist. Komput. dan Tek. Inform., vol. 1, no. 1, pp. 117–122, 2018.
[15] P. S. Matematika, J. P. Matematika, F. Matematika, D. A. N. Ilmu, P. Alam, and U. N. Yogyakarta, “Analisis Cluster dengan Average Linkage Method dan Ward ’ s Method untuk Data Responden Nasabah Asuransi Jiwa Unit Link,” 2014.
[16] D. Jollyta, S. Efendi, M. Zarlis, and H. Mawengkang, “Optimasi Cluster Pada Data Stunting: Teknik Evaluasi Cluster Sum of Square Error dan Davies Bouldin Index,” Pros. Semin. Nas. Ris. Inf. Sci., vol. 1, no. September, p. 918, 2019, doi: 10.30645/senaris.v1i0.100.
[17] R. Maulana, D. Adi Putra Pratama, N. Nugraha, and A. Rahmasari, “Implementasi Algoritma Hierarchical Clustering untuk Klasterisasi Data Pelanggan Mall (Implementation of Hierarchical Clustering Algorithm for Mall Customer Data Clustering),” Gunung Djati Conf. Ser., vol. 3, pp. 0–4, 2021.
Published
2023-12-23
Abstract views: 121 , PDF downloads: 253