Pengelompokan Terbaik Menggunakan Algoritma K-Means Pada Dataset Bus Biskita Bogor

Authors

  • Anjar Permadi STMIK IKMI Cirebon
  • Yudhistira Arie Wiyaja STMIK IKMI Cirebon

Keywords:

Data Mining, Clustering, DBI, K-Means

Abstract

Data mining merupakan proses penemuan informasi dengan mengidentifikasi pola dari dataset. Proses penemuan informasi tersebut dapat dilakukan dengan  metode pengelompokan data ke dalam beberapa kelompok dari sebuah dataset yang dalam data mining disebut metode clustering. Clustering merupakan proses mempartisi dataset menjadi beberapa subset atau kelompok berdasarkan kesamaan karakteristik masing-masing data pada kelompok yang ada. Metode Clustering yang digunakan dalam penelitian ini adalah K-Means yang termasuk ke dalam golongan algoritma Partition Clustering. Metode ini juga sudah banyak digunakan dalam penyelesaian masalah terkait klasterisasi pejualan, kebakaran hutan, pertanian, transportasi, dan sebagainya. Pada penelitian digunakan algoritma k-means untuk mengelompokkan dataset bus Bisikita Bogor berdasarkan data yang diambil selama tahun 2022. Dalam melakukan proses mengubah dataset mentah menjadi suatu informasi yang bermanfaat, maka digunakan proses Knowledge Discovery in Database (KDD). Pada tahap awal akan dilakukan pembersihan data, selanjutnya dilakukan seleksi data, transformasi data, dan data mining dengan menggunakan perangkat lunak Rapidminer. Hasil pemodelan dievaluasi menggunakan instrumen Davies Bouldin Index (DBI). Berdasarkan penelitian yang telah dilakukan, dapat diketahui bahwa algoritma K-Means dapat digunakan untuk mengelompokan dataset bus biskita. Yang nantinya bisa dimanfaatkan oleh perusahaan sebagai gambaran, penelitian juga ini bisa digunakan sebagai masukan bagi perusahaan/penyedia jasa.

References

M. Krishnamoorthy and R. Karthikeyan, “Pattern mining algorithms for data streams using itemset,” Meas. Sensors, vol. 24, no. June, p. 100421, 2022, doi: 10.1016/j.measen.2022.100421.

D. P. Utomo and M. Mesran, “Analisis Komparasi Metode Klasifikasi Data Mining dan Reduksi Atribut Pada Data Set Penyakit Jantung,” J. Media Inform. Budidarma, vol. 4, no. 2, p. 437, 2020, doi: 10.30865/mib.v4i2.2080.

Y. P. Sari, A. Primajaya, and A. S. Y. Irawan, “Implementasi Algoritma K-Means untuk Clustering Penyebaran Tuberkulosis di Kabupaten Karawang,” INOVTEK Polbeng - Seri Inform., vol. 5, no. 2, p. 229, 2020, doi: 10.35314/isi.v5i2.1457.

V. Herlinda and D. Darwis, “Analisis Clustering Untuk Recredesialing Fasilitas Kesehatan Menggunakan Metode Fuzzy C-Means,” Darwis, Dartono, vol. 2, no. 2, pp. 94–99, 2021, [Online]. Available: http://jim.teknokrat.ac.id/index.php/JTSI

A. Wibowo, Moh Makruf, Inge Virdyna, and Farah Chikita Venna, “Penentuan Klaster Koridor TransJakarta dengan Metode Majority Voting pada Algoritma Data Mining,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 3, pp. 565–575, 2021, doi: 10.29207/resti.v5i3.3041.

J. Hutagalung and F. Sonata, “Penerapan Metode K-Means Untuk Menganalisis Minat Nasabah,” J. Media Inform. Budidarma, vol. 5, no. 3, p. 1187, 2021, doi: 10.30865/mib.v5i3.3113.

A. Aditya, I. Jovian, and B. N. Sari, “Implementasi K-Means Clustering Ujian Nasional Sekolah Menengah Pertama di Indonesia Tahun 2018/2019,” J. Media Inform. Budidarma, vol. 4, no. 1, p. 51, 2020, doi: 10.30865/mib.v4i1.1784.

K. Shao, G. Mei, and Y. Wu, “Investigating changes in global distribution of Ozone in 2018 using k -means clustering algorithm,” J. Comput. Math. Data Sci., vol. 3, no. March, p. 100028, 2022, doi: 10.1016/j.jcmds.2022.100028.

W. Liu, P. Zou, D. Jiang, X. Quan, and H. Dai, “Zoning of reservoir water temperature field based on K-means clustering algorithm,” J. Hydrol. Reg. Stud., vol. 44, no. June, p. 101239, 2022, doi: 10.1016/j.ejrh.2022.101239.

H. Priyatman, F. Sajid, and D. Haldivany, “Klasterisasi Menggunakan Algoritma K-Means Clustering untuk Memprediksi Waktu Kelulusan Mahasiswa,” J. Edukasi dan Penelit. Inform., vol. 5, no. 1, p. 62, 2019, doi: 10.26418/jp.v5i1.29611.

I. R. Mahartika and A. Wibowo, “Data Mining Klasterisasi dengan Algoritme K-Means untuk Pengelompokkan Provinsi Berdasarkan Konsumsi Bahan Bakar Minyak Nasional,” Pros. Semin. Nas. SISFOTEK (Sistem Inf. dan Teknol., vol. 3, no. 1, pp. 87–91, 2019, [Online]. Available: https://seminar.iaii.or.id/index.php/SISFOTEK/article/view/108

E. Muningsih, I. Maryani, and V. R. Handayani, “Penerapan Metode K-Means dan Optimasi Jumlah Cluster dengan Index Davies Bouldin untuk Clustering Propinsi Berdasarkan Potensi Desa,” J. Sains dan Manaj., vol. 9, no. 1, pp. 95–100, 2021, [Online]. Available: https://ejournal.bsi.ac.id/ejurnal/index.php/evolusi/article/view/10428/4839

S. I. Murpratiwi, I. G. Agung Indrawan, and A. Aranta, “Analisis Pemilihan Cluster Optimal Dalam Segmentasi Pelanggan Toko Retail,” J. Pendidik. Teknol. dan Kejuru., vol. 18, no. 2, p. 152, 2021, doi: 10.23887/jptk-undiksha.v18i2.37426.

N. . Anggraeni, “Teknik Clustering Dengan Algoritma K-Medoids Untuk Menangani Strategi Promosi Di Politeknik Tedc Bandung,” J. Teknol. Inf. dan Pendidik., 2019.

S. Widaningsih, “Perbandingan Metode Data Mining Untuk Prediksi Nilai Dan Waktu Kelulusan Mahasiswa Prodi Teknik Informatika Dengan Algoritma C4,5, Naïve Bayes, Knn Dan Svm,” J. Tekno Insentif, vol. 13, no. 1, pp. 16–25, 2019, doi: 10.36787/jti.v13i1.78.

Downloads

Published

2023-07-31

How to Cite

Permadi, A., & Wiyaja, Y. A. . (2023). Pengelompokan Terbaik Menggunakan Algoritma K-Means Pada Dataset Bus Biskita Bogor. INTERNAL (Information System Journal), 6(1), 88–100. Retrieved from https://jurnal.masoemuniversity.ac.id/index.php/internal/article/view/689

Issue

Section

Articles