Pendekatan Data Mining untuk Prediksi Risiko Diabetes Menggunakan K-Means Clustering

Authors

  • Fairuzza Qushai Simatupang Universitas Satya Terra Bhinneka
  • Gabriel Sthefanus Silalahi Universitas Satya Terra Bhinneka
  • Siska Ananda Universitas Satya Terra Bhinneka
  • Shera Br Sitepu Universitas Satya Terra Bhinneka

DOI:

https://doi.org/10.55606/juitik.v5i1.1329

Keywords:

Data-Mining, K-Means-Cluster, Diabetes-Risk, Clustering

Abstract

Diabetes Mellitus is a Chronic disease with a continuously increasing global prevalance, including in Indonesia, posing a serious challenge to healthcare systems. Early detection and risk stratification of individuals are crucial for implementing effective prevention and management strategies. This research utilizes the K-Means Clustering algorithm, an unsupervised learning method in data mining, to identify and group individuals based on their diabetes risk profiles from available medical data. The dataset used is the popular Pima Indian Indian Dataset, comprising eight clinical attributes such as glucose level, blood pressure, skin thickness, BMI, and age. The methodological process includes data preprocessing with standardization using StandardScaler, determining the optimal number of clusters through the Elbow Method, Implementing K-Means clustering, and evaluating clustering quality using the Silhouette Coefficient. The research results demonstrate that this algorithm can group patients into low, medium, and high-risk categories with sufficient cluster accuracy. This approach can be used as a supporting tool in medical decision systems.

References

Agustin, A. V., & Voutama, A. (2023). Implementasi data mining klasifikasi penyakit diabetes pada perempuan menggunakan Naïve Bayes. JATI (Jurnal Mahasiswa Teknik Informatika), 7(2), 1002–1007.

AldiYatna, K., Rahaningsih, N., & Dana, R. D. (2024). Penerapan data mining untuk clustering penyakit diare menggunakan algoritma K-Means (Studi kasus: Puskesmas Beber). JATI (Jurnal Mahasiswa Teknik Informatika), 8(3).

Basyir, M. K. (2025). Klastering penyakit diabetes dengan metode K-Means. Buletin Ilmiah Ilmu Komputer dan Multimedia (BIIKMA), 2(5), 904–909.

Gestavito, R., Hadiana, A. I., & Umbara, F. R. (2024). Pengelompokan tingkat risiko penyakit diabetes melitus menggunakan algoritma K-Means Clustering. JUMANJI, 8(1), 16–35.

Haryadi, D., & Atmaja, D. M. U. (2021). Penerapan algoritma K-Means clustering untuk pengelompokan tingkat risiko penyakit jantung. Journal of Informatics and Communications Technology (JICT), 3(2), 51–66.

International Diabetes Federation. (2021). IDF Diabetes Atlas (10th ed.).

Jain, A. K. (2010). Data clustering: 50 years beyond k-means. Pattern Recognition Letters, 31(8), 651–666.

Karyadiputra, E., & Setiawan, A. (2022). Penerapan data mining untuk prediksi awal kemungkinan terindikasi diabetes. Teknosains: Media Informasi Sains dan Teknologi, 16(2), 221–232.

Khalish, F., Piranti, N. M., & Martadireja, O. (2025). Implementasi data mining menggunakan teknik clustering dengan metode K-Means. JIIP (Jurnal Ilmiah Ilmu Pendidikan), 8(5), 5392–5397.

Krishna, V. B., Jaya, R. K., Bhuvaneswari, A. P., Gururaj, H. L., Ravi, V., Almeshari, M., & Alzamil, Y. (n.d.). A novel application of K-means cluster prediction model for diabetes early identification using dimensionality reduction techniques.

Marisa, F. (n.d.). EDUCATIONAL DATA MINING (Konsep dan penerapan). Jurnal Teknologi Informasi, 4(2), 90–97.

Masruriyah, A. F. N., Mardiah, M. D. A., & Malik, K. N. (2025). Pendekatan unsupervised learning dalam segmentasi kesehatan: Perbandingan K-Means dan DBSCAN. MIND (Multimedia Artificial Intelligent Networking Database) Journal, 10(1), 99–113.

Prasatya, A., Siregar, R. R. A., & Arianto, R. (2020). Penerapan metode K-Means dan C4.5 untuk prediksi penderita diabetes. PETIR: Jurnal Pengkajian dan Penerapan Teknik Informatika, 13(1), 1–9.

Putra, M. F. (2024). Implementasi algoritma K-Means clustering dan support vector machine untuk mengetahui faktor pemicu diabetes melitus di Puskesmas Lappae [Skripsi, Universitas Muhammadiyah Makassar].

Setiawan, E., & Prasetijo, A. B. (2020). Analysis K-Means clustering dalam klasterisasi pasien diabetes. Jurnal Teknologi Informasi dan Komputer, 7(2), 89–95.

Setyadji, A. E. S., Wibowo, A. P., Matthew D., I. G. N. A., Pratama, R. B., Masyhuda, T. A., Sinaga, Y. A. A., Purwanti, E., & Werdiningsih, I. (2023). Analisis klaster data pasien diabetes untuk identifikasi pola dan karakteristik pasien. Jurnal Teknologi dan Sistem Informasi Bisnis, 5(3), 172–182.

Subarja, R. E., & Hendrik, B. (2023). Evaluasi performa deteksi penyakit diabetes dengan Fuzzy C-Means dan K-Means clustering. Jurnal Elektronika dan Teknik Informatika Terapan (JENTIK), 1(3), 100–108.

UCI Machine Learning Repository. (n.d.). Pima Indians Diabetes Database. https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database

Downloads

Published

2025-06-30

How to Cite

Fairuzza Qushai Simatupang, Gabriel Sthefanus Silalahi, Siska Ananda, & Shera Br Sitepu. (2025). Pendekatan Data Mining untuk Prediksi Risiko Diabetes Menggunakan K-Means Clustering. Jurnal Ilmiah Teknik Informatika Dan Komunikasi, 5(1), 459–476. https://doi.org/10.55606/juitik.v5i1.1329

Similar Articles

<< < 4 5 6 7 8 9 10 11 12 13 > >> 

You may also start an advanced similarity search for this article.