Pengaruh Teknik Preprocessing terhadap Kinerja Model Explainable Boosting Machine (EBM) untuk Prediksi Serangan Jantung

Authors

  • Moch. Andri Setiawan Universitas Nusantara PGRI Kediri
  • Moh. Hasan Efendi Universitas Nusantara PGRI Kediri
  • Muhammad Farizal Akbar Universitas Nusantara PGRI Kediri
  • Wildan Septian Pratama Universitas Nusantara PGRI Kediri

DOI:

https://doi.org/10.29407/noe.v8i02.25811

Keywords:

Explainable Boosting Machine, ketidakseimbangan data, missing value, preprocessing, SMOTE-ENN

Abstract

Serangan jantung merupakan penyakit kardiovaskular yang sering terjadi secara tiba-tiba dan menjadi salah satu penyebab kematian tertinggi. Deteksi dini terhadap risiko serangan jantung masih menjadi tantangan karena keterbatasan sistem prediksi yang akurat dan mudah dipahami. Oleh karena itu, penelitian ini penting dilakukan untuk menghasilkan model prediksi yang tidak hanya akurat, tetapi juga interpretatif. Penelitian ini bertujuan mengembangkan model prediksi risiko serangan jantung berbasis machine learning menggunakan algoritma Explainable Boosting Machine (EBM). Proses dilakukan dengan pendekatan CRISP-DM serta optimasi pada tahap preprocessing, khususnya penanganan missing value melalui pemetaan data dan penanganan ketidakseimbangan data menggunakan metode SMOTE-ENN. Dataset yang digunakan berasal dari Kaggle, terdiri atas 158.355 baris dan 28 atribut yang mencerminkan faktor demografi, gaya hidup, lingkungan, serta kondisi klinis. Penelitian mencakup lima eksperimen berdasarkan variasi parameter SMOTE dan ENN. Hasil menunjukkan bahwa eksperimen SMOTEENN Sharp (SENS) menghasilkan akurasi tertinggi sebesar 74%, namun mengalami ketidakseimbangan klasifikasi pada kelas berisiko. Sementara itu, eksperimen SMOTEENN Aggressive (SENA) meningkatkan recall pada kelas berisiko, namun menurunkan akurasi menjadi 67%.Temuan ini menunjukkan bahwa strategi penanganan data yang optimal pada tahap preprocessing sangat berpengaruh terhadap kemampuan model dalam mengenali risiko serangan jantung secara lebih akurat dan seimbang.

Abstract views: 1 , PDF downloads: 0

References

Alahmadi, R., Almujibah, H., Alotaibi, S., Elshekh, A. E. A., Alsharif, M., & Bakri, M. (2023). Explainable Boosting Machine: A Contemporary Glass-Box Model to Analyze Work Zone-Related Road Traffic Crashes. Safety, 9(4), 1–15. https://doi.org/10.3390/safety9040083

Apollo, R. S. (2025). Infark miokard - Penyebab, Gejala, Diagnosis, Pengobatan, dan Pencegahan. Apollo Hospitals.

Arslan, A. K., Yagin, F. H., Algarni, A., AL-Hashem, F., & Ardigò, L. P. (2024). Combining the Strengths of the Explainable Boosting Machine and Metabolomics Approaches for Biomarker Discovery in Acute Myocardial Infarction. Diagnostics, 14(13). https://doi.org/10.3390/diagnostics14131353

Aziz, A. R., Warsito, B., & Prahutama, A. (2021). Pengaruh Transformasi Data Pada Metode Learning Vector Quantization Terhadap Akurasi Klasifikasi Diagnosis Penyakit Jantung. Jurnal Gaussian, 10(1), 21–30. https://doi.org/10.14710/j.gauss.v10i1.30933

Azizah, N. (2023). Kemenkes: Penyakit Kardiovaskular Jadi Penyebab Kematian Terbanyak di Indonesia. Republika.Co.Id. https://news.republika.co.id/berita/s1jq78463/kemenkes-penyakit-kardiovaskular-jadi-penyebab-kematian-terbanyak-di-indonesia

Bunte, A., Li, P., & Niggemann, O. (2018). Mapping data sets to concepts using machine learning and a knowledge based approach. ICAART 2018 - Proceedings of the 10th International Conference on Agents and Artificial Intelligence, 2(Icaart), 430–437. https://doi.org/10.5220/0006590204300437

Hasibuan, E., Informasi, S., Ilmu, F., Informasi, T., Gunadarma, U., Margonda, J., No, R., Cina, P., & Jawa, D. (2022). Implementasi Machine Learning untuk Prediksi Harga Mobil Bekas dengan Algoritma Regresi Linear berbasis Web. Jurnal Ilmiah Komputasi, 21(4), 595–602. https://doi.org/10.32409/jikstik.21.4.3327

Kementrian Kesehatan Republik Indonesia. (2022). Penyakit Jantung Penyebab Utama Kematian, Kemenkes Perkuat Layanan Primer. Public. https://sehatnegeriku.kemkes.go.id/baca/rilis-media/20220929/0541166/penyakit-jantung-penyebab-utama-kematian-kemenkes-perkuat-layanan-primer/

Lemaitre, G. (2021). 8. Common pitfalls and recommended practices. Imbalanced-Learn.Org.

https://imbalanced-learn.org/stable/common_pitfalls.html

Pamungkas, B. P., Vikri, M. J., & Aristia, I. (2025). Application of SMOTE-ENN Method in Data Balancing for Classification of Diabetes Health Indicators with C4 . 5 Algorithm. 14, 183–188.

Putri, R. W., Ristyawan, A., & Muzaki, M. N. (2022). Comparison Performance of K-NN and NBC Algorithm for Classification of Heart Disease. JTECS : Jurnal Sistem Telekomunikasi Elektronika Sistem Kontrol Power Sistem Dan Komputer, 2(2), 143. https://doi.org/10.32503/jtecs.v2i2.2708

Ristyawan, A., Nugroho, A., & Amarya, T. K. (2025). Optimasi Preprocessing Model Random Forest Untuk Prediksi Stroke. 12(1).

Roihan, A., Sunarya, P. A., & Rafika, A. S. (2020). Pemanfaatan Machine Learning dalam Berbagai Bidang: Review paper. IJCIT (Indonesian Journal on Computer and Information Technology), 5(1), 75–82. https://doi.org/10.31294/ijcit.v5i1.7951

Saputro, M. R., Mahdiyah, U., Swanjaya, D., Nusantara, U., & Kediri, P. (2024). Perbandingan Metode Adaptive Boosting dan Extreme Gradient Boosting Untuk Prediksi Hasil Pertandingan Liga Spanyol. Jurnal Nusantara Of Engineering, 7(1), 67–73. https://ojs.unpkediri.ac.id/index.php/noe

Siambaton, M. Z., & Husein, A. M. (2022). Menganalisis Data Kesehatan Global : Pendekatan Analisis Data Eksplorasi Visual. Data Sciences Indonesia (DSI), 1(2), 41–49. https://doi.org/10.47709/dsi.v1i2.1315

Thygesen, K., Alpert, J. S., Jaffe, A. S., Chaitman, B. R., Bax, J. J., Morrow, D. A., White, H. D., Corbett, S., Chettibi, M., Hayrapetyan, H., Roithinger, F. X., Aliyev, F., Sujayeva, V., Claeys, M. J., Smajić, E., Kala, P., Iversen, K. K., Hefny, E. El, Marandi, T., … Parkhomenko, A. (2018). Fourth Universal Definition of Myocardial Infarction (2018). In Circulation (Vol. 138, Issue 20). https://doi.org/10.1161/CIR.0000000000000617

Downloads

PlumX Metrics

Published

2025-10-11

How to Cite

Pengaruh Teknik Preprocessing terhadap Kinerja Model Explainable Boosting Machine (EBM) untuk Prediksi Serangan Jantung. (2025). Nusantara of Engineering (NOE), 8(02), 317-326. https://doi.org/10.29407/noe.v8i02.25811

Similar Articles

61-70 of 86

You may also start an advanced similarity search for this article.