Pengaruh Teknik Preprocessing terhadap Kinerja Model Explainable Boosting Machine (EBM) untuk Prediksi Serangan Jantung
DOI:
https://doi.org/10.29407/noe.v8i02.25811Keywords:
Explainable Boosting Machine, ketidakseimbangan data, missing value, preprocessing, SMOTE-ENNAbstract
Serangan jantung merupakan penyakit kardiovaskular yang sering terjadi secara tiba-tiba dan menjadi salah satu penyebab kematian tertinggi. Deteksi dini terhadap risiko serangan jantung masih menjadi tantangan karena keterbatasan sistem prediksi yang akurat dan mudah dipahami. Oleh karena itu, penelitian ini penting dilakukan untuk menghasilkan model prediksi yang tidak hanya akurat, tetapi juga interpretatif. Penelitian ini bertujuan mengembangkan model prediksi risiko serangan jantung berbasis machine learning menggunakan algoritma Explainable Boosting Machine (EBM). Proses dilakukan dengan pendekatan CRISP-DM serta optimasi pada tahap preprocessing, khususnya penanganan missing value melalui pemetaan data dan penanganan ketidakseimbangan data menggunakan metode SMOTE-ENN. Dataset yang digunakan berasal dari Kaggle, terdiri atas 158.355 baris dan 28 atribut yang mencerminkan faktor demografi, gaya hidup, lingkungan, serta kondisi klinis. Penelitian mencakup lima eksperimen berdasarkan variasi parameter SMOTE dan ENN. Hasil menunjukkan bahwa eksperimen SMOTEENN Sharp (SENS) menghasilkan akurasi tertinggi sebesar 74%, namun mengalami ketidakseimbangan klasifikasi pada kelas berisiko. Sementara itu, eksperimen SMOTEENN Aggressive (SENA) meningkatkan recall pada kelas berisiko, namun menurunkan akurasi menjadi 67%.Temuan ini menunjukkan bahwa strategi penanganan data yang optimal pada tahap preprocessing sangat berpengaruh terhadap kemampuan model dalam mengenali risiko serangan jantung secara lebih akurat dan seimbang.
References
Alahmadi, R., Almujibah, H., Alotaibi, S., Elshekh, A. E. A., Alsharif, M., & Bakri, M. (2023). Explainable Boosting Machine: A Contemporary Glass-Box Model to Analyze Work Zone-Related Road Traffic Crashes. Safety, 9(4), 1–15. https://doi.org/10.3390/safety9040083
Apollo, R. S. (2025). Infark miokard - Penyebab, Gejala, Diagnosis, Pengobatan, dan Pencegahan. Apollo Hospitals.
Arslan, A. K., Yagin, F. H., Algarni, A., AL-Hashem, F., & Ardigò, L. P. (2024). Combining the Strengths of the Explainable Boosting Machine and Metabolomics Approaches for Biomarker Discovery in Acute Myocardial Infarction. Diagnostics, 14(13). https://doi.org/10.3390/diagnostics14131353
Aziz, A. R., Warsito, B., & Prahutama, A. (2021). Pengaruh Transformasi Data Pada Metode Learning Vector Quantization Terhadap Akurasi Klasifikasi Diagnosis Penyakit Jantung. Jurnal Gaussian, 10(1), 21–30. https://doi.org/10.14710/j.gauss.v10i1.30933
Azizah, N. (2023). Kemenkes: Penyakit Kardiovaskular Jadi Penyebab Kematian Terbanyak di Indonesia. Republika.Co.Id. https://news.republika.co.id/berita/s1jq78463/kemenkes-penyakit-kardiovaskular-jadi-penyebab-kematian-terbanyak-di-indonesia
Bunte, A., Li, P., & Niggemann, O. (2018). Mapping data sets to concepts using machine learning and a knowledge based approach. ICAART 2018 - Proceedings of the 10th International Conference on Agents and Artificial Intelligence, 2(Icaart), 430–437. https://doi.org/10.5220/0006590204300437
Hasibuan, E., Informasi, S., Ilmu, F., Informasi, T., Gunadarma, U., Margonda, J., No, R., Cina, P., & Jawa, D. (2022). Implementasi Machine Learning untuk Prediksi Harga Mobil Bekas dengan Algoritma Regresi Linear berbasis Web. Jurnal Ilmiah Komputasi, 21(4), 595–602. https://doi.org/10.32409/jikstik.21.4.3327
Kementrian Kesehatan Republik Indonesia. (2022). Penyakit Jantung Penyebab Utama Kematian, Kemenkes Perkuat Layanan Primer. Public. https://sehatnegeriku.kemkes.go.id/baca/rilis-media/20220929/0541166/penyakit-jantung-penyebab-utama-kematian-kemenkes-perkuat-layanan-primer/
Lemaitre, G. (2021). 8. Common pitfalls and recommended practices. Imbalanced-Learn.Org.
https://imbalanced-learn.org/stable/common_pitfalls.html
Pamungkas, B. P., Vikri, M. J., & Aristia, I. (2025). Application of SMOTE-ENN Method in Data Balancing for Classification of Diabetes Health Indicators with C4 . 5 Algorithm. 14, 183–188.
Putri, R. W., Ristyawan, A., & Muzaki, M. N. (2022). Comparison Performance of K-NN and NBC Algorithm for Classification of Heart Disease. JTECS : Jurnal Sistem Telekomunikasi Elektronika Sistem Kontrol Power Sistem Dan Komputer, 2(2), 143. https://doi.org/10.32503/jtecs.v2i2.2708
Ristyawan, A., Nugroho, A., & Amarya, T. K. (2025). Optimasi Preprocessing Model Random Forest Untuk Prediksi Stroke. 12(1).
Roihan, A., Sunarya, P. A., & Rafika, A. S. (2020). Pemanfaatan Machine Learning dalam Berbagai Bidang: Review paper. IJCIT (Indonesian Journal on Computer and Information Technology), 5(1), 75–82. https://doi.org/10.31294/ijcit.v5i1.7951
Saputro, M. R., Mahdiyah, U., Swanjaya, D., Nusantara, U., & Kediri, P. (2024). Perbandingan Metode Adaptive Boosting dan Extreme Gradient Boosting Untuk Prediksi Hasil Pertandingan Liga Spanyol. Jurnal Nusantara Of Engineering, 7(1), 67–73. https://ojs.unpkediri.ac.id/index.php/noe
Siambaton, M. Z., & Husein, A. M. (2022). Menganalisis Data Kesehatan Global : Pendekatan Analisis Data Eksplorasi Visual. Data Sciences Indonesia (DSI), 1(2), 41–49. https://doi.org/10.47709/dsi.v1i2.1315
Thygesen, K., Alpert, J. S., Jaffe, A. S., Chaitman, B. R., Bax, J. J., Morrow, D. A., White, H. D., Corbett, S., Chettibi, M., Hayrapetyan, H., Roithinger, F. X., Aliyev, F., Sujayeva, V., Claeys, M. J., Smajić, E., Kala, P., Iversen, K. K., Hefny, E. El, Marandi, T., … Parkhomenko, A. (2018). Fourth Universal Definition of Myocardial Infarction (2018). In Circulation (Vol. 138, Issue 20). https://doi.org/10.1161/CIR.0000000000000617
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Moch. Andri Setiawan, Moh. Hasan Efendi, Muhammad Farizal Akbar, Wildan Septian Pratama

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Authors who publish with this journal agree to the following terms:
- Copyright on any article is retained by the author(s).
- The author grants the journal, right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgment of the work’s authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal’s published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work.
- The article and any associated published material is distributed under the Creative Commons Attribution-ShareAlike 4.0 International License