Analisis Prediksi Risiko Stroke Menggunakan Metode SGD
DOI:
https://doi.org/10.62712/juktisi.v4i3.786Keywords:
Stroke, Clinical Factors, Stochastic Gradient Descent, Risk Prediction,, Logistic RegressionAbstract
Stroke merupakan penyebab kematian dan kecacatan tertinggi di dunia dengan lebih dari 15 juta kasus setiap tahun. Deteksi dini risiko stroke sangat penting untuk menurunkan angka mortalitas melalui intervensi preventif yang tepat waktu. Penelitian ini bertujuan untuk menganalisis performa Stochastic Gradient Descent (SGD) Regresi Logistik dalam prediksi risiko stroke menggunakan dataset Prediksi Stroke v2 2024 yang terdiri dari 35.000 records dengan 17 fitur klinis. Dataset dibagi menjadi 80% data training (28.000 samples) dan 20% data testing (7.000 samples) dengan distribusi kelas seimbang. Optimasi hyperparameter SGD dilakukan menggunakan Grid Search dengan 216 kombinasi parameter dan 4-fold cross validation untuk mendapatkan konfigurasi optimal. Hasil penelitian menunjukkan bahwa SGD Regresi Logistik dengan hyperparameter tuning mencapai performa excellent dengan accuracy 97,59% dan ROC-AUC 0,9984, menunjukkan sensitivitas sangat tinggi dalam mendeteksi pasien berisiko dengan recall 98,53% pada kelas positif. Performa ini sebanding dengan Baseline Regresi Logistik yang mencapai accuracy 97,74% dengan ROC-AUC identik 0,9984, mengkonfirmasi efektivitas metode SGD untuk klasifikasi risiko stroke. Analisis feature importance mengidentifikasi Age (koefisien 4,868), High Blood Pressure (2,360), dan Chest Pain (1,977) sebagai prediktor terkuat. Model SGD menunjukkan false negative rate rendah hanya 1,47%, temuan ini mengkonfirmasi bahwa SGD regresi logistik dengan optimasi hyperparameter sistematis memberikan performa yang superior dalam sensitivitas deteksi pasien beresiko, menjadikannya sangat potensial untuk diimplementasikan sebagai screening tool awal risiko stroke dengan keunggulan scalability untuk dataset yang lebih besar dan kemampuan online learning untuk data streaming yang tidak dimiliki baseline model.
Downloads
References
V. L. Feigin and others, “Global burden of stroke and risk factors in 2021 and beyond,” Lancet Neurol., vol. 24, no. 2, pp. 123–134, 2025, doi: 10.1016/S1474-4422(24)00401-5.
A. Forrester and others, “Stress hyperglycemia and outcomes in acute stroke,” Stroke, vol. 51, no. 6, pp. 1831–1838, 2020, doi: 10.1161/STROKEAHA.119.028343.
A. Khosla and others, “Blood pressure variability and cerebrovascular damage,” Hypertension, vol. 76, no. 2, pp. 375–383, 2020, doi: 10.1161/HYPERTENSIONAHA.120.14821.
Y. Chen and others, “Clinical predictors of ischemic stroke in young adults,” Neurology, vol. 96, no. 15, pp. e1956--e1966, 2021, doi: 10.1212/WNL.0000000000011834.
E. Harshfield and others, “Obesity, vascular dysfunction, and stroke risk,” Circ. Res., vol. 128, no. 4, pp. 512–524, 2021, doi: 10.1161/CIRCRESAHA.120.317987.
C. S. Katsouras, X. M. Sakellariou, A. Bechlioulis, and L. Lakkas, “Current insights and challenges in the management of left ventricular thrombus,” no. xxxx, p. 2025, 2025.
M. R. Zemaitis, J. M. Boll, and M. A. Dreyer, “Peripheral Arterial Disease,” StatPearls [Internet], 2023, [Online]. Available: https://www.ncbi.nlm.nih.gov/books/NBK430745/
World Stroke Organization, World Stroke Report 2022. Geneva, Switzerland: World Stroke Organization, 2022. [Online]. Available: https://www.world-stroke.org
J. Chahine and others, “Limitations of traditional stroke risk prediction models,” J. Stroke Cerebrovasc. Dis., vol. 32, no. 4, 2023, doi: 10.1016/j.jstrokecerebrovasdis.2023.106996.
R. Dwiyansaputra, G. S. Nugraha, F. Bimantoro, and A. Aranta, “Deteksi Sms Spam Berbahasa Indonesia Menggunakan Tf-Idf Dan Stochastic Gradient Descent Classifier,” J. Teknol. Informasi, Komput. dan Apl., vol. 3, no. 2, pp. 200–207, 2021.
J. Klein, S. Bhulai, and R. Van Der Mei, “arXiv : 2301 . 03318v1 [ cs . LG ] 9 Jan 2023 The Optimal Input-Independent Baseline for Binary Classification : The Dutch Draw,” pp. 1–16.
Aulyra Familah, Arina Fathiyyah Arifin, Achmad Harun Muchsin, Mochammad Erwin Rachman, and Dahliah, “Karakteristik Penurunan Kebugaran Kardiorespirasi Pada Penderita Stroke Iskemik dan Stroke Hemoragik,” Fakumi Med. J. J. Mhs. Kedokt., vol. 4, no. 6, pp. 456–463, 2024.
World Health Organization, “Stroke: Key Facts,” Geneva, Switzerland, 2023. [Online]. Available: https://www.who.int/news-room/fact-sheets/detail/stroke
M. A. Tusher, “Stroke Risk Prediction Dataset V2,” 2022, Kaggle.
A. T. N. Hartono and H. D. Purnomo, “Pengembangan Stochastic Gradient Descent dengan Penambahan Variabel Tetap,” J. JTIK (Jurnal Teknol. Inf. dan Komunikasi), vol. 7, no. 3, pp. 359–367, 2023, doi: 10.35870/jtik.v7i3.840.
D. Dedy, “Klasifikasi Jenis Jamur Berdasarkan Citra Gambar Menggunakan Algoritma Stochastic Gradient Descent,” Data Sci. Indones., vol. 4, no. 2, pp. 1–9, 2024, doi: 10.47709/dsi.v4i2.5014.
J. -, S. Usman, and F. Aziz, “Analisis Perilaku Pelanggan menggunakan Metode Ensemble Logistic Regression,” J. Teknol. Dan Ilmu Komput. Prima, vol. 6, no. 2, pp. 90–97, 2023, doi: 10.34012/jutikomp.v6i2.4258.
T. Saito and M. Rehmsmeier, “The precision-recall plot is more informative than the ROC plot,” PLoS One, vol. 10, no. 3, 2015, doi: 10.1371/journal.pone.0118432.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Esthi Nurani Sri Handayani, Febriani Yolanda Tessalonika, Laudya Meitaneia Sianturi, Sischa Wahyuning Tyas, Anggriani Puspita Sari

This work is licensed under a Creative Commons Attribution 4.0 International License.
Esthi Nurani Sri Handayani















