Optimasi Performa Model SVM dan Random Forest untuk Klasifikasi Kanker Payudara Menggunakan Penyetelan Hyperparameter

Adil Setiawan; Andri Armaginda Siregar; Nanda Setiawan; Jalaluddin Nasution; Naufal Dhiya Putra Dalimunthe; Farhan Sardy Abdillah

doi:10.62712/juktisi.v4i3.789

Authors

Adil Setiawan Universitas Potensi Utama
Andri Armaginda Siregar Universitas Potensi Utama
Nanda Setiawan Universitas Potensi Utama
Jalaluddin Nasution Universitas Potensi Utama
Naufal Dhiya Putra Dalimunthe Universitas Potensi Utama
Farhan Sardy Abdillah Universitas Potensi Utama

DOI:

https://doi.org/10.62712/juktisi.v4i3.789

Keywords:

Kanker payudara, Machine learning, Support Vector Machine, Random Forest, Hyperparameter tuning, Klasifikasi medis

Abstract

Kanker payudara merupakan salah satu penyakit dengan tingkat morbiditas dan mortalitas yang tinggi, sehingga deteksi dini dan diagnosis yang akurat menjadi faktor kunci dalam meningkatkan keberhasilan terapi. Perkembangan machine learning memberikan peluang besar dalam mendukung proses klasifikasi kanker payudara berbasis data medis. Penelitian ini bertujuan untuk mengevaluasi dan mengoptimalkan kinerja algoritma Support Vector Machine (SVM) dan Random Forest dalam klasifikasi kanker payudara melalui penerapan Hyperparameter tuning. Dataset yang digunakan adalah Breast Cancer Wisconsin (Diagnostic), yang terdiri dari 569 sampel hasil pemeriksaan Fine Needle Aspirate (FNA) dengan 30 fitur numerik serta dua kelas target, yaitu benign dan malignant. Metodologi penelitian meliputi tahap pra-pemrosesan data, pembagian data menggunakan stratified train–test split, pelatihan model baseline, optimasi Hyperparameter menggunakan GridSearchCV dengan 5-fold cross-validation, serta evaluasi performa model menggunakan metrik accuracy, precision, recall, F1-score, confusion matrix, dan ROC–AUC. Hasil eksperimen menunjukkan bahwa kedua model mampu mencapai performa klasifikasi yang tinggi dengan tingkat akurasi sekitar 97% pada data uji. Hyperparameter tuning memberikan peningkatan performa yang lebih konsisten pada model SVM, khususnya pada recall kelas malignant dan nilai AUC, sedangkan Random Forest menunjukkan performa yang relatif stabil sebelum dan sesudah optimasi. Temuan ini menegaskan bahwa Hyperparameter tuning berperan penting dalam validasi dan stabilitas model, meskipun tidak selalu menghasilkan peningkatan performa numerik yang signifikan pada dataset benchmark.

Downloads

Download data is not yet available.

References

I. Ahmad and F. Alqurashi, “Early cancer detection using deep learning and medical imaging: A survey,” Dec. 01, 2024, Elsevier Ireland Ltd. doi: 10.1016/j.critrevonc.2024.104528.

S. Rezaei et al., “Role of machine learning in molecular pathology for breast cancer: A review on gene expression profiling and RNA sequencing application,” Sep. 01, 2025, Elsevier Ireland Ltd. doi: 10.1016/j.critrevonc.2025.104780.

J. Cox, A. Bhatti, and A. Atapour-Abarghouei, “Using artificial intelligence in the analysis of CT scans of the axillary nodes in breast cancer: A systematic review,” European Journal of Radiology Artificial Intelligence, vol. 4, p. 100040, Dec. 2025, doi: 10.1016/j.ejrai.2025.100040.

Z. Mohamadi et al., “Implementation of artificial intelligence in detection, classification, and prognostication of osteosarcoma utilizing different assessment techniques: a systematic review,” Jan. 01, 2025, Elsevier B.V. doi: 10.1016/j.ibmed.2025.100250.

F. A. Altuhaifa, K. T. Win, and G. Su, “Predicting lung cancer survival based on clinical data using machine learning: A review,” Oct. 01, 2023, Elsevier Ltd. doi: 10.1016/j.compbiomed.2023.107338.

M. Sami and F. Sierra, “Using Machine Learning (ML) for Heat Transfer Coefficient (HTC) measurement in buildings: A systematic review,” Aug. 01, 2025, Elsevier Ltd. doi: 10.1016/j.buildenv.2025.113220.

E. Pashaei, E. Pashaei, and N. Aydin, “Gene selection using hybrid binary black hole algorithm and modified binary particle swarm optimization,” Genomics, vol. 111, no. 4, pp. 669–686, Jul. 2019, doi: 10.1016/j.ygeno.2018.04.004.

L. Caroprese, E. Vocaturo, and E. Zumpano, “Argumentation approaches for explanaible AI in medical informatics,” Intelligent Systems with Applications, vol. 16, Nov. 2022, doi: 10.1016/j.iswa.2022.200109.

E. Galli et al., “Circulating blood biomarkers for minimal residual disease in hepatocellular carcinoma: A systematic review,” Apr. 01, 2025, W.B. Saunders Ltd. doi: 10.1016/j.ctrv.2025.102908.

A. Procopio, G. Cesarelli, L. Donisi, A. Merola, F. Amato, and C. Cosentino, “Combined mechanistic modeling and machine-learning approaches in systems biology – A systematic literature review,” Oct. 01, 2023, Elsevier Ireland Ltd. doi: 10.1016/j.cmpb.2023.107681.

R. Miranda, C. Alves, A. Abelha, and J. Machado, “Data Platforms for Real-time Insights in Healthcare: Systematic Review,” in Procedia Computer Science, Elsevier B.V., 2023, pp. 826–831. doi: 10.1016/j.procs.2023.03.110.

N. Abbasi Dashtaki, M. CheshmehSohrabi, M. Pashootanizadeh, and H. Baradaran Kashani, “Retrieving and discovering new knowledge from documents’ abstracts in scientific databases: Proposing a query-based abstractive summarization model,” International Journal of Information Management Data Insights, vol. 5, no. 2, Dec. 2025, doi: 10.1016/j.jjimei.2025.100366.

W. You, Z. Yang, and G. Ji, “PLS-based gene subset augmentation and tumor-specific gene identification,” Comput. Biol. Med., vol. 174, May 2024, doi: 10.1016/j.compbiomed.2024.108434.

H. O. Al-Shamsi et al., “Cancer research in the United Arab Emirates from birth to present: A bibliometric analysis,” Heliyon, vol. 10, no. 6, Mar. 2024, doi: 10.1016/j.heliyon.2024.e27201.

Optimasi Performa Model SVM dan Random Forest untuk Klasifikasi Kanker Payudara Menggunakan Penyetelan Hyperparameter

Authors

DOI:

Keywords:

Abstract

Downloads

References

Downloads

Published

How to Cite

Issue

Section

License

Accredited

Indexing by

The Boards

Download Template

Visitors

ISSN Portal

Members of:

Recommended Tools

Current Issue