Analisis Sentimen dan Pemodelan Topik pada Post tentang Merek Teknologi di X Menggunakan Fine-tuning IndoBERT dan BERTopic
DOI:
https://doi.org/10.62712/juktisi.v4i2.508Kata Kunci:
Media Sosial X, Analisis Sentimen, Pemodelan Topik, IndoBERT, BERTopicAbstrak
Media sosial telah menjadi wadah bagi konsumen untuk menyampaikan persepsi dan opini. Opini yang beredar tersebut berpotensi menjadi sumber data yang berharga bagi brand, termasuk Xiaomi, dalam memahami persepsi publik terhadap produk mereka. Penelitian ini bertujuan untuk menganalisis sentimen dan mengidentifikasi topik diskusi pada unggahan (post) mengenai merek teknologi Xiaomi di platform X (sebelumnya Twitter) dengan pendekatan berbasis Transformer. Dua metode utama yang digunakan adalah fine-tuning IndoBERT untuk model klasifikasi sentimen dan BERTopic untuk pemodelan topik. Data yang berhasil dikumpulkan sebanyak 10.130 post dari bulan Mei 2023 hingga Mei 2025 yang dilanjutkan menuju tahapan praproses serta pelabelan. Model klasifikasi dilatih dengan berbagai kombinasi konfigurasi hyperparameter, dengan hasil pengujian terbaik menghasilkan nilai accuracy 79,8%, precision 73,0%, recall 67,7%, dan f1-score (macro) sebesar 0,699. Distribusi sentimen dalam data menunjukkan dominasi sentimen netral, sedangkan BERTopic berhasil menghasilkan 16 cluster topik dengan rata-rata nilai coherence (C_v) sebesar 0,5437. Topik paling dominan dengan jumlah anggota cluster terbanyak membahas mengenai produk Xiaomi Series dan Poco. Sementara itu, topik dengan persentase sentimen negatif tertinggi berkaitan dengan layanan service center dan sentimen positif tertinggi mengenai produk komputer tablet (tab) Xiaomi. Penggabungan hasil analisis sentimen dan topik memberikan pemahaman yang lebih mendalam terhadap isu yang dibicarakan serta persepsi konsumen. Penelitian ini membuktikan bahwa kombinasi IndoBERT dan BERTopic efektif dalam menganalisis opini konsumen di media sosial serta memberikan wawasan strategis yang relevan bagi perusahaan untuk mengidentifikasi kekuatan dan potensi peningkatan yang dapat dilakukan.
Unduhan
Referensi
F. W. Umbara, “User Generated Content di Media Sosial Sebagai Strategi Promosi Bisnis,” J. Manaj. Strateg. dan Apl. Bisnis, vol. 4, no. 2, hal. 572–581, 2021, [Daring]. Tersedia pada: http://ejournal.imperiuminstitute.org/index.php/JMSAB/article/view/366.
A. Zaini, R. Patrajaya, W. Noor, dan M. Iksannudin, “Optimalisasi Penggunaan Media Sosial dalam Meningkatkan Efektivitas dan Aksesibilitas Penyebaran Informasi di KUA Kecamatan Jekan Raya,” J. Ilm. Pengabdi. Kpd. Masy., vol. 4, no. 2, hal. 86–95, 2024, [Daring]. Tersedia pada: https://ejournal.iain-manado.ac.id/index.php/nyiur/article/view/1165.
J. Zhao, H. He, X. Zhao, dan J. Lin, “Modeling and simulation of microblog-based public health emergency-associated public opinion communication,” Inf. Process. Manag., vol. 59, no. 2, hal. 102846, 2022, [Daring]. Tersedia pada: https://www.sciencedirect.com/science/article/pii/S0306457321003186.
N. Kusumawati, A. T. Suhandi, dan M. S. Purwanegara, “Why do customers decide to complain on social media? And how to produce customer forgiveness,” Rev. Integr. Bus. Econ. Res., vol. 13, no. 3, hal. 235–254, 2024, [Daring]. Tersedia pada: http://gmp-riber.com/uploads/3/4/9/8/34980536/riber_13-3_17_s23-084_235-254.pdf.
A. Giachanou dan F. Crestani, “Opinion retrieval in Twitter using stylistic variations,” in Proceedings of the 31st Annual ACM Symposium on Applied Computing, 2016, hal. 1077–1079, [Daring]. Tersedia pada: https://dl.acm.org/doi/abs/10.1145/2851613.2851922.
J. Qi, Z. Zhang, S. Jeon, dan Y. Zhou, “Mining customer requirements from online reviews: A product improvement perspective,” Inf. Manag., vol. 53, no. 8, hal. 951–963, 2016, [Daring]. Tersedia pada: https://www.sciencedirect.com/science/article/pii/S0378720616300581.
M. Arsanti dan L. N. Setiana, “Pudarnya Pesona Bahasa Indonesia di Media Sosial (Sebuah Kajian Sosiolinguistik Penggunaan Bahasa Indonesia),” Ling. Fr. J. Bahasa, Sastra, dan Pengajarannya, vol. 4, no. 1, hal. 1–12, 2020, [Daring]. Tersedia pada: https://journal.um-surabaya.ac.id/lingua/article/view/4314.
D. Sulistyo, F. Ahda, dan V. A. Fitria, “Epistomologi dalam Natural Language Processing,” J. Inov. Teknol. dan Edukasi Tek., vol. 1, no. 9, hal. 652–664, 2021, doi: 10.17977/um068v1i92021p652-664.
M. F. Çeliktuğ, “Twitter sentiment analysis, 3-way classification: positive, negative or neutral?,” in 2018 IEEE international conference on big data (big data), 2018, hal. 2098–2103, [Daring]. Tersedia pada: https://ieeexplore.ieee.org/abstract/document/8621970.
K. P. Gunasekaran, “Exploring sentiment analysis techniques in natural language processing: A comprehensive review,” arXiv Prepr. arXiv2305.14842, 2023, [Daring]. Tersedia pada: https://arxiv.org/abs/2305.14842.
B. V. Barde dan A. M. Bainwad, “An overview of topic modeling methods and tools,” in 2017 International Conference on Intelligent Computing and Control Systems (ICICCS), 2017, hal. 745–750, [Daring]. Tersedia pada: https://ieeexplore.ieee.org/abstract/document/8250563/.
R. A. Wayasti dan I. Surjandari, “Mining Customer Opinion for Topic Modeling Purpose: Case Study of Ride-Hailing Service Provider,” in 2018 6th International Conference on Information and Communication Technology (ICoICT), 2018, hal. 305–309, [Daring]. Tersedia pada: https://ieeexplore.ieee.org/abstract/document/8528751.
A. Vaswani et al., “Attention is all you need,” Adv. Neural Inf. Process. Syst., vol. 30, 2017, [Daring]. Tersedia pada: https://proceedings.neurips.cc/paper/2017/hash/3f5ee243547dee91fbd053c1c4a845aa-Abstract.html.
J. Devlin, M. W. Chang, K. Lee, dan K. Toutanova, “BERT: Pre-training of deep bidirectional transformers for language understanding,” NAACL HLT 2019 - 2019 Conf. North Am. Chapter Assoc. Comput. Linguist. Hum. Lang. Technol. - Proc. Conf., vol. 1, no. Mlm, hal. 4171–4186, 2019, [Daring]. Tersedia pada: https://aclanthology.org/N19-1423/.
M. Grootendorst, “BERTopic: Neural topic modeling with a class-based TF-IDF procedure,” 2022, [Daring]. Tersedia pada: http://arxiv.org/abs/2203.05794.
A. Ocal, “Perceptions of the Future of AI on Social Media: A Topic Modeling and Sentiment Analysis Approach,” IEEE Access, vol. 12, no. December, 2024, doi: 10.1109/ACCESS.2024.3510526.
B. Wilie et al., “IndoNLU: Benchmark and Resources for Evaluating Indonesian Natural Language Understanding,” in Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing, Des 2020, hal. 843–857, [Daring]. Tersedia pada: https://aclanthology.org/2020.aacl-main.85.
N. Mahfudiyah dan A. Alamsyah, “Understanding User Perception of Ride-Hailing Services Sentiment Analysis and Topic Modelling using IndoBERT and BERTopic,” 2023 Int. Conf. Digit. Bus. Technol. Manag. ICONDBTM 2023, no. July, hal. 1–6, 2023, doi: 10.1109/ICONDBTM59210.2023.10327320.
H. Jayadianti, W. Kaswidjanti, A. T. Utomo, S. Saifullah, F. A. Dwiyanto, dan R. Drezewski, “Sentiment analysis of Indonesian reviews using fine-tuning IndoBERT and R-CNN,” Ilk. J. Ilm., vol. 14, no. 3, hal. 348–354, 2022, doi: 10.33096/ilkom.v14i3.1505.348-354.
M. Röder, A. Both, dan A. Hinneburg, “Exploring the space of topic coherence measures,” in Proceedings of the eighth ACM international conference on Web search and data mining, 2015, hal. 399–408, [Daring]. Tersedia pada: https://dl.acm.org/doi/abs/10.1145/2684822.2685324.
E. Rijcken, “Cᵥ Topic Coherence Explained,” 2023. https://towardsdatascience.com/cᵥ-topic-coherence-explained-fc70e2a85227/.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2025 Muhammad Rayhan Nur, Yudi Wibisono, Rani Megasari

Artikel ini berlisensi Creative Commons Attribution 4.0 International License.
 
						 Muhammad Rayhan Nur
								Muhammad Rayhan Nur
							 
							





















