Analisis Sentimen Bencana Banjir Sumatera Menggunakan TF-IDF Dan Logistic Regression

Authors

  • Ina Ristiana Universitas Darunnajah
  • Mutmainah Universitas Darunnajah

DOI:

https://doi.org/10.56995/sintek.v6i1.239

Keywords:

Tweet Harvest, Vader Sentyment Analysis, TF-IDF, Logistic Regression

Abstract

Penelitian ini bertujuan untuk memahami bagaimana warganet merespons banjir di Sumatera melalui percakapan di Twitter, yang dipilih sebagai objek karena bersifat real-time, datanya relatif terbuka melalui API, dan telah banyak dimanfaatkan sebagai kanal komunikasi bencana serta sumber data untuk analisis kebencanaan di Indonesia maupun global. Data dikumpulkan menggunakan tweet‑harvest dengan kata kunci terkait “banjir” dan “pemerintah”, sehingga diperoleh 517 tweet berbahasa Indonesia dalam rentang waktu tertentu. Teks tweet kemudian dibersihkan melalui serangkaian langkah pre‑processing, seperti penghapusan URL, mention, tanda baca, angka, serta normalisasi menjadi bentuk kata yang lebih ringkas dalam kolom text_final. Tahap berikutnya, setiap tweet diberi skor dan label sentimen menggunakan VADER Sentiment Analyzer, sehingga diperoleh kategori negatif, netral, dan positif. Data tersebut kemudian direpresentasikan secara numerik menggunakan TF‑IDF dan dimanfaatkan sebagai masukan untuk melatih model Logistic Regression sebagai klasifikator sentimen, dengan pemisahan data training dan testing. Evaluasi pada data uji menunjukkan bahwa model mencapai accuracy 0,860, dengan macro F1‑score 0,308 dan weighted F1‑score 0,805, yang menandakan performa sangat baik pada kelas netral namun masih terbatas untuk kelas negatif dan positif akibat ketidakseimbangan data. Secara keseluruhan, sekitar 92,59% tweet diklasifikasikan netral, 3,01% negatif, dan 4,41% positif, menggambarkan bahwa mayoritas percakapan bersifat informatif, sementara keluhan maupun apresiasi hadir dalam porsi kecil namun bermakna. Temuan ini menunjukkan bahwa analisis sentimen berbasis Twitter dapat menjadi alat bantu penting untuk memantau persepsi publik terhadap penanganan banjir, sekaligus menggarisbawahi perlunya model yang lebih sensitif terhadap ekspresi emosi negatif dan positif.

Downloads

Download data is not yet available.

References

F. Natasha, L. Christin, and F. W. Soesilo, “The Effect of Entrepreneurial Orientation on Social Media Adoption and Business Performance Moderated by Innovation Capability in Healthy Food SMEs in DKI Jakarta,” vol. 4, no. 1, pp. 104–117, 2023.

E. R. Lidinillah, T. Rohana, and A. R. Juwita, “Analisis sentimen twitter terhadap steam menggunakan algoritma logistic regression dan support vector machine Steam sentiment analysis using logistic regression algorithm and support vector machine,” vol. 10, pp. 154–164, 2023, doi: 10.37373/tekno.v10i2.440.

D. C. Youvan, “No Title,” pp. 1–27, 2024.

C. J. Hutto and E. Gilbert, “VADER : A Parsimonious Rule-based Model for Sentiment Analysis of Social Media Text,” pp. 216–225.

P. Arsi and R. Waluyo, “Analisis Sentimen Wacana Pemindahan Ibu Kota Indonesia Menggunakan Algoritma Support Vector Machine ( Svm ) Sentiment Analysis On The Discussion Of Relocating I Ndonesia ’ S Capital City Using The Support Vector Machine ( Svm ),” vol. 8, no. 1, pp. 147–156, 2021, doi: 10.25126/jtiik.202183944.

C.- Pandemic, B. Classifier, A. Wibowo, F. N. Hasan, L. A. Ramadhan, and R. Nurhayati, “Analisis Sentimen Opini Masyarakat Terhadap Keefektifan Pembelajaran Daring Selama Pandemi COVID-19 Menggunakan Naïve Bayes Classifier Analysis of Public Opinion Sentiment on the Effectiveness of Online Learning During the,” vol. 4, pp. 239–248, 2022.

R. Azhar, A. Surahman, and C. Juliane, “Analisis Sentimen Terhadap Cryptocurrency Berbasis Python TextBlob Menggunakan Algoritma Naïve Bayes,” vol. 6, pp. 267–281, 2022.

T. Widyanto, I. Ristiana, and A. Wibowo, “Komparasi Naïve Bayes dan SVM Analisis Sentimen RUU Kesehatan di Twitter,” vol. 6, no. 3, pp. 147–161, 2023.

H. Wickham, “Journal of Statistical Software,” vol. 59, no. 10, 2014.

P. Liu, T. Lei, Q. Xiang, Z. Wang, and J. Wang, “Animal Fur Recognition Algorithm Based on Feature Fusion Network,” 2022.

I. H. Sarker, “Machine Learning: Algorithms, Real-World Applications and Research Directions,” SN Comput. Sci., vol. 2, no. 3, p. 160, 2021, doi: 10.1007/s42979-021-00592-x.

A. Roihan, T. T. Atmojo, R. A. Wardoyo, and M. S. T. Saputra, “Sentiment Analysis of Twitter Data on the 2024 Indonesian Presidential Election Using BERT,” vol. 18, no. 1, pp. 28–34, 2025.

N. Chamidah, D. Widiyanto, H. B. Seta, and A. A. Aziz, “Revue d ’ Intelligence Artificielle The Impact of Oversampling and Undersampling on Aspect-Based Sentiment Analysis of Indramayu Tourism Using Logistic Regression,” vol. 38, no. 3, pp. 795–804, 2024.

Downloads

Published

2026-01-21

How to Cite

Ina Ristiana, & Mutmainah. (2026). Analisis Sentimen Bencana Banjir Sumatera Menggunakan TF-IDF Dan Logistic Regression. Jurnal Sistem Informasi Dan Teknologi (SINTEK), 6(1), 57–65. https://doi.org/10.56995/sintek.v6i1.239