Analisis Sentimen Tweet Vaksin COVID-19 Menggunakan Recurrent Neural Network dan Naïve Bayes

Autor: Abdurrahim Abdurrahim, Merinda Lestandy, Lailis Syafaah
Jazyk: indonéština
Rok vydání: 2021
Předmět:
Zdroj: Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), Vol 5, Iss 4, Pp 802-808 (2021)
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi); Vol 5 No 4 (2021): Agustus 2021; 802-808
Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi); Vol 5 No 4 (2021): Agustus 2021 ; 802-808
ISSN: 2580-0760
Popis: COVID-19 has become a global pandemic including Indonesia, so the government is taking vaccinations as a preventive measure. The public's response to this continues to appear on social media platforms, one of which is Twitter. Tweets about the COVID-19 vaccine have generated various kinds of positive and negative opinions in the community. Therefore, it is very important to detect and filter it to prevent the spread of incorrect information. Sentiment analysis is a method used to determine the content of a dataset in the form of negative, positive or neutral text. The dataset in this study was obtained from 5000 COVID-19 vaccine tweets with the distribution of 3800 positive sentiment tweets, 800 negative sentiment tweets and 400 neutral sentiment tweets. The dataset obtained is then pre-processed data to optimize data processing. There are 4 stages of pre-processing, including remove punctuation, case folding, stemming and tokenizing. This study examines the performance of RNN and Naïve Bayes by adding the TF-IDF (Term Frequency-Inverse Document Frequency) technique which aims to give weight to the word relationship (term) of a document. The test results show that RNN (TF-IDF) has a greater accuracy of 97.77% compared to Naïve Bayes (TF-IDF) of 80%.  
COVID-19 telah menjadi pandemik dunia termasuk Indonesia, sehingga pemerintah mengambil tindakan vaksinasi sebagai upaya pencegahan. Tanggapan masyarakat mengenai hal tersebut terus muncul di platform media sosial salah satunya twitter. Tweet mengenai vaksin COVID-19 menimbulkan berbagai macam opini positif dan negatif di masyarakat. Oleh karena itu, sangat penting untuk mendeteksi dan menyaringnya agar tidak terjadi penyebaran informasi yang tidak benar. Analisis sentimen merupakan suatu metode yang digunakan untuk menentukan isi dari suatu dataset dalam bentuk teks yang bersifat negatif, positif atau netral. Dataset pada penelitian ini diperoleh dari 5000 tweet vaksin COVID-19 dengan pembagian 3800 tweet sentimen positif, 800 tweet sentimen negatif dan 400 tweet sentimen netral. Dataset yang didapat kemudian dilakukan pre-processing data untuk mengoptimalkan pengolahan data. Terdapat 4 tahapan pre-processing antara lain remove punctuation, case folding, stemming dan tokenizing. Penelitian ini mengkaji kinerja RNN dan Naïve Bayes dengan menambahkan teknik TF-IDF (Term Frequency-Inverse Document Frequency) yang bertujuan untuk memberikan bobot pada hubungan kata (term) sebuah dokumen. Hasil pengujian menunjukkan RNN (TF-IDF) memiliki akurasi lebih besar yaitu 97,77% dibandingkan Naïve Bayes (TF-IDF) sebesar 80%.
Databáze: OpenAIRE