Analisis Sentimen dan Pemodelan Topik Untuk Mengidentifikasi Topik Pandemi Covid-19 Pada Media Sosial Twitter menggunakan Naïve Bayes Classifier dan Latent Dirichleat Allocation
Autor: | Herjuna Ardi Prakosa, Siti Nasiroh, Ari Budi Riyanto |
---|---|
Rok vydání: | 2021 |
Předmět: | |
Zdroj: | JNANALOKA. :73-78 |
ISSN: | 2722-2896 2722-7332 |
DOI: | 10.36802/jnanaloka.2021.v2-no2-73-78 |
Popis: | Virus Corona atau Covid-19 menjadi perhatian khusus diseluruh dunia. Banyak masyarakat membicarakan virus ini melalui unggahan komentar dan opini di Media Sosial.Twitter merupakan salah satu media sosial yang saat ini masih banyak digunakan masyarakat untuk menyampaikan opini berupa kumpulan kata yang disebut tweets. Tweets yang berkaitan dengan topik covid-19 ini dapat di klasifikasikan menggunakan metode Topic Modeling untuk menghasilkan sebuah data topic yang sering dibicarakan pengguna twitter. Salah satu algoritma yang digunakan untuk melakukan Topic Modeling adalah menggunakan Latent Dirichlet Alocation (LDA). Pada penelitian ini LDA digunakan untuk mengetahui kata-kata apa saja yang banyak muncul pada data tweets tentang Covid-19 yang telah di unggah masyarakat melalui twitter. Sebelum data tweet dimodelkan dengan LDA, dilakukan terlebih dahulu analisis sentiment dengan Naïve Bayes Classifier untuk menghasilkan sentiment Positif, Negati dan Netral. Terdapat 5000 tweets dijadikan dataset untuk diklasifikasikan menggunakan Topic Modeling. Semua tweets yang yang di tambang masih perlu dilakukan preprocessing text yang bertujuan untuk menghapus kata-kata yang tidak baku, menghapus tanda baca, dan menghapus kata penyambung. Tweets yang sudah dilakukan preprocessing text lalu diberikan nilai bobot sehingga diketahui kata apa saja yang banyak muncul dalam tweets yang berkaitan dengan Covid-19. Kata-kata yang banyak muncul dan sudah diberikan bobot akan divisualisasikan menggunakan World Cloud sehingga dapat dilihat pemetaan kata apa saja yang banyak muncul dalam bentuk gambar. |
Databáze: | OpenAIRE |
Externí odkaz: |