Pembentukan Daftar Stopword Goffman Transition Point dengan Pembobotan Emoji pada Analisis Sentimen di Twitter

Autor: Rizky Maulana Iqbal, Yuita Arum Sari, Edy Santoso
Jazyk: indonéština
Rok vydání: 2022
Předmět:
Zdroj: Jurnal Teknologi Informasi dan Ilmu Komputer, Vol 9, Iss 5 (2022)
Druh dokumentu: article
ISSN: 2355-7699
2528-6579
DOI: 10.25126/jtiik.2022954706
Popis: Analisis sentimen atau opinion mining merupakan proses mengekstrak data teks sehingga didapatkan informasi yang terkandung dalam suatu data. Dalam proses ekstraknya, terdapat tahapan stopword removal untuk menghapus kata-kata tidak penting dengan menggunakan stopword. Stopword telah banyak disediakan dalam digital library dengan berisikan kata-kata tidak penting, tetapi tidak semua kata-kata tersebut tidak penting dalam suatu data atau kasus tertentu. Penelitian ini berfokus pada perbandingan terhadap stopword Tala dengan pembentukan stopword dari data latih menggunakan metode Goffman Transition Point yang merupakan pengembangan dari metode Zipf Law dengan menggunakan metode klasifikasi K-Nearest Neighbour (KNN) serta menambahkan pembobotan emoji dalam proses pembobotannya. Hasil penelitian ini menunjukkan dengan pembentukan stopword menggunakan metode Zipf Law menunjukkan nilai akurasi sebesar 73,6% dan menggunakan pembobotan emoji dengan nilai K yang dipakai metode KNN K = 17 tetapi jika tidak menggunakan pembobotan emoji akurasinya menjadi 72.9%. Formula jarak yang digunakan adalah Cosine distance. Jika dengan menggunakan stopword Tala dengan parameter yang sama menghasilkan akurasi sebesar 73% dengan pembobotan emoji dan 71,9% tanpa pembobotan emoji. Berdasarkan hasil tersebut dapat disimpulkan bahwa pembentukan stopword dan pembobotan emoji dapat meningkatkan akurasi. Abtract Sentiment analysis or opinion mining is the process of extracting text data, so that the information contained in the data is obtained. In the extracting process, there are stopword removal steps to remove unnecessary words by using a stopword. Many stopwords have been provided in digital libraries containing unimportant words, but not all of these words are not important in a particular data or case. This study focuses on the comparison of the stopword tala with the formation of a stopword from training data using the Goffman Transition Point which is a development of the Zipf Law method using the K-Nearest Neighbor (KNN) classification method and adding emoji weighting in the weighting process. The results of this study indicate that the formation of a stopword using the zipf law method shows an accuracy value of 73.6% and using emoji weighting with the K value used by the KNN method with K = 17 but if you don’t use emoji weighting the accuracy will be 72.9%. The distance formula used is the cosine distance. Using a stopword Tala with the same parameters produces an accuracy of 73% with emoji-weighted and 71.9% without emoji-weighted. Based on these results it can be concluded that the formation of stopwords and weighting of emojis can improve accuracy.
Databáze: Directory of Open Access Journals