Comparative Analysis of SVM, XGBoost and Neural Network on Hate Speech Classification
Autor: | Liang, Suwarno |
---|---|
Jazyk: | angličtina |
Rok vydání: | 2021 |
Předmět: | |
Zdroj: | Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi); Vol 5 No 5 (2021): Oktober 2021; 896-903 Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi); Vol 5 No 5 (2021): Oktober2021; 896-903 |
ISSN: | 2580-0760 |
Popis: | In social media, it is found that hate speech is conveyed in the form of text, images and videos, as a result it can provoke certain people to do things that are against the law and harm other person. Therefore, it is necessary to make early detection of hate speech by utilizing machine learning algorithms. This study is to analyze the level of accuracy, precision, recall and F1-Score of 3 kinds of algorithms (SVM, XGBoost, and Neural Network) in the classification of hate speech, using datasets sourced from public hate speech on Twitter in Indonesian. The results of the analysis show that the SVM algorithm has a level of accuracy (83.2%), precision (83%), recall (83%) and F1-score (83%), SVM occupies the highest level compared to XGBoost and Neural Network, so the SVM algorithm can be considered for use in hate speech classification Dalam media sosial dijumpai adanya ujaran kebencian baik yang disampaikan dalam bentuk teks, gambar dan video, sebagai akibatnya dapat memancing sejumlah pihak tertentu melakukan hal yang bertentangan dengan hukum dan merugikan pihak lain. Oleh karenanya perlu upaya deteksi dini terhadap ujaran kebencian dengan memanfaatkan algoritma pembelajaran mesin (machine learning). Penelitian ini adalah untuk menganalisis tingkat accuracy, precision, recall dan F1-Score terhadap 3 macam algoritma (SVM, XGBoost, dan Neural Network) dalam klasifikasi ujaran kebencian, dengan menggunakan datasets yang bersumber pada ujaran kebencian publik di Twitter dalam bahasa Indonesia. Hasil analisis menunjukkan algoritma SVM memiliki tingkat accuracy (83.2%), precision (83%), recall (83%) dan F1-score (83%), SVM menduduki tertinggi dibanding XGBoost dan Neural Network, sehingga algoritma SVM dapat dipertimbangkan untuk digunakan dalam klasifikasi ujaran kebencian. |
Databáze: | OpenAIRE |
Externí odkaz: |