Pengaruh Komposisi Split Data Terhadap Performa Akurasi Analisis Sentimen Algoritma Naïve Bayes dan SVM

Autor: Yoga Adi Prasetyo, Ema Utami, Ainul Yaqin
Jazyk: indonéština
Rok vydání: 2024
Předmět:
Zdroj: Journal of Electrical Engineering and Computer, Vol 6, Iss 2, Pp 382-390 (2024)
Druh dokumentu: article
ISSN: 2715-0410
2715-6427
DOI: 10.33650/jeecom.v6i2.9188
Popis: Analisis sentimen merupakan bidang yang penting dalam pengolahan bahasa alami dan aplikasi sosial media modern. Penelitian ini menginvestigasi pengaruh dari variasi komposisi split data terhadap performa akurasi model analisis sentimen menggunakan SVM dan Naive Bayes. Metode eksperimen menggunakan variasi dari teknik k-fold cross-validation untuk membandingkan hasil dari berbagai proporsi pembagian data latih dan uji. Hasil eksperimen menunjukkan bahwa komposisi split data memiliki dampak signifikan terhadap performa akurasi kedua algoritma, dengan beberapa proporsi split data menghasilkan hasil yang lebih konsisten dan stabil dibandingkan dengan yang lain. Temuan ini memberikan wawasan yang berharga dalam pengaturan praktis untuk pelatihan model analisis sentimen yang lebih efektif dan andal. Teknik ekstraksi fitur yang digunakan Term Frequency-Inverse Document Frequency (TF-IDF), dengan algoritma klasifikasi Naive Bayes dan Support Vector Machine (SVM). Performa model dievaluasi menggunakan metrik seperti akurasi, presisi, recall, dan F1-score. Hasil penelitian menunjukkan bahwa signifikan model SVM dengan rasio 80:20 mencapai akurasi 76,66% dan F1-score 77 %, dibandingkan metode SVM dan Naïve Bayes dengan rasio lainnya.
Databáze: Directory of Open Access Journals