Algoritma Stemming Sebagai Pra-Proses Pengecekan Kemiripan Naskah
Autor: | Handayanto, Rahmadya Trias, Amrillah, Ahmad Wafiq, Juwita, Intan, Arifin, Muhammad, Setiaji, Setiaji, Karani, Reyvan |
---|---|
Jazyk: | angličtina |
Rok vydání: | 2018 |
Zdroj: | BINA INSANI ICT JOURNAL; Vol 5 No 2 (2018): Bina Insani ICT Journal (Desember 2018); 175-182 Bahasa Indonesia; Vol 5 No 2 (2018): Bina Insani ICT Journal (Desember 2018); 175-182 |
ISSN: | 2355-3421 2527-9777 |
DOI: | 10.51211/biict.v5i2 |
Popis: | Proses pencarian kata dasar dari suatu kata dalam Bahasa Indonesia lebih sulit dari pada bahasa Inggris. Proses yang dikenal dengan istilah stemming itu membutuhkan algoritma tertentu dalam mencari kata dasar suatu kata. Berbeda dengan bahasa Inggris yang hanya mengenal akhiran, dalam Bahasa Indonesia dikenal awalan, akhiran dan sisipan sehingga proses stemming jauh lebih rumit. Beberapa algoritma stemming untuk Bahasa Indonesia telah banyak diterapkan untuk proses temu kembali. Penelitian ini mencoba menerapkan algoritma stemming untuk mengecek kemiripan naskah berdasarkan kata dasarnya. Selain itu sebuah aplikasi sederhana dibuat untuk menguji akurasi proses stemming yang diusulkan. Kata kunci: kata dasar, kemiripan naskah, Matlab, pemrosesan teks, temu kembali. Abstract:Searching a root of word in Indonesian is more difficult that English. This process, which is called stemming, need specific algorithms in finding the root. Whereas in English usually the roots are found by separating the suffixes, in Indonesia are found by separating preffixes, suffixes, and inffixes as well, so it adds the complexity of stemming process. Many stemming algorithms have been proposed in information retrieval, but in this study, the stemming was also used for similarity check of papers. In addition, a prototype was created for checking the proposed-algorithm’s accuracy. Keywords: information retrieval, Matlab, root word, similarity, text processing. |
Databáze: | OpenAIRE |
Externí odkaz: |