Algoritma Stemming Sebagai Pra-Proses Pengecekan Kemiripan Naskah

Autor:	Handayanto, Rahmadya Trias, Amrillah, Ahmad Wafiq, Juwita, Intan, Arifin, Muhammad, Setiaji, Setiaji, Karani, Reyvan
Jazyk:	angličtina
Rok vydání:	2018
Zdroj:	BINA INSANI ICT JOURNAL; Vol 5 No 2 (2018): Bina Insani ICT Journal (Desember 2018); 175-182 Bahasa Indonesia; Vol 5 No 2 (2018): Bina Insani ICT Journal (Desember 2018); 175-182
ISSN:	2355-3421 2527-9777
DOI:	10.51211/biict.v5i2
Popis:	Proses pencarian kata dasar dari suatu kata dalam Bahasa Indonesia lebih sulit dari pada bahasa Inggris. Proses yang dikenal dengan istilah stemming itu membutuhkan algoritma tertentu dalam mencari kata dasar suatu kata. Berbeda dengan bahasa Inggris yang hanya mengenal akhiran, dalam Bahasa Indonesia dikenal awalan, akhiran dan sisipan sehingga proses stemming jauh lebih rumit. Beberapa algoritma stemming untuk Bahasa Indonesia telah banyak diterapkan untuk proses temu kembali. Penelitian ini mencoba menerapkan algoritma stemming untuk mengecek kemiripan naskah berdasarkan kata dasarnya. Selain itu sebuah aplikasi sederhana dibuat untuk menguji akurasi proses stemming yang diusulkan. Kata kunci: kata dasar, kemiripan naskah, Matlab, pemrosesan teks, temu kembali. Abstract:Searching a root of word in Indonesian is more difficult that English. This process, which is called stemming, need specific algorithms in finding the root. Whereas in English usually the roots are found by separating the suffixes, in Indonesia are found by separating preffixes, suffixes, and inffixes as well, so it adds the complexity of stemming process. Many stemming algorithms have been proposed in information retrieval, but in this study, the stemming was also used for similarity check of papers. In addition, a prototype was created for checking the proposed-algorithm’s accuracy. Keywords: information retrieval, Matlab, root word, similarity, text processing.
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=ejournalbina::40051117a132e6a06d3b63087aec8a50 http://ejournal-binainsani.ac.id/index.php/BIICT/article/view/1044 Zobrazit plný text záznamu