Analisis Perbandingan Algoritma Nazief Adriani dan Levenshtein Distance untuk mengukur Tingkat Similaritas Berita Menggunakan Rabin Krap: Studi Kasus Berita Berbahasa Jawa

Abstract
Bagi masyarakat di Indonesia bahasa daerah merupakan bahasa sehari-hari yang biasa digunakan untuk berkomunikasi. Salah satunya adalah bahasa Jawa. Pada penelitian berbasis bahasa alami, bahasa daerah tergolong bahasa yang sulit untuk dikembangkan, mengingat ketersediaan jumlah dataset yang terbatas. Penelitian ini melakukan analisis terhadap 2 metode stemming kata, yaitu metode Nazief-Adriani dan Levenshtein Distance untuk menyelesaikan proses stemming kata berbahasa Jawa. Penelitian ini ingin mengetahui metode yang sesuai dengan akurasi terbaik untuk stemming kata berbahasa Jawa. Selain itu penelitian ini juga mempertimbangkan pembobotan kata untuk menghasilkan akurasi similaritas artikel yang lebih baik. Metode nazief adriani menghasilkan nilai rata-rata similarity sebesar 6,8% dengan waktu rata-rata eksekusi 0,0443 detik.