Spelling Corrector Bahasa Indonesia dengan Kombinasi Metode Peter Norvig dan N-Gram

Abstract
Abstrak - Kesalahan pengetikan dalam suatu dokumen merupakan human error yang sulit dihindari, akibatnya pesan yang ingin disampaikan tidak maksimal. Menggunakan fitur Spelling Corrector menjadi salah satu cara untuk mengecek kesalahan-kesalahan pengetikan. Metode-metode yang digunakan mampu memberikan saran-saran kata yang benar, tapi tidak mampu memperbaiki kata yang salah secara langsung. Pengguna harus memilih satu kata yang diinginkan dari saran-saran kata yang dihasilkan oleh fitur. Dibutuhkan fitur Spelling Corrector yang mampu memberikan hanya satu saran kata dan langsung memperbaikinya. Melihat cara berbagai macam metode memberikan saran kata, kombinasi metode Peter Norvig dan N-Gram mampu menghasilkan satu saran kata. Kedua metode mencari saran kata menggunakan nilai probabilitas kata yang paling sering muncul di dalam kamus. Perbedaan dari kedua metode tersebut adalah Peter Norvig menggunakan algoritma yang mengkombinasikan proses menghapus, menambah, memisahkan, mengganti, dan memindahkan huruf pada kata yang salah. Sedangkan, N-Gram menggunakan algoritma yang memperhatikan kata-kata sebelum dan sesudahnya berdasarkan kalimat di dalam kamus. Kamus yang digunakan adalah dokumen hasil training corpus yang disebut ARPA file. Kombinasi metode ini diuji dalam 9 skenario kesalahan penulisan dengan 160 kalimat yang masing-masing memiliki satu kata yang salah. Hasil pengujian menyatakan bahwa kombinasi kedua metode memberikan tingkat ketepatan 65,926% dan tingkat keberhasilan 78,07% untuk menghasilkan satu saran kata yang benar dari satu kata yang salah dalam sebuah kalimat. Kombinasi kedua metode ini dapat digunakan dalam memperbaiki kesalahan pengetikan, walaupun tidak dapat memperbaiki kata dengan tingkat kesalahan dua huruf atau lebih. Hal ini dikarenakan, Peter Norvig tidak mampu memperbaiki kata dengan tingkat kesalahan dua huruf dan membutuhkan korpus yang baik.Kata kunci: Kombinasi, Spelling Corrector, Peter Norvig, N-Gram, ARPA file.