Ekstraksi Ulasan Sentimen Film dari Twitter dengan Naïve Bayes pada Situs Web Media Sosial Penggemar Film

Abstract
Film dianggap sebagai bentuk seni serta merupakan sumber hiburan yang populer. Pembuatan penelitian ini diharapkan bisa membantu orang Indonesia untuk mendapatkan informasi tentang film serta membaca review dari film. Review film yang ada pada website ini didapatkan dari user-user lokal maupun dari Twitter. Sistem mengekstraksi dan mengkategorikan isi sentiment dari sebuah barisan teks tweet dengan menggunakan metodologi Basic Unified Process. Proses klasifikasi sentiment yang ada bertujuan untuk mengklasifikasi review sebagai positif/negatif. Seluruh tweet akan diproses melalui Feature Reduction dan Normalisasi. Proses Feature Reduction akan menghapus hashtag, username, link, dan tanda baca pada tweets. Pada proses Normalisasi, seluruh singkatan dan kata bukan baku pada tweets akan diganti. Penelitian ini menggunakan sistem Rule-Based dalam menentukan apakah tweet tersebut merupakan review film atau bukan. Penulis menggunakan algoritma Naïve Bayes untuk mengklasifikasi sentiment (positif/negatif) dari review. Penulis telah melakukan 8 buah pengujian, masing-masing 4 kali untuk pengujian sistem Rule-Based dan Naïve Bayes Classifier. Total data tweet yang diujicobakan adalah sebanyak 6.323, dan hasil akhir paling optimal yang didapatkan oleh sistem terhadap Rule-Based System menghasilkan akurasi sebesar 82,64% dan terhadap Naïve Bayes Classifier sebesar 74,09%. Dari hasil pengujian paling optimal ini, sistem mendapatkan nilai recall dan presisi masing-masing sebesar 71,44% dan 77,92% untuk Rule-Based System, serta 83,77% dan 77,65% untuk Naïve Bayes.