Seleksi Fitur dan Penanganan Imbalanced Data menggunakan RFECV dan ADASYN

Abstract
Proses data mining bekerja terhadap data yang tersedia. Jika dataset tidak tersedia sepenuhnya, hasil pengolahan data mining menjadi tidak optimal. Terdapat beberapa kondisi data yang perlu penanganan terlebih dahulu sebelum memasuki tahap data mining. Salah satunya ialah imbalanced class yang merupakan kondisi di mana distribusi data pada setiap kelas tidak proporsional. Sebagai salah satu cara untuk efisiensi proses klasifikasi, seleksi fitur dapat memenuhi kebutuhan tersebut karena hasil dari seleksi fitur adalah sebuah dataset dengan jumlah atribut yang lebih sedikit dari sebelumnya. Untuk menyelesaikan permasalahan imbalanced class, ADASYN digunakan dalam penelitian ini sebagai metode untuk menyeimbangkan proporsi kelas pada dataset. Sedangkan RFECV digunakan sebagai metode fitur seleksi yang dapat meningkatkan efisiensi pada proses klasifikasi. Setelah dilakukan evaluasi dari hasil klasifikasi pada dataset yang menggunakan seleksi fitur, didapatkan hasil klasifikasi yang lebih baik dibandingkan dengan hasil klasifikasi pada dataset tanpa seleksi fitur. Hal tersebut dibuktikan dengan perbandingan antara hasil terbaik dari akurasi klasifikasi dataset tanpa seleksi fitur. Hasil dari metode CART sebesar 85.1% yang merupakan hasil dari pengolahan data tanpa menggunakan metode fitur seleksi. sedangkan metode Bagging k-NN yang menghasilkan akurasi sebesar 88% yang di aplikasikan pada dataset dengan seleksi fitur. Sehingga dapat disimpulkan bahwa seleksi fitur dapat meningkatkan akurasi pada klasifikasi.