Komparasi Algoritma Feature Selection Pada Analisis Sentimen Review Film
DOI:
https://doi.org/10.55606/juitik.v2i2.326Keywords:
Analisis sentimen, klasifikasi, pemilihan fitur, support vector machine, jaringan syaraf tiruan, naïve bayesAbstract
Analisis sentimen adalah suatu proses yang bertujuan untuk menentukan isi suatu dataset berupa teks positif, negatif, atau netral. Saat ini opini publik merupakan sumber penting dalam pengambilan keputusan seseorang terhadap suatu produk. Algoritma klasifikasi seperti Naïve Bayes (NB), Support Vector Machine (SVM), dan Artificial Neural Network (ANN) telah diusulkan oleh banyak peneliti untuk digunakan dalam analisis sentimen ulasan film. Namun, klasifikasi sentimen teks bermasalah dengan jumlah atribut yang digunakan dalam sebuah dataset. Pemilihan fitur dapat digunakan untuk mengurangi atribut yang tidak relevan dalam dataset. Beberapa algoritma seleksi fitur yang digunakan adalah information gain, chi square, forward selection dan backward eliminasi. Hasil perbandingan algoritma, SVM mendapatkan hasil terbaik dengan akurasi sebesar 81,10% dan AUC 0,904. Hasil perbandingan pemilihan fitur, information gain mendapatkan hasil terbaik dengan akurasi rata-rata 84,57% dan AUC rata-rata 0,899. Hasil integrasi algoritma klasifikasi terbaik dan algoritma pemilihan fitur terbaik menghasilkan akurasi sebesar 81,50% dan AUC sebesar 0,929. Hasil tersebut mengalami peningkatan jika dibandingkan dengan hasil eksperimen menggunakan SVM tanpa seleksi fitur. Hasil pengujian algoritma seleksi fitur terbaik untuk masing-masing algoritma klasifikasi adalah information gain mendapatkan hasil terbaik untuk digunakan pada algoritma NB, SVM dan JST.
References
Forman, G. “An Extensive Empirical Study of Feature Selection Metrics for Text Classification”. Journal of Machine Learning Research, 3, 1289–1305, 2000. doi:10.1162/153244303322753670
Nugroho, A. S., Witarto, A. B., & Handoko, D. “Support Vector Machine Teori dan Aplikasinya dalam Bioinformatika”. IlmuKomputer.Com. 2000
Syahfitra, Febrian Dhimas, et.al. “Implementation of Backpropagation Artificial Neural Network as a Forecasting System of Power Transformer Peak Load at Bumiayu Substation”. Journal of Electrical Technology UMY (JET-UMY), Vol. 1, No. 3, September 2017
Syaputri, Astia Weni, Irwandi, Erno & Mustaki. “Naïve Bayes Algorithm for Classification of Student Major’s Specialization”. Journal of Intelligent Computing and Health Informatics, Vol. 1, No. 1, March 2020
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2022 Jurnal Ilmiah Teknik Informatika dan Komunikasi
This work is licensed under a Creative Commons Attribution-NoDerivatives 4.0 International License.