Analisis Metode Wordtovec Pada Performa Klasifikasi Kategori Berita Menggunakan Metode SVM dan KNN

Dwi Utami

Abstract

Perkembangan teknologi saat ini meningkatkan kemudahan dalam mendapatkan berbagai informasi salah satunya adalah berita dari media internet. Berita yang ada di internet selain dapat memberikan informasi kepada masyarakat juga dapat digunakan sebagai bahan pembelajaran dan analisa seperti dapat digunakan untuk klasifikasi kategori berita. Terdapat tahapan sebelum melakukan klasifikasi yaitu preprocessing yang merupakan salah satu tahapan terpenting dalam klasifikasi. Penelitian ini bertujuan untuk melihat pengaruh proses stopword pada algoritma wordtovec, serta melihat performasinya pada klasifikasi yang dilakukan komparasi algoritma SVM dan KNN untuk melihat metode yang menghasilkan nilai akurasi tertinggi. Hasil penelitian menunjukan bahwa metode kombinasi yang menghasilkan akurasi tertinggi adalah metode wordtovec dengan SVM dengan akurasi sebesar 92.89%. Proses stopword sedikit meningkatkan akurasi sebesar 1.55%.

Keywords

Classification; Wordtovec; SVM; KNN;

Full Text:

PDF

References

D. Kim, D. Seo, S. Cho, and P. Kang, “Multi-co-training for document classification using various document representations: TF–IDF, LDA, and Doc2Vec,” Inf. Sci. (Ny)., vol. 477, pp. 15–29, 2019, doi: 10.1016/j.ins.2018.10.006.

G. Rossiello, P. Basile, and G. Semeraro, “Centroid-based Text Summarization through Compositionality of Word Embeddings,” 2017, doi: 10.18653/v1/w17-1003.

D. Maulina and R. Sagara, “Klasifikasi Artikel Hoax Menggunakan Support Vector Machine Linear Dengan Pembobotan Term Frequency-Inverse Document Frequency,” J. Mantik Penusa, 2018.

F. N. Rozi and D. H. Sulistyawati, “KLASIFIKASI BERITA HOAX PILPRES MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR DAN PEMBOBOTAN MENGGUNAKAN TF-IDF,” KONVERGENSI, 2019, doi: 10.30996/konv.v15i1.2828.

irwan budiman, M. R. Faisal, and D. T. Nugrahadi, “Studi Ekstraksi Fitur Berbasis Vektor Word2Vec pada Pembentukan Fitur Berdimensi Rendah,” J. Komputasi, 2020, doi: 10.23960/komputasi.v8i1.2517.

S. N. Asiyah and K. Fithriasari, “Klasifikasi Berita Online Menggunakan Metode Support Vector Machine Dan K Nearest Neighbor,” J. Sains dan Seni ITS, 2016.

A. A. Irfa, Adiwijaya, and M. S. Mubarok, “Klasifikasi Topik Berita Berbahasa Indonesia Menggunakan k-Nearest Neighbor,” e-Proceeding Eng., vol. 5, no. 2, p. 3631, 2018.

J. Santoso et al., “Self-Training Naive Bayes Berbasis Word2Vec untuk Kategorisasi Berita Bahasa Indonesia,” J. Nas. Tek. Elektro dan Teknol. Inf., vol. 7, no. 2, pp. 158–166, 2018, doi: 10.22146/jnteti.v7i2.418.

Refbacks

  • There are currently no refbacks.