Pebandingan Performa NaÃ¯ve Bayes dan KNN pada Klasifikasi Teks Sentimen Jasa Ekspedisi

Zuda Pradana Putra; Aryo Nugroho

doi:10.31328/jointecs.v6i3.2635

Authors

Zuda Pradana Putra Universitas Narotama http://orcid.org/0000-0002-3212-0651
Aryo Nugroho Universitas Narotama http://orcid.org/0000-0002-6350-9088

DOI:

https://doi.org/10.31328/jointecs.v6i3.2635

Keywords:

KNN, naÃ¯ve bayes, TF-IDF, over-sampling, sentimen

Abstract

Penelitian ini bertujuan untuk mengetahui performa dari model naÃ¯ve bayes dan KNN (K-Nearest Neighbor) dalam mengklasifikasikan dataset teks sentimen jasa ekspedisi. Ulasan pengguna twitter pada akun @jntexpressid, @JNE_ID, dan @posindonesia akan di tambang dan diklasifikan berdasarkan sentimen positif, netral, dan negatif. Data digali dari 1 Oktober hingga 1 Desember 2020, hasil didapat pada data JNT sebanyak 46.220, JNE 5.364, dan Pos Indonesia 11.194. Data mentah yang didapat akan dibersihkan dan dilabeli sebelum masuk ketahap pembobotan kata menggunakan TF-IDF. Data bersih yang didapat dari pra-pemrosesan teks akan dibagi menjadi data latih sebanyak 70% dan data uji 30% untuk diuji akurasinya kesetiap model. Metode over-sampling digunakan untuk meyeimbangkan dataset dan menghindari data latih yang overfitting. Pada model naÃ¯ve bayes dan KNN terjadi peningkatan cukup signifikan setelah metode over-sampling diimplementasikan. Akurasi terbesar pada naÃ¯ve bayes terdapat pada data JNT 82%, sedangkan KNN pada data POS 71%. Pada KNN nilai K tinggi tidak menentukan hasil akurasi, terbukti K=2 memiliki akurasi tertinggi dibanding K=4, K=6, K=8, K=10 setelah teknik resampling dilakukan.

Author Biographies

Zuda Pradana Putra, Universitas Narotama

Program Studi Sistem Informasi

Aryo Nugroho, Universitas Narotama

Program Studi Sistem Informasi

References

G. A. Buntoro, â€œAnalisis Sentimen Calon Gubernur DKI Jakarta 2017 Di Twitter,â€ INTEGER J. Inf. Technol., vol. 1, no. 1, pp. 32â€“41, 2017.

B. Gunawan, H. S. Pratiwi, and E. E. Pratama, â€œSistem Analisis Sentimen pada Ulasan Produk Menggunakan Metode Naive Bayes,â€ J. Edukasi dan Penelit. Inform., vol. 4, no. 2, p. 113, 2018, doi: 10.26418/jp.v4i2.27526.

A. Nugroho, â€œA Decision Guidance for Solving Success Rate Political Campaign Using Distance Weighted kNN in Nassi-Shneiderman Framework,â€ vol. 14, no. 2, pp. 410â€“420, 2021, doi: 10.22266/ijies2021.0430.37.

W. E. Nurjanah, R. S. Perdana, and M. A. Fauzi, â€œAnalisis Sentimen Terhadap Tayangan Televisi Berdasarkan Opini Masyarakat pada Media Sosial Twitter menggunakan Metode K-Nearest Neighbor dan Pembobotan Jumlah Retweet,â€ J. Pengemb. Teknol. Inf. dan Ilmu Komput. Univ. Brawijaya, vol. 1, no. 12, pp. 1750â€“1757, 2017.

R. Hidayatillah, M. Mirwan, M. Hakam, and A. Nugroho, â€œLevels of Political Participation Based on Naive Bayes Classifier,â€ IJCCS (Indonesian J. Comput. Cybern. Syst., vol. 13, no. 1, p. 73, 2019, doi: 10.22146/ijccs.42531.

J. A. Septian, T. M. Fahrudin, and A. Nugroho, â€œAnalisis Sentimen Pengguna Twitter Terhadap Polemik Persepakbolaan Indonesia Menggunakan Pembobotan TF - IDF dan K - Nearest Neighbor,â€ INSYST (JOURNAL Intell. Syst. Comput., vol. 1, pp. 43â€“49, 2019.

R. N. Devita, H. W. Herwanto, and A. P. Wibawa, â€œPerbandingan Kinerja Metode Naive Bayes dan K-Nearest Neighbor untuk Klasifikasi Artikel Berbahasa indonesia,â€ J. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 4, p. 427, 2018, doi: 10.25126/jtiik.201854773.

M. Syarifuddin, â€œAnalisis Sentimen Opini Publik Mengenai Covid-19 Pada Twitter Menggunakan Metode NaÃ¯ve Bayes Dan Knn,â€ Inti Nusa Mandiri, vol. 15, no. 1, pp. 23â€“28, 2020.

A. Indriani, â€œAnalisa Perbandingan Metode NaÃ¯ve Bayes Classifier Dan K-Nearest Neighbor Terhadap Klasifikasi Data,â€ Sebatik, vol. 24, no. 1, pp. 1â€“7, 2020, doi: 10.46984/sebatik.v24i1.909.

R. P. Sidiq, B. A. Dermawan, and Y. Umaidah, â€œSentimen Analisis Komentar Toxic pada Grup Facebook Game Online Menggunakan Klasifikasi NaÃ¯ve Bayes,â€ J. Inform. Univ. Pamulang, vol. 5, no. 3, p. 356, 2020, doi: 10.32493/informatika.v5i3.6571.

A. T. Niâ€™mah and A. Z. Arifin, â€œPerbandingan Metode Term Weighting terhadap Hasil Klasifikasi Teks pada Dataset Terjemahan Kitab Hadis,â€ Rekayasa, vol. 13, no. 2, pp. 172â€“180, 2020, doi: 10.21107/rekayasa.v13i2.6412.

S. Qaiser and R. Ali, â€œText Mining: Use of TF-IDF to Examine the Relevance of Words to Documents,â€ Int. J. Comput. Appl., vol. 181, no. 1, pp. 25â€“29, 2018, doi: 10.5120/ijca2018917395.

D. Syamsudin, Y. C. D. Halundaka, and A. Nugroho, â€œPrediksi Status Konsumen Produk Celana Menggunakan NaÃ¯ve Bayes,â€ JOINTECS (Journal Inf. Technol. Comput. Sci., vol. 5, no. 3, p. 177, 2020, doi: 10.31328/jointecs.v5i3.1435.

A. M. B. Muhammad Rivki, â€œImplementasi Algoritma K-Nearest Neighbor dalam Pengklasifikasian Follower Twitter yang Menggunakan Bahasa Indonesia,â€ J. Inf. Syst., vol. 13, 2017.

A. Muqiit WS and R. Nooraeni, â€œPenerapan Metode Resampling Dalam Mengatasi Imbalanced Data Pada Determinan Kasus Diare Pada Balita Di Indonesia (Analisis Data Sdki 2017),â€ J. MSA ( Mat. dan Stat. serta Apl. ), vol. 8, no. 1, p. 19, 2020, doi: 10.24252/msa.v8i1.13452.

Pebandingan Performa NaÃ¯ve Bayes dan KNN pada Klasifikasi Teks Sentimen Jasa Ekspedisi

Authors

DOI:

Keywords:

Abstract

Author Biographies

Zuda Pradana Putra, Universitas Narotama

Aryo Nugroho, Universitas Narotama

References

Downloads

Published

Issue

Section

License

Pernyataan Hak Cipta dan Lisensi

sidebar-1