PENERAPAN ALGORITMA K-NEAREST NEIGHBOR DAN FITUR EKSTRAKSI N-GRAM DALAM ANALISIS SENTIMEN BERBASIS ASPEK
Main Article Content
Abstract
Pertumbuhan dan perkembangan teknologi yang begitu cepat dan pesat menjadikan membeli produk secara online semakin meningkat dan disukai yaitu membeli produk kecantikan. Banyak pertimbangan untuk mengetahui kualitas dari produk, salah satu caranya yaitu melihat ulasan produk kecantikan. Tujuan dari penelitian untuk mengevaluasi performansi dari metode K-Nearest Neighbor dan fitur ekstraksi N-Gram dalam melakukan analisis sentimen berbasis aspek pada produk kecantikan. Metodologi yang digunakan adalah pengumpulan data, preprocessing, ekstraksi fitur N-Gram, pembobotan kata dengan TF-IDF, klasifikasi dengan K-Nearest Neighbor ,Multi Label dengan binari ova, dan terakhir evaluasi performansi. Pembagian data dibagi menjadi tiga skenario yaitu 80:20, 70:30:, dan 60:40. Pengujian dilakukan dengan dataset original dan data yang diseimbangkan menggunakan metode Random Over Sampling. Hasil pengujian menunjukkan bahwa data yang seimbang menghasilkan nilai akurasi yang lebih baik daripada data yang tidak seimbang. Pada KNN dengan nilai k = 1 pada dataset seimbang, menghasilkan akurasi tertinggi. Akurasi pada aspek aroma, harga, kemasan dan efektivitas secara berturut-turut adalah 91,9%; 95,4%; 98,6%; 88,8%. Berdasarkan hasil pengujian yang telah dilakukan pada setiap aspek, didapatkan akurasi tertinggi dengan nilai akurasi 98,6% dari aspek kemasan pada skenario data 80:20.
Article Details
Section
Penulis yang menerbitkan dengan jurnal ini setuju pada persyaratan berikut ini:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama, dengan pekerjaan 6 bulan setelah penerbitan secara simultan dengan lisensi di bawah: Creative Commons Attribution License yang memudahkan yang lain untuk berbagi karya dengan pengakuan penerbitan awal dan kepenulisan karya di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non-ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).
How to Cite
References
N. F. Putri, S. Al Faraby, and M. Dwifebri, “Analisis Sentimen pada Produk Kecantikan dari Ulasan Female Daily Menggunakan Information Gain dan SVM Classifier,” e-Proceeding of Enginering, vol. 8, no. 5, pp. 10068–10079, 2021, doi: https://doi.org/10.34818/eoe.v8i5.15731.
W. Parasati, F. A. Bachtiar, and N. Y. Setiawan, “Analisis Sentimen Berbasis Aspek pada Ulasan Pelanggan Restoran Bakso President Malang dengan Metode Naïve Bayes Classifier,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 4, no. 4, pp. 1090–1099, 2020, [Online]. Available: http://j-ptiik.ub.ac.id.
S. Kaur, G. Sikka, and L. K. Awasthi, “Sentiment Analysis Approach Based on N-gram and KNN Classifier,” ICSCCC 2018 - 1st Int. Conf. Secur. Cyber Comput. Commun., pp. 13–16, 2018, doi: 10.1109/ICSCCC.2018.8703350.
R. Sari, “Analisis Sentimen Pada Review Objek Wisata Dunia Fantasi Menggunakan Algoritma K-Nearest Neighbor (K-Nn),” EVOLUSI J. Sains dan Manaj., vol. 8, no. 1, pp. 10–17, 2020, doi: 10.31294/evolusi.v8i1.7371.
F. A. Hirzani, W. Maharani, and M. A. Bijaksana, “Analisis Sentimen Review Produk Menggunakan Pendekatan Berbasis Kamus,” e-Proceeding of Enginering, vol. 2, no. 2, pp. 5891–5898, 2015, doi: https://doi.org/10.34818/eoe.v2i2.2991.
A. J. Rivera and M. J. Jesus, Francisco Herrera, Francisco Charte, Antonio J. Rivera, María J. del Jesus (auth.) - Multilabel Classification _ Problem Analysis, Metrics and Techniques (2016, Springer International Publishing) - libgen.lc.pdf. .
I. Indriati and A. Ridok, “Sentiment Analysis for Review Mobile Applications Using Neighbor Method Weighted K-Nearest Neighbor (Nwknn),” J. Enviromental Eng. Sustain. Technol., vol. 3, no. 1, pp. 23–32, 2016, doi: 10.21776/ub.jeest.2016.003.01.4.
F. Pramono, D. Rosiyadi, and W. Gata, “Integrasi N-gram, Information Gain, Particle Swarm Optimation di Naïve Bayes untuk Optimasi Sentimen Google Classroom,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 3, no. 3, pp. 383–388, 2019, doi: 10.29207/resti.v3i3.1119.
E. Y. Prastika S., S. Al Faraby, and M. D. Purbolaksono, “Analisis Sentimen pada Ulasan Produk Kecantikan Menggunakan K-Nearest Neighbor dan Information Gain,” eProceedings Eng., vol. 8, no. 5, pp. 10091–10105, 2021, doi: https://doi.org/10.34818/eoe.v8i5.15729.
A. N. Indraini, I. Ernawati, and A. Zaidah, “Analisis Sentimen Terhadap Pembelajaran Daring Di Indonesia Menggunakan Support Vector Machine (SVM),” 2021.
C. H. Yutika, A. Adiwijaya, and S. Al Faraby, “Analisis Sentimen Berbasis Aspek pada Review Female Daily Menggunakan TF-IDF dan Naïve Bayes,” J. Media Inform. Budidarma, vol. 5, no. 2, p. 422, 2021, doi: 10.30865/mib.v5i2.2845.
N. Arifin, U. Enri, and N. Sulistiyowati, “Penerapan Algoritma Support Vector Machine (SVM) dengan TF-IDF N-Gram untuk Text Classification,” STRING (Satuan Tulisan Ris. dan Inov. Teknol., vol. 6, no. 2, p. 129, 2021, doi: 10.30998/string.v6i2.10133.
A. Kulkarni and A. Shivananda, Natural Language Processing Recipes. 2019.
F. Fitriyani and T. Arifin, “Penerapan Word N-Gram Untuk Sentiment Analysis Review Menggunakan Metode Support Vector Machine (Studi Kasus: Aplikasi Sambara),” Sistemasi, vol. 9, no. 3, p. 610, 2020, doi: 10.32520/stmsi.v9i3.954.
K. K. Purnamasari and N. I. Widiastuti, “Perbandingan Algoritma K-Means Dan K-Nearest Neighbors Pada Sistem Peringkasan Otomatis,” Komputa J. Ilm. Komput. dan Inform., vol. 6, no. 2, pp. 57–66, 2017, doi: 10.34010/komputa.v6i2.2478.
S. Mukhopadhyay and P. Samanta, Advanced Data Analytics Using Python. 2023.
D. Normawati and S. A. Prayogi, “Implementasi Naïve Bayes Classifier Dan Confusion Matrix Pada Analisis Sentimen Berbasis Teks Pada Twitter,” J-SAKTI (Jurnal Sains Komput. dan Inform., vol. 5, no. 2, pp. 697–711, 2021.
R. Syafaat Amardita and M. Dwifebri Purbolaksono, “Analisis Sentimen terhadap Ulasan Paris Van Java Resort Lifestyle Place di Kota Bandung Menggunakan Algoritma KNN,” J. Ris. Komputer), vol. 9, no. 1, pp. 2407–389, 2022, doi: 10.30865/jurikom.v9i1.3793.
L. Qadrini, H. Hikmah, and M. Megasari, “Oversampling, Undersampling, Smote SVM dan Random Forest pada Klasifikasi Penerima Bidikmisi Sejawa Timur Tahun 2017,” J. Comput. Syst. Informatics, vol. 3, no. 4, pp. 386–391, 2022, doi: 10.47065/josyc.v3i4.2154.
M. Fajri and A. Primajaya, “Komparasi Teknik Hyperparameter Optimization pada SVM untuk Permasalahan Klasifikasi dengan Menggunakan Grid Search dan Random Search,” vol. 7, no. 1, pp. 14–19, 2023.