Pengaruh Information Gain dan Normalisasi Kata Pada Analisis Sentimen Berbasis Aspek

Reza Lutfi Nurdiansyah; Kania Evita Dewi

doi:10.34010/komputa.v12i2.9449

pdf (Indonesian)

Published: 2023-11-04

DOI: https://doi.org/10.34010/komputa.v12i2.9449

Keywords:

Aspect-Based Sentiment Analysis, Classification, Support Vector Machine, Information Gain, Normalization, Peter Norvig

Reza Lutfi Nurdiansyah

Universitas Komputer Indonesia

Kania Evita Dewi

Universitas Komputer Indonesia

Abstract

Information on the internet is very diverse, yet so many opinions make it difficult for other users to get information. Sentiment analysis is the process of analyzing or identifying a person's opinion on a particular subject or product that falls into positive, negative, or neutral categories. Aspect-level sentiment analysis shows better performance than document-level and sentence-level. This study aims to determine the accuracy performance of feature optimization using Information Gain with word normalization in aspect-based sentiment analysis. Therefore, this research uses Support Vector Machine as a classification algorithm with a polynomial kernel as well as non-standard word repair using Slang Word and Abbreviation (SS) dictionary followed by Spelling Corrector using Peter Norvig algorithm with additional Information Gain feature selection to optimize the number of features. Based on the test results that have been carried out using K-fold Cross Validation and Confusion Matrix on test data, the accuracy results vary according to the testing process flow. The best accuracy is obtained from the use of Information Gain without Peter Norvig's word normalization resulting in an average accuracy of 83%. Errors are often found when changing words. This error occurs because the word that can be changed can only correct one wrong letter.

Issue

Vol. 12 No. 2 (2023): Komputa : Jurnal Ilmiah Komputer dan Informatika

Section

Articles

Penulis yang menerbitkan dengan jurnal ini setuju pada persyaratan berikut ini:

Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama, dengan pekerjaan 6 bulan setelah penerbitan secara simultan dengan lisensi di bawah: Creative Commons Attribution License yang memudahkan yang lain untuk berbagi karya dengan pengakuan penerbitan awal dan kepenulisan karya di jurnal ini.
Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non-ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).

How to Cite

Pengaruh Information Gain dan Normalisasi Kata Pada Analisis Sentimen Berbasis Aspek. (2023). Komputa : Jurnal Ilmiah Komputer Dan Informatika, 12(2), 80-90. https://doi.org/10.34010/komputa.v12i2.9449

References

W. Parasati, F. A. Bachtiar, dan N. Y. Setiawan, “Analisis Sentimen Berbasis Aspek pada Ulasan Pelanggan Restoran Bakso President Malang dengan Metode Naïve Bayes Classifier”, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 4 No. 4, pp 1090-1099, 2020.

Y. Susandi, A. Herdiani, dan I. L. Sardi “Analisis Sentimen Opini Masyarakat Terhadap Pasangan Calon Presiden dan Wakil Presiden pada Media Sosial Twitter Menggunakan Ontology Supported Polarity Mining”, E-Proceeding of Engineering Vol. 6 No. 2, pp 8670-8681, 2019.

Nuryani dan D. Mahayana “Analisis Sentimen Berbasis Aspek dengan Deep Learning Ditinjau dari Sudut Pandang Filsafat Ilmu”, Jurnal Masyarakat Informatika Unjani Vol. 4 No. 2, pp 70-85, 2021.

R. Sari dan R. Y. Hayuningtyas, “Penerapan Algoritma Naive Bayes Untuk Analisis Sentimen Pada Wisata TMII Berbasis Website”, Indonesian Journal on Software Engineering Vol. 5 No. 2, pp 51-60, 2019.

A. S. Ritonga dan E. S. Purwaningsih, “Penerapan Metode Support Vector Machine (SVM) Dalam Klasifikasi Kualitas Pengelasan SMAW (Shield Metal ARC Welding”, Journal Ilmiah Edutic Vol. 5 No. 1, pp 17-25, 2018.

M. H. A. Nurjaman, M. S. Mubarok, dan Adiwijaya “Analisis Sentimen Pada Ulasan Buku Berbahasa Inggris Menggunakan Information Gain dan Support Vector Machine”, E- Proceeding of Engineering Vol. 4 No. 3, pp 4900-4906, 2017.

Y. M. Febrianti, “Analisis Sentimen Pada Ulasan Lazada Berbahasa Indonesia Menggunakan K-Nearest Neighbor (K-NN) Dengan Perbaikan Kata Menggunakan Jaro Winkler Distance” Other thesis, Universitas Brawijaya, 2018.

R. Martin, D. S. Naga, dan V. C. Mawardi, “Penggunaan Spelling Correction Dengan Metode Peter Norvig dan N-Gram ”, Jurnal Ilmu Komputer dan Sistem Informasi Vol. 9 No. 1, pp 175-180, 2021.

A. E. Irsad, Y. A. Sari, dan M. A. Fauzi, “Seleksi Fitur Information Gain untuk Klasifikasi Informasi Tempat Tinggal di Kota Malang Berdasarkan Tweet Menggunakan Metode Naïve Bayes dan Pembobotan TF-IDF-CF”, Jurnal Pengembangan Teknologi dan Ilmu Komputer Vol. 3 No. 5, pp 4907-4913, 2019.

Y. T. Pratama, F. A. Bachtiar, dan N. Y. Setiawan, “Analisis Sentimen Opini Pelanggan Terhadap Aspek Pariwisata Pantai Malang Selatan Menggunakan TF-IDF dan Support Vector Machine”, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 2 No. 12, pp 6244-6252, 2018.

S. Fanissa, M. A. Fauzi, dan S. Adinugroho, “Analisis Sentimen Pariwisata di Kota Malang Menggunakan Metode Naive Bayes dan Seleksi Fitur Query Expansion Ranking” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 2 No. 8, pp 2766-2770, 2018.

Ivan, Y. A. Sari, dan P. P. Adikara, “Klasifikasi Hate Speech Berbahasa Indonesia di Twitter Menggunakan Naive Bayes dan Seleksi Fitur Information Gain dengan Normalisasi Kata” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 3 No. 5, pp 4914-4922, 2019.

A. E. Sari, S. Widowati, dan K. M. Lhaksmana, “Klasifikasi Ulasan Pengguna Aplikasi Mandiri Online di Google Play Store dengan Menggunakan Metode Information Gain dan Naive Bayes Classifier” e-Proceeding of Engineering Vol. 6 No. 2, pp 9143-9157, 2019.

T. M. Iryana, Indriati, dan P. P. Adikara, “Analisis Sentimen Masyarakat Terhadap Mass Rapid Transit Jakarta Menggunakan Metode Naïve Bayes Dengan Normalisasi Kata”, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 5 No 6, pp 2753-2760, 2021.

T. M. Fahrudin, I. Sa’diyah, dan Latipah, “Aplikasi Pendeteksi Kesalahan Ejaan Bahasa Indonesia pada Karya Ilmiah Bidang Ilmu Komputer Menggunakan KEBI 1.0 Checker” Seminar Nasional Informatika Bela Negara Vol. 2, pp 64-72, 2021.

M. R. Alimuddin, Gusnawaty, A. A. Salim, “Makna Stance Expressions dalam Teks Jurnalistik Media Berita Detik dan Kompas pada Topik Perubahan Iklim di Indonesia: Analisis Linguistik Korpus” Jurnal Sinestesia Vol. 12, No. 1, pp. 109-123, 2022

S. F. Chen and J. Goodman, “Smoothing Techniques for Language Modeling” Center for Research in Computing Technology, 1998.

Jihad, N. I. Widiastuti, dan K.E. Dewi, “Support Vector Machine Untuk Ekstraksi Dokumen Karya Ilmiah” KOMPUTA:Jurnal Ilmiah Komputer dan Informatika, Vol. 10, No. 2, pp 87-94, 2021.

Suyanto, “Machine Learning Tingkat Dasar dan Lanjut” Informatika Bandung, 2018.

J. Han, M. Kamber, and J. Pei “Data Mining Concepts and Techniques Third Edition” Elsevier Inc, 2012.

D. Normawati dan S. A. Prayogi, “Implementasi Naive Bayes Classifier dan Confusion Matrix Pada Analisis Sentimen BerbasisTeks Pada Twitter”, Jurnal Sains Komputer dan Informatika , Vol. 5, No. 2 , PP. 697-711, 2021.

Article Sidebar

Main Article Content

Abstract

Article Details

Issue

Section

How to Cite

References