Analisis Emosi pada Media Sosial Twitter Menggunakan Metode Multinomial Naive Bayes dan Synthetic Minority Oversampling Technique
Main Article Content
Abstract
Media sosial Twitter sering digunakan untuk mengekspresikan emosi seseorang melalui sebuah cuitan. Penelitian tentang analisis emosi dalam media social twitter sudah banyak dilakukan. Mesin learning adalah tools yang banyak digunakan untuk melakukan pengkategorian emosi. Namun, ketidakseimbangan jumlah data antar kelas sering jadi masalah. Maka, penelitian ini bertujuan untuk mengetahui performansi hasil gabungan metode Multinomial Naïve Bayes (MNB) dan Synthetic Minority Oversampling Technique (SMOTE) untuk analisis emosi cuitan dari media sosial Twitter. Setiap cuitan melaui prepocessing data pada penelitian ini meliputi case folding, data cleaning, convert slangword, convert negation, tokenization, stopword removal, dan stemming. Untuk ekstraksi fitur digunakan metode n-gram dan untuk pembobotan fitur digunakan metode term frequency. Pengujian dilakukan menggunakan K-Fold Cross Validation. Berdasarkan hasil pengujian, dengan menggunakan SMOTE diperoleh rata-rata akurasi sebesar 0.65 atau 65% dan nilai rata-rata f1-score sebesar 0.66 atau 66%. Sedangkan tanpa SMOTE diperoleh rata-rata akurasi 0.64 atau 64% dan rata-rata f1-score sebesar 0.65 atau 65%. Walaupun dalam penelitian ini dapat ditunjukan hasil dengan menggunakan SMOTE lebih baik 1% dalam pengkategorian emosi. Tetapi hasil yang diperoleh belum maksimal, masih perlu dikaji lagi untuk metode penyeimbangan data dan mesin learning yang lain.
Article Details
Section
Penulis yang menerbitkan dengan jurnal ini setuju pada persyaratan berikut ini:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama, dengan pekerjaan 6 bulan setelah penerbitan secara simultan dengan lisensi di bawah: Creative Commons Attribution License yang memudahkan yang lain untuk berbagi karya dengan pengakuan penerbitan awal dan kepenulisan karya di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non-ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).
How to Cite
References
S. Dixon, “Leading Countries Based On Number Of Twitter Users As Of January 2022,” 2022. [Online]. Available: Https://Www.Statista.Com/Statistics/242606/Number-Of-Active-Twitter-Users-In-Selected-Countries/. [Accessed: 09-Nov-2022].
H. Rachmi, Suparni, And A. Al Kaafi, “Analisis Sentimen Sistem Ganjil Genap Kota Bogor,” J. Tek. Elektro, Teknol. Inf. Dan Komput., Vol. 5, No. 2, Pp. 92–99, 2021.
F. S. Alnaz And W. Maharani, “Analisis Emosi Melalui Media Sosial Twitter Dengan Menggunakan Metode Naïve Bayes Dan Perbandingan Fitur N-Gram Dan Tf-Idf,” eProceeings of Engineering 8, Pp. 1–14, 2021.
Rimbun Siringoringo, “Klasifikasi Data Tidak Seimbang Menggunakan Algoritma Smote Dan K-Nearest Neighbor,” J. Isd (Information Syst. Dev., Vol. 3, No. 1, Pp. 44–49, 2018.
A. Nurlaila, Wiranto, And R. Saptono, “Classification Of Customers Emotion Using Naïve Bayes Classifier ( Case Study : Natasha Skin Care ),” Itsmart J. Ilm. Teknol. Dan Inf., Vol. 6, No. 2, Pp. 92–97, 2017.
A. A. Arifiyanti And E. D. Wahyuni, “Smote : Metode Penyeimbang Kelas Pada Klasifikasi Data Mining,” J. Teknologi Informasi dan Komukasi ,Vol. Xv, Pp. 34–39, 2020.
C. Padurariu And M. E. Breaban, “Dealing With Data Imbalance In Text Classification,” Procedia Comput. Sci., Vol. 159, Pp. 736–745, 2019.
S. Chohan, A. Nugroho, A. Maezar, B. Aji, And W. Gata, “Analisis Sentimen Aplikasi Duolingo Menggunakan Metode Naïve Bayes Dan Synthetic Minority Over Sampling Technique,” Paradig. – J. Inform. Dan Komput., Vol. 22, No. 2, 2020.
M. S. Saputri, R. Mahendra, And M. Adriani, “Emotion Classification On Indonesian Twitter Dataset,” Proceeding Int. Conf. Asian Lang. Process, 2018.
G. Qiong, W. Xian-Ming, W. Zhao, N. Bing, And C.-S. Xin, “An Improved Smote Algorithm Based On Genetic Algorithm For Imbalanced Data Classification,” J. Digit. Inf. Manag., Vol. 14, No. 2, Pp. 92–103, 2016.
N. Indriani, E. Rainarli, And K. E. Dewi, “Peringkasan Dan Support Vector Machine Pada Klasifikasi Dokumen,” J. Infotel, Vol. 9, No. 4, Pp. 416–421, 2017.
A. H. Yunas, Yusra, And M. Fikry, “Klasifikasi Tweet E-Commerce Dengan Menggunakan Metode Support Vector Machine,” J. CoreIT: Jurnal Hasil Penelitian Ilmu Komputer dan Teknologi Informasi, Vol. 4, No. 2, Pp. 50–55, 2018.
I. Najiyah And I. Haryanti, “Sentimen Analisis Covid-19 Dengan Metode Probabilistic Neural Network Dan Tf-Idf,” J. Responsif: Riset Sains Dan Informatika, Vol. 3, No. 1, Pp. 100–111, 2021.
G. S. Ramadhan, B. Irawan, And C. Setianingsih, “Klasifikasi Emosi Pada Lirik Lagu Menngunakan Algoritma Naïve Bayes Dan Particle Swarm Optimization,” E-Proceeding Eng., Vol. 8, No. 5, Pp. 6293–6306, 2021.
A. Nugroho, “Analisis Sentimen Pada Media Sosial Twitter Menggunakan Naive Bayes Classifier Dengan Ekstrasi Fitur N-Gram,” No. 2, Pp. 200–209, 2018.
D. N. Chandra, G. Indrawan, And I. N. Sukajaya, “Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram,” J. Ilmiah Teknologi Informasi Asia, Vol. 10, No. 1, Pp. 11–19, 2016.
C. S. K. Aditya And V. R. S. Nastiti, “Sistem Temu Kembali Informasi Buku Hadits Menggunakan Pembobotan Term Frequency Inverse Document Frequency Dan Cosine Similarity,” Sentra(Seminar Nas. Teknol. Dan Rekayasa), Vol. 5, No. 2019, Pp. 124–131, 2019.
N. V Chawla, K. W. Bowyer, L. O. Hall, And W. P. Kegelmeyer, “Smote : Synthetic Minority Over-Sampling Technique,” J. of artificial intelligence research, Vol. 16, Pp. 321–357, 2002.
A. M. Ws, I. P. Ananda, M. A. Rizki, Z. D. Hapsari, And R. Nooraeni, “Penerapan Metode Resampling Dalam Mengatasi Imbalanced Data Pada Determinan Kasus Diare Pada Balita Di Indonesia,” J. Matematika dan Statistika serta Aplikasinya, Vol. 8, No. 1, 2020.
R. Rinaldi, R. Goejantoro, And Syaripuddin, “Penerapan Metode Klasifikasi Multinomial Naive Bayes ( Studi Kasus : Pt Prudential Life Samarinda Tahun 2019 ),” Eksponensial, Vol. 12, No. 2, Pp. 111–118, 2021.
F. D. A. Nur Ghaniaviyanto Ramadhan, “Sentiment Analysis On Vaccine Covid-19 Using Word Count And Gaussian Naïve Bayes,” Indones. J. Electr. Eng. Comput. Sci., Vol. 26, No. 3, Pp. 1765–1772, 2022.
J. Winahyu And I. Suharjo, “Aplikasi Web Analisis Sentimen Dengan Algoritma Multinomial Naïve Bayes,” KARMAPATI (Kumpulan Artikel Mahasiswa Pendidikan Teknik Informatika), Vol. 10, Pp. 206–214, 2021.
R. R. R. Arisandi, B. Warsito, And A. R. Hakim, “Aplikasi Naïve Bayes Classifier (Nbc) Pada Klasifikasi Status Gizi Balita Stunting Dengan Pengujian K-Fold Cross Validation,” J. Gaussian, Vol. 11, No. 1, Pp. 130–139, 2022.
A. S. Andini, D. T. Murdiansyah, And K. M. Lhaksmana, “Topic Classification Of Islamic Question And Answer Using Naïve Bayes And Tf-Idf Method,” Comput. Eng. Appl., Vol. 10, No. 3, Pp. 151–160, 2021.
M. A. Nur And N. Wardhani, “Optimasi Normalisasi Kata Pada Data Twitter Untuk Meningkatkan Akurasi Analisis Sentimen (Studi Kasus Respon Masyarakat Terhadap Layanan Teman Bus),” J. Fokus Elektroda: Energi Listrik, Telekomunikasi, Komputer, Elektronika dan Kendali), Vol. 07, No. 04, Pp. 237–243, 2022.