Abstract

Media sosial Twitter sering digunakan untuk mengekspresikan emosi seseorang melalui sebuah cuitan. Penelitian tentang analisis emosi dalam media social twitter sudah banyak dilakukan. Mesin learning adalah tools yang banyak digunakan untuk melakukan pengkategorian emosi. Namun, ketidakseimbangan jumlah data antar kelas sering jadi masalah. Maka, penelitian ini bertujuan untuk mengetahui performansi hasil gabungan metode Multinomial Naïve Bayes (MNB) dan Synthetic Minority Oversampling Technique (SMOTE) untuk analisis emosi cuitan dari media sosial Twitter. Setiap cuitan melaui prepocessing data pada penelitian ini meliputi case folding, data cleaning, convert slangword, convert negation, tokenization, stopword removal, dan stemming. Untuk ekstraksi fitur digunakan metode n-gram dan untuk pembobotan fitur digunakan metode term frequency. Pengujian dilakukan menggunakan K-Fold Cross Validation. Berdasarkan hasil pengujian, dengan menggunakan SMOTE diperoleh rata-rata akurasi sebesar 0.65 atau 65% dan nilai rata-rata f1-score sebesar 0.66 atau 66%. Sedangkan tanpa SMOTE diperoleh rata-rata akurasi 0.64 atau 64% dan rata-rata f1-score sebesar 0.65 atau 65%. Walaupun dalam penelitian ini dapat ditunjukan hasil dengan menggunakan SMOTE lebih baik 1% dalam pengkategorian emosi. Tetapi hasil yang diperoleh belum maksimal, masih perlu dikaji lagi untuk metode penyeimbangan data dan mesin learning yang lain.