SUPPORT VECTOR MACHINE UNTUK EKSTRAKSI DOKUMEN KARYA ILMIAH

Main Article Content

Jihad Jihad
Nelly Indriani Widiastuti
Kania Evita Dewi

Abstract

Ekstraksi informasi dokumen karya tulis ilmiah proses ekstraksi karya ilmiah secara otomatis untuk mendapatkan informasi terstruktur. Penelitian bertujuan untuk mengukur performansi Support Vector Machine (SVM) dalam mengektrak informasi didalam karya ilmiah. Dokumen karya ilmiah yang digunakan dalam penelitian ini adalah berupa lembar sampul dan abstrak dari skripsi, yang tersimpan dalam bentuk format .pdf. Setiap dokumen diubah terlebih dahulu ke format text. Hasil mengubah format dokumen masuk ke dalam tahapan persiapan, yaitu filtering, segmentasi, tokenizing, pelabelan, ektraksi fitur, dan seleksi fitur. Fitur yang digunakan dalam penelitian ini ada sebanyak 14 fitur. Hasil dari seleksi fitur setiap dokumen masuk kedalam proses klasifikasi untuk menentukan mengklasifikasi 16 kelas dari setiap dokumen tersebut. Di dalam penelitian ini performansi dari model yang dibuat oleh SVM mengunakan akurasi. Berdasarkan pengujian yang telah dilakukan dengan nilai gamma=0.5, dihasilkan akurasi tanpa Information Gain sebesar 90.68% sementara akurasi dengan Information Gain sebesar 90.99%. Untuk nilai error rate sebesar 9.32%, nilai precision sebesar 93.79%, nilai recall sebesar 90.74% dan nilai f-1 score sebesar 89.21%. Kesalahan yang paling banyak terjadi, pada pengklasifikasian judul lembar sampul. Kesalahan ini terjadi dikarenakan didalam penelitian ini dokumen yang digunakan, lembar sampul dan abstrak karya ilmiah, berasal dari sebuah dokumen yang sama, sehingga judul lembar sampul dan abstrak berisi hal yang sama, sehingga judul lembar sampul sering terklasifikasi judul abstrak.

Article Details

Section

Articles

How to Cite

SUPPORT VECTOR MACHINE UNTUK EKSTRAKSI DOKUMEN KARYA ILMIAH. (2021). Komputa : Jurnal Ilmiah Komputer Dan Informatika, 10(2), 87-94. https://doi.org/10.34010/komputa.v10i2.7202

References

S. Sarawagi, Information Extraction, India: Foundations and TrendsR ! in Databases Vol. 1, No. 3 (2007) 261–377 , 2008.
D. Mustaqwa dan N. Indriani, "Implementasi Ekstraksi Informasi Pada Dokumen Teks Skripsi Menggunakan Ruled Based," Skripsi, Universitas Komputer Indonesia, p. 8, Indonesia, Bandung, Jawa Barat, 2018.
F. Sasmita and K. K. Purnamasari, "Ekstraksi Informasi Dokumen Karya Tulis Ilmiah Menggunakan Algoritma Learning Vector Quantization," Skripsi, Universitas Komputer Indonesia, p. 8, Indonesia, Bandung, Jawa Barat, 2018.
A. I. Riaddy, Y. Sibaroni dan A. Aditsania, "Ekstraksi Informasi pada Makalah Ilmiah dengan Pendekatan Supervised Learning," e-Proceeding of Engineering, p. 1184, April 2016.
V. Chandani, R. S. Wahono and P. , "Komparasi Algoritma Klasifikasi Machine Learning Dan Feature Selection pada Analisis Sentimen Review Film," Journal of Intelligent Systems, Vol. 1, No. 1, February 2015.
S. N. Asiyah dan K. Fithriasari, "Klasifikasi Berita Online Menggunakan Metode Support Vector Machine dan K- Nearest Neighbor," JURNAL SAINS DAN SENI ITS Vol. 5 No. 2 , 2016.
K. P. Wijaya dan M. A. Muslim, "Peningkatan Akurasi pada Algoritma Support Vector Machine dengan Penerapan Information Gain untuk Mendiagnosa Chronic Kidney Disease," Seminar Nasional Ilmu Komputer (SNIK 2016), Semarang, 10 Oktober 2016.
N. Indriani, E. Rainarli dan K. E. Dewi, "Peringkasan dan Support Vector Machine pada Klasifikasi Dokumen," JURNAL INFOTEL Informatika - Telekomunikasi - Elektronika, 09 November 2017.
A. Setiawan, Pengantar Teori Probabilitas, Salatiga: Tisara Grafika, Juni 2015.
E. Alpaydın, Introduction to Machine Learning Second Edition, Cambridge, Massachusetts London, England: The MIT Press, 2010.