SUPPORT VECTOR MACHINE UNTUK EKSTRAKSI DOKUMEN KARYA ILMIAH

Jihad Jihad; Nelly Indriani Widiastuti; Kania Evita Dewi

doi:10.34010/komputa.v10i2.7202

PDF (Indonesian)

Published: 2021-10-30

DOI: https://doi.org/10.34010/komputa.v10i2.7202

Keywords:

Dokumen Karya Tulis Ilmiah, Support Vector Machine (SVM), Ekstraksi Fitur, Information Gain (IG)

Jihad Jihad

Program Studi Teknik Informatika, Fakultas Teknik dan Ilmu Komputer, Universitas Komputer Indonesia

Nelly Indriani Widiastuti

Program Studi Teknik Informatika, Fakultas Teknik dan Ilmu Komputer, Universitas Komputer Indonesia

Kania Evita Dewi

Program Studi Teknik Informatika, Fakultas Teknik dan Ilmu Komputer, Universitas Komputer Indonesia

Abstract

Ekstraksi informasi dokumen karya tulis ilmiah proses ekstraksi karya ilmiah secara otomatis untuk mendapatkan informasi terstruktur. Penelitian bertujuan untuk mengukur performansi Support Vector Machine (SVM) dalam mengektrak informasi didalam karya ilmiah. Dokumen karya ilmiah yang digunakan dalam penelitian ini adalah berupa lembar sampul dan abstrak dari skripsi, yang tersimpan dalam bentuk format .pdf. Setiap dokumen diubah terlebih dahulu ke format text. Hasil mengubah format dokumen masuk ke dalam tahapan persiapan, yaitu filtering, segmentasi, tokenizing, pelabelan, ektraksi fitur, dan seleksi fitur. Fitur yang digunakan dalam penelitian ini ada sebanyak 14 fitur. Hasil dari seleksi fitur setiap dokumen masuk kedalam proses klasifikasi untuk menentukan mengklasifikasi 16 kelas dari setiap dokumen tersebut. Di dalam penelitian ini performansi dari model yang dibuat oleh SVM mengunakan akurasi. Berdasarkan pengujian yang telah dilakukan dengan nilai gamma=0.5, dihasilkan akurasi tanpa Information Gain sebesar 90.68% sementara akurasi dengan Information Gain sebesar 90.99%. Untuk nilai error rate sebesar 9.32%, nilai precision sebesar 93.79%, nilai recall sebesar 90.74% dan nilai f-1 score sebesar 89.21%. Kesalahan yang paling banyak terjadi, pada pengklasifikasian judul lembar sampul. Kesalahan ini terjadi dikarenakan didalam penelitian ini dokumen yang digunakan, lembar sampul dan abstrak karya ilmiah, berasal dari sebuah dokumen yang sama, sehingga judul lembar sampul dan abstrak berisi hal yang sama, sehingga judul lembar sampul sering terklasifikasi judul abstrak.

Issue

Vol. 10 No. 2 (2021): Komputa : Jurnal Ilmiah Komputer dan Informatika

Section

Articles

Penulis yang menerbitkan dengan jurnal ini setuju pada persyaratan berikut ini:

Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama, dengan pekerjaan 6 bulan setelah penerbitan secara simultan dengan lisensi di bawah: Creative Commons Attribution License yang memudahkan yang lain untuk berbagi karya dengan pengakuan penerbitan awal dan kepenulisan karya di jurnal ini.
Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non-ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).

How to Cite

SUPPORT VECTOR MACHINE UNTUK EKSTRAKSI DOKUMEN KARYA ILMIAH. (2021). Komputa : Jurnal Ilmiah Komputer Dan Informatika, 10(2), 87-94. https://doi.org/10.34010/komputa.v10i2.7202

References

S. Sarawagi, Information Extraction, India: Foundations and TrendsR ! in Databases Vol. 1, No. 3 (2007) 261–377 , 2008.
D. Mustaqwa dan N. Indriani, "Implementasi Ekstraksi Informasi Pada Dokumen Teks Skripsi Menggunakan Ruled Based," Skripsi, Universitas Komputer Indonesia, p. 8, Indonesia, Bandung, Jawa Barat, 2018.
F. Sasmita and K. K. Purnamasari, "Ekstraksi Informasi Dokumen Karya Tulis Ilmiah Menggunakan Algoritma Learning Vector Quantization," Skripsi, Universitas Komputer Indonesia, p. 8, Indonesia, Bandung, Jawa Barat, 2018.
A. I. Riaddy, Y. Sibaroni dan A. Aditsania, "Ekstraksi Informasi pada Makalah Ilmiah dengan Pendekatan Supervised Learning," e-Proceeding of Engineering, p. 1184, April 2016.
V. Chandani, R. S. Wahono and P. , "Komparasi Algoritma Klasifikasi Machine Learning Dan Feature Selection pada Analisis Sentimen Review Film," Journal of Intelligent Systems, Vol. 1, No. 1, February 2015.
S. N. Asiyah dan K. Fithriasari, "Klasifikasi Berita Online Menggunakan Metode Support Vector Machine dan K- Nearest Neighbor," JURNAL SAINS DAN SENI ITS Vol. 5 No. 2 , 2016.
K. P. Wijaya dan M. A. Muslim, "Peningkatan Akurasi pada Algoritma Support Vector Machine dengan Penerapan Information Gain untuk Mendiagnosa Chronic Kidney Disease," Seminar Nasional Ilmu Komputer (SNIK 2016), Semarang, 10 Oktober 2016.
N. Indriani, E. Rainarli dan K. E. Dewi, "Peringkasan dan Support Vector Machine pada Klasifikasi Dokumen," JURNAL INFOTEL Informatika - Telekomunikasi - Elektronika, 09 November 2017.
A. Setiawan, Pengantar Teori Probabilitas, Salatiga: Tisara Grafika, Juni 2015.
E. Alpaydın, Introduction to Machine Learning Second Edition, Cambridge, Massachusetts London, England: The MIT Press, 2010.

Article Sidebar

Main Article Content

Abstract

Article Details

Issue

Section

How to Cite

References