Abstract

Pengenalan entitas bernama merupakan suatu proses untuk mengklasifikasi entitas nama seperti nama orang, lokasi, organisasi, waktu, dan kuantitas pada suatu teks. Untuk teks berbahasa Indonesia, pengenalan entitas bernama sudah pernah dilakukan menggunakan metode Hidden Markov Model (HMM) [1]. Pada perkembangannya, muncul metode Conditional Random Fields (CRF) yang merupakan perbaikan dari HMM. CRF sendiri memiliki banyak kelebihan dibandingkan metode
Hidden Markov Model dan Maximum Entropy Markov Model. Hal ini terbukti pada penerapan pengenalan entitas bernama menggunakan metode CRF pada berbagai bahasa yang menghasilkan nilai akurasi yang tinggi. Untuk itu dalam penelitian ini
akan digunakan CRF untuk mendeteksi entitas bernama pada teks bahasa Indonesia. Aplikasi pengenalan entitas bernama dibuat untuk menguji seberapa baik CRF dalam mengenali entitas bernama. Fitur yang digunakan adalah kelas kata
sekarang, kelas kata sekarang dan kelas kata sebelumnya, dan kelas kata sekarang, kelas sebelumnya, dan kelas kata setelahnya. Pengujian menggunakan data latih dan data uji yang sama hasil akurasi terbaik yang diperoleh sebesar 90.53%
dengan recall 63.09% dan precision 31.55%. Hasil pengujian terhadap data latih dan data uji yang berbeda menunjukkan nilai akurasi terbaik adalah 90.06% dengan recall dan precision adalah 68.38% dan 41.35%.