Algoritma Baru Pembentukan Kata Dasar Pada Proses Stemming Bahasa Indonesia

  • Yeni Anistyasari
  • Eko Hariadi
Keywords: Bahasa Indonesia, Sisipan, Stemming

Abstract

Salah satu faktor penting dalam pembentukan kamus elektronik adalah pembentukan kata dasar melalui proses stemming. Stemming adalah proses pengubahan sebuah kata ke bentuk dasarnya dengan menghilangkan imbuhan yang terdiri dari awalan, akhiran, awalan dan akhiran, dan sisipan. Beberapa algoritma stemming untuk Bahasa Indonesia telah dikembangkan, diantaranya adalah algoritma Nazief-Adriani (NA) dan Confix-Stripping (CS). Kedua algoritma ini telah teruji dalam proses stemming Bahasa Indonesia untuk membentuk kata dasar dengan menghilangkan awalan, akhiran, dan awalan-akhiran. Namun, algoritma NA dan CS tidak banyak mengeksplorasi proses pelesapan sisipan dalam pembentukan kata dasar. Penelitian ini mengajukan ide untuk memperbaiki algoritma stemming yang telah ada dengan menambahkan proses pelesapan sisipan. Untuk menguji algoritma yang diajukan, sebuah aplikasi stemming berbasis web dikembangkan. Masukan yang digunakan untuk pengujian algoritma pelesapan sisipan adalah berita dari portal daring. Kata dasar yang dihasilkan aplikasi dari proses stemming divalidasi oleh pakar Bahasa Indonesia untuk menentukan efektifitas algoritma yang diajukan. Hasil validasi dari pakar teknologi informasi menunjukkan bahwa aplikasi layak digunakan untuk proses uji coba. Sedangkan hasil validasi pakar Bahasa Indonesia membuktikan bahwa algoritma pelesapan sisipan dapat menghasilkan kata dasar yang baik dan sesuai dengan aturan Bahasa Indonesia.

Downloads

Download data is not yet available.

References

Adriani, Mirna, Jelita Asian, Bobby Nazief, and Hugh E Williams. 2007. “Stemming Indonesian : A Confi X-Stripping Approach.” ACM Transactions on Asian Language Information Processing (TALIP) 6 (4):1–33.
Nazief, Bobby. 2000. “Development of Computational Linguistics Research: A Challenge for Indonesia.” Proceedings of the 38th Annual Meeting on Association for Computational Linguistics - ACL ’00, 1–2.
Setiawan, Reina, Aditya Kurniawan, Widodo Budiharto, Iman Herwidiana Kartowisastro, and Harjanto Prabowo. 2016. “Flexible Affix Classification for Stemming Indonesian Language.” In 2016 13th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology, ECTI-CON 2016.
Wibowo, Julianto. 2016. “Pada Kalimat Bahasa Indonesia Dengan Algoritma Stemming.” Jurnal Riset Komputer (JURIKOM) 3 (5):346–50.
Widayanto, Hari, and Arief Fatchul Huda. 2017. “Comparison Nazief Adriani And CS Stemmer Algorithm For Stemm Real Data.” E-Proceeding of Engineering 4 (3):5215–22.
Widjaja, Marsel, and Seng Hansun. 2015. “Implementation of Porter’s Modified Stemming Algorithm in an Indonesian Word Error Detection Plugin Application.” International Journal of Technology 6 (2):139–50.
Winarti, Titin, Jati Kerami, and Sunny Arief. 2017. “Determining Term on Text Document Clustering Using Algorithm of Enhanced Confix Striping Stemming.” International Journal of Computer Application 157 (9):6.
Published
2020-01-08