Analisis Frekuensi Kata untuk Mengekstrak Kata Kunci dari Artikel Ilmiah Berbahasa Indonesia
Main Article Content
Abstract
Publikasi hasil penelitian merupakan suatu proses yang harus dilaksanakan dalam sebuah kegiatan penelitian. Publikasi dapat dilaksanakan dalam bentuk presentasi dalam sebuah seminar ilmiah, maupun dalam bentuk jurnal ilmiah. Sebelum memasuki proses seleksi, artikel ilmiah tersebut dipilah sesuai dengan kompetensi yang dimiliki oleh tim penilai. Umumnya proses pemilahan artikel ilmiah dilakukan secara manual oleh panitia pengelola seminar ilmiah, sehingga membutuhkan waktu dan membutuhkan ketepatan dalam penentuan tim penilai yang sesuai dengan artikel ilmiah. Pemilahan artikel ilmiah dapat dilakukan dengan menerapkan algoritma string similarity, yaitu dengan mencari kata-kata kunci yang terdapat dalam sebuah karya ilmiah. Kata kunci yang berada dalam artikel yang dihasilkan berdasarkan frekuensi kata yang muncul. Sebelum dicari kata yang banyak muncul, dilakukan proses filtering untuk menghilangkan kata sambung yang sering muncul sehingga tidak dianggap sebagai kata kunci artikel. Filtering menggunakan data stopword list yang digunakan oleh Tala. Sistem dibangun dalam bentuk aplikasi web menggunakan bahasa pemrograman PHP dan database MySQL dengan teknik responsive web design. Hasil penelitian ini menjelaskan bahwa artikel yang dimasukkan ke dalam sistem dapat dihasilkan kembali kata kunci yang sesuai dengan mendata kata-kata yang banyak muncul.
Downloads
Article Details
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Jurnal Eksplora Informatika bersifat open access, yaitu dapat diakses secara umum tanpa dikenakan biaya. Penulis yang menerbitkan artikelnya di Jurnal Eksplora Informatika setuju dengan ketentuan berikut:
- Penulis memegang hak cipta dan memberikan hak publikasi pertama kepada Jurnal Eksplora Informatika menggunakan lisensi Creative Commons Attribution-ShareAlike 4.0.
- Penulis diizinkan untuk mengarsipkan/menggunggah/meyimpan artikel mereka, misalnya dalam repositori institusional atau situs web/blog penulis, namun diharapkan agar memberikan rincian bibliografi yang menghargai publikasi di jurnal ini.
- Jurnal Eksplora Informatika berhak untuk menyediakan artikel dalam berbagai bentuk dan media, sehingga artikel dapat digunakan untuk teknologi terbaru bahkan setelah dipublikasikan.
- Jurnal Eksplora Informatika berhak untuk menegakkan hak-hak atas nama penulis pada artikel terhadap pihak ketiga. Misalnya dalam kasus plagiarisme atau pelanggaran hak cipta.
References
A. A. Ma’arif, “Penerapan Algoritma TF-IDF Untuk Pencarian Karya Ilmiah,†Teknik Informatika Universitas Dian Nuswantoro, 2015. [link]
M. Alexandrov, A. Gelbukh, and P. Rosso, “An approach to clustering abstracts,†in International Conference on Application of Natural Language to Information Systems, Berlin, 2005, pp. 275–285. [link]
S. Beliga, “Keyword extraction: a review of methods and approaches,†University of Rijeka, pp. 1–9, 2014. [link]
M. Habibi and A. Popescu-Belis, “Keyword extraction and clustering for document recommendation in conversations,†in IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 2015, pp. 746-759. [link]
U. Dewi, Imelda, “Analisis Text Mining, Algoritma TF/IDF (Term Frequency-Inversed Document Frequency) dan Algoritma Vector Space Model Pada Pengelolaan Materi Ajar,†in Konferensi Nasional Sistem & Informatika (KNS&I), 2014.
L. Agusta, “Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia,†in Konferensi Nasional Sistem & Informatika (KNS&I), 2009, pp. 196-201. [link]
O. Nurdiana, Jumadi, and D. Nursantika, “Perbandingan Metode Cosine Similarity Dengan Metode Jaccard Similarity Pada Aplikasi Pencarian Terjemah Al-Qur’an Dalam Bahasa Indonesia,†Jurnal Online Informatika, vol. 1, no. 1, pp. 59–63, 2016. [link]
I. K. R. Y. Negara, "Implementasi Si Toni Sebagai Ujian Berbasis Komputer pada Bisma Informatika Indonesia," in SEMNASTEKNOMEDIA ONLINE, 2016, pp. 25–30.
V. Vaswani, How to do Everything with PHP & MySQL, United States of America: McGraw-Hill, 2005. [link]
R. K. Roul, O. R. Devanand, and S. K. Sahay, “Web Document Clustering and Ranking Using TF-IDF Based Apriori Approach,†in IJCA Proceedings on ICACEA, 2014, pp. 74–78. [link]