Kinerja Komparatif Optimasi Algoritma Naive Bayes dalam Klasifikasi Teks untuk Uji Klinis Kanker
Main Article Content
Abstract
Teknik klasifikasi teks dalam pemrosesan bahasa alami memegang peranan penting dalam mengelompokkan data digital ke dalam kategori yang telah ditentukan sebelumnya. Khususnya dalam bidang medis, klasifikasi teks klinis sangat penting untuk memahami dokumen medis, terutama teks klinis tentang kanker. Penelitian ini bertujuan untuk membandingkan kinerja tiga varian algoritma Naive Bayes yaitu Multinomial, Bernoulli, dan Gaussian, pada data uji klinis kanker. Untuk mengoptimalkan kinerja algoritma, kami menggunakan pendekatan GridSearch dan cross-validation dengan k-fold (k=10). Pilihan algoritma memiliki pengaruh signifikan terhadap akurasi, presisi, recall, dan metrik kinerja lainnya. Melalui perbandingan varian Naive Bayes, kami dapat mengidentifikasi algoritma terbaik untuk dataset dan tugas klasifikasi teks klinis kanker. Hasil analisis menunjukkan bahwa Bernoulli Naive Bayes mencapai akurasi 0,79, presisi 0,88, dan recall 0,68. Sementara itu, Gaussian Naive Bayes mencapai akurasi 0,76, presisi 0,83, dan recall 0,65. Algoritma Multinomial Naive Bayes berhasil mencapai akurasi 0,80, presisi 0,84, dan recall 0,75. Penelitian ini memberikan panduan dalam memilih algoritma yang sesuai dengan tujuan dan prioritas klasifikasi. Hal ini dapat dikembangkan lebih lanjut dalam bahasa alami medis dan proses pengambilan keputusan medis. Melalui pengetahuan yang diperoleh dari penelitian ini, analisis teks medis dalam konteks klinis dapat dioptimalkan dengan lebih efektif.
Downloads
Article Details
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Jurnal Eksplora Informatika bersifat open access, yaitu dapat diakses secara umum tanpa dikenakan biaya. Penulis yang menerbitkan artikelnya di Jurnal Eksplora Informatika setuju dengan ketentuan berikut:
- Penulis memegang hak cipta dan memberikan hak publikasi pertama kepada Jurnal Eksplora Informatika menggunakan lisensi Creative Commons Attribution-ShareAlike 4.0.
- Penulis diizinkan untuk mengarsipkan/menggunggah/meyimpan artikel mereka, misalnya dalam repositori institusional atau situs web/blog penulis, namun diharapkan agar memberikan rincian bibliografi yang menghargai publikasi di jurnal ini.
- Jurnal Eksplora Informatika berhak untuk menyediakan artikel dalam berbagai bentuk dan media, sehingga artikel dapat digunakan untuk teknologi terbaru bahkan setelah dipublikasikan.
- Jurnal Eksplora Informatika berhak untuk menegakkan hak-hak atas nama penulis pada artikel terhadap pihak ketiga. Misalnya dalam kasus plagiarisme atau pelanggaran hak cipta.