Perbandingan Algoritma KNN dan Naive Bayes untuk Klasifikasi Kunjungan Wisatawan Keraton Cirebon
Data mentah yang digunakan adalah data kunjungan wisatawan dari 4 keraton di Cirebon selama tahun 2024 (Total 48 baris data).
| No | Destinasi | Bulan | Jml. Umum | Jml. Pelajar/Mhs | Jml. Asing | Lama Kunjungan (menit) |
|---|---|---|---|---|---|---|
| 1 | Keraton Kasepuhan | Januari | 7,333 | 929 | 67 | 62 |
| 2 | Keraton Kasepuhan | Februari | 9,861 | 2,305 | 99 | 61 |
| 3 | Keraton Kasepuhan | Maret | 3,445 | 641 | 48 | 61 |
| 4 | Keraton Kasepuhan | April | 6,766 | 617 | 106 | 68 |
| 5 | Keraton Kasepuhan | Mei | 990 | 8,707 | 57 | 61 |
| 6 | Keraton Kasepuhan | Juni | 589 | 5,757 | 86 | 61 |
| 7 | Keraton Kasepuhan | Juli | 6,279 | 377 | 98 | 66 |
| 8 | Keraton Kasepuhan | Agustus | 5,020 | 438 | 76 | 62 |
| 9 | Keraton Kasepuhan | September | 8,588 | 3,626 | 42 | 61 |
| 10 | Keraton Kasepuhan | Oktober | 1,618 | 8,401 | 23 | 61 |
| 11 | Keraton Kasepuhan | November | 8,069 | 1,151 | 135 | 60 |
| 12 | Keraton Kasepuhan | Desember | 9,329 | 2,047 | 54 | 67 |
| 13 | Keraton Kacirebonan | Januari | 2,719 | 230 | 12 | 43 |
| 14 | Keraton Kacirebonan | Februari | 195 | 2,590 | 6 | 42 |
| 15 | Keraton Kacirebonan | Maret | 166 | 2,631 | 7 | 42 |
| 16 | Keraton Kacirebonan | April | 5,432 | 256 | 18 | 52 |
| 17 | Keraton Kacirebonan | Mei | 2,642 | 168 | 8 | 42 |
| 18 | Keraton Kacirebonan | Juni | 2,448 | 162 | 7 | 42 |
| 19 | Keraton Kacirebonan | Juli | 3,285 | 243 | 15 | 50 |
| 20 | Keraton Kacirebonan | Agustus | 2,983 | 211 | 11 | 44 |
| 21 | Keraton Kacirebonan | September | 167 | 2,557 | 7 | 42 |
| 22 | Keraton Kacirebonan | Oktober | 2,541 | 174 | 7 | 42 |
| 23 | Keraton Kacirebonan | November | 2,153 | 117 | 6 | 41 |
| 24 | Keraton Kacirebonan | Desember | 3,271 | 225 | 13 | 51 |
| 25 | Keraton Kanoman | Januari | 108 | 962 | 4 | 37 |
| 26 | Keraton Kanoman | Februari | 946 | 92 | 3 | 37 |
| 27 | Keraton Kanoman | Maret | 930 | 82 | 4 | 36 |
| 28 | Keraton Kanoman | April | 2,136 | 111 | 11 | 46 |
| 29 | Keraton Kanoman | Mei | 951 | 83 | 3 | 37 |
| 30 | Keraton Kanoman | Juni | 921 | 78 | 4 | 37 |
| 31 | Keraton Kanoman | Juli | 1,207 | 119 | 8 | 44 |
| 32 | Keraton Kanoman | Agustus | 1,076 | 112 | 6 | 39 |
| 33 | Keraton Kanoman | September | 952 | 76 | 3 | 37 |
| 34 | Keraton Kanoman | Oktober | 945 | 93 | 3 | 37 |
| 35 | Keraton Kanoman | November | 810 | 53 | 2 | 36 |
| 36 | Keraton Kanoman | Desember | 1,151 | 110 | 6 | 45 |
| 37 | Keraton Kaprabonan | Januari | 229 | 31 | 2 | 25 |
| 38 | Keraton Kaprabonan | Februari | 222 | 27 | 1 | 24 |
| 39 | Keraton Kaprabonan | Maret | 219 | 19 | 1 | 24 |
| 40 | Keraton Kaprabonan | April | 418 | 25 | 3 | 30 |
| 41 | Keraton Kaprabonan | Mei | 222 | 22 | 1 | 24 |
| 42 | Keraton Kaprabonan | Juni | 213 | 18 | 1 | 24 |
| 43 | Keraton Kaprabonan | Juli | 279 | 28 | 2 | 29 |
| 44 | Keraton Kaprabonan | Agustus | 263 | 23 | 1 | 26 |
| 45 | Keraton Kaprabonan | September | 227 | 18 | 1 | 24 |
| 46 | Keraton Kaprabonan | Oktober | 221 | 26 | 1 | 24 |
| 47 | Keraton Kaprabonan | November | 197 | 11 | 1 | 24 |
| 48 | Keraton Kaprabonan | Desember | 260 | 35 | 2 | 29 |
Fitur numerik dinormalisasi menggunakan Min-Max, kemudian kelas ditentukan berdasarkan rata-rata nilai normalisasi tersebut.
| No | Destinasi | Bulan | Rata-Rata Normalisasi | Klasifikasi (Ground Truth) |
|---|---|---|---|---|
| 1 | Keraton Kasepuhan | Januari | 0.5506 | Kunjungan Normal |
| 2 | Keraton Kasepuhan | Februari | 0.7090 | Kunjungan Tinggi |
| 3 | Keraton Kasepuhan | Maret | 0.4016 | Kunjungan Normal |
| 4 | Keraton Kasepuhan | April | 0.6340 | Kunjungan Normal |
| 5 | Keraton Kasepuhan | Mei | 0.5873 | Kunjungan Normal |
| 6 | Keraton Kasepuhan | Juni | 0.5463 | Kunjungan Normal |
| 7 | Keraton Kasepuhan | Juli | 0.5883 | Kunjungan Normal |
| 8 | Keraton Kasepuhan | Agustus | 0.4940 | Kunjungan Normal |
| 9 | Keraton Kasepuhan | September | 0.6080 | Kunjungan Normal |
| 10 | Keraton Kasepuhan | Oktober | 0.5312 | Kunjungan Normal |
| 11 | Keraton Kasepuhan | November | 0.6914 | Kunjungan Normal |
| 12 | Keraton Kasepuhan | Desember | 0.6381 | Kunjungan Normal |
| 13 | Keraton Kacirebonan | Januari | 0.2017 | Kunjungan Rendah |
| 14 | Keraton Kacirebonan | Februari | 0.1880 | Kunjungan Rendah |
| 15 | Keraton Kacirebonan | Maret | 0.1903 | Kunjungan Rendah |
| 16 | Keraton Kacirebonan | April | 0.3343 | Kunjungan Rendah |
| 17 | Keraton Kacirebonan | Mei | 0.1848 | Kunjungan Rendah |
| 18 | Keraton Kacirebonan | Juni | 0.1778 | Kunjungan Rendah |
| 19 | Keraton Kacirebonan | Juli | 0.2620 | Kunjungan Rendah |
| 20 | Keraton Kacirebonan | Agustus | 0.2117 | Kunjungan Rendah |
| 21 | Keraton Kacirebonan | September | 0.1882 | Kunjungan Rendah |
| 22 | Keraton Kacirebonan | Oktober | 0.1805 | Kunjungan Rendah |
| 23 | Keraton Kacirebonan | November | 0.1614 | Kunjungan Rendah |
| 24 | Keraton Kacirebonan | Desember | 0.2630 | Kunjungan Rendah |
| 25 | Keraton Kanoman | Januari | 0.1068 | Kunjungan Rendah |
| 26 | Keraton Kanoman | Februari | 0.1014 | Kunjungan Rendah |
| 27 | Keraton Kanoman | Maret | 0.0969 | Kunjungan Rendah |
| 28 | Keraton Kanoman | April | 0.1985 | Kunjungan Rendah |
| 29 | Keraton Kanoman | Mei | 0.1013 | Kunjungan Rendah |
| 30 | Keraton Kanoman | Juni | 0.1022 | Kunjungan Rendah |
| 31 | Keraton Kanoman | Juli | 0.1580 | Kunjungan Rendah |
| 32 | Keraton Kanoman | Agustus | 0.1223 | Kunjungan Rendah |
| 33 | Keraton Kanoman | September | 0.1011 | Kunjungan Rendah |
| 34 | Keraton Kanoman | Oktober | 0.1014 | Kunjungan Rendah |
| 35 | Keraton Kanoman | November | 0.0892 | Kunjungan Rendah |
| 36 | Keraton Kanoman | Desember | 0.1582 | Kunjungan Rendah |
| 37 | Keraton Kaprabonan | Januari | 0.0112 | Kunjungan Rendah |
| 38 | Keraton Kaprabonan | Februari | 0.0034 | Kunjungan Rendah |
| 39 | Keraton Kaprabonan | Maret | 0.0031 | Kunjungan Rendah |
| 40 | Keraton Kaprabonan | April | 0.0462 | Kunjungan Rendah |
| 41 | Keraton Kaprabonan | Mei | 0.0032 | Kunjungan Rendah |
| 42 | Keraton Kaprabonan | Juni | 0.0029 | Kunjungan Rendah |
| 43 | Keraton Kaprabonan | Juli | 0.0351 | Kunjungan Rendah |
| 44 | Keraton Kaprabonan | Agustus | 0.0157 | Kunjungan Rendah |
| 45 | Keraton Kaprabonan | September | 0.0033 | Kunjungan Rendah |
| 46 | Keraton Kaprabonan | Oktober | 0.0033 | Kunjungan Rendah |
| 47 | Keraton Kaprabonan | November | 0.0023 | Kunjungan Rendah |
| 48 | Keraton Kaprabonan | Desember | 0.0349 | Kunjungan Rendah |
| No | Destinasi | Bulan | Aktual | Prediksi KNN | Hasil |
|---|---|---|---|---|---|
| 1 | Keraton Kacirebonan | September | Kunjungan Rendah | Kunjungan Rendah | Benar |
| 2 | Keraton Kanoman | Juli | Kunjungan Rendah | Kunjungan Rendah | Benar |
| 3 | Keraton Kanoman | April | Kunjungan Rendah | Kunjungan Rendah | Benar |
| 4 | Keraton Kaprabonan | Mei | Kunjungan Rendah | Kunjungan Rendah | Benar |
| 5 | Keraton Kaprabonan | Oktober | Kunjungan Rendah | Kunjungan Rendah | Benar |
| 6 | Keraton Kasepuhan | Maret | Kunjungan Normal | Kunjungan Rendah | Salah |
| 7 | Keraton Kasepuhan | Mei | Kunjungan Normal | Kunjungan Normal | Benar |
| 8 | Keraton Kasepuhan | Januari | Kunjungan Normal | Kunjungan Normal | Benar |
| 9 | Keraton Kacirebonan | April | Kunjungan Rendah | Kunjungan Rendah | Benar |
| 10 | Keraton Kasepuhan | Juli | Kunjungan Normal | Kunjungan Normal | Benar |
| No | Destinasi | Bulan | Aktual | Prediksi Naive Bayes | Hasil |
|---|---|---|---|---|---|
| 1 | Keraton Kacirebonan | September | Kunjungan Rendah | Kunjungan Rendah | Benar |
| 2 | Keraton Kanoman | Juli | Kunjungan Rendah | Kunjungan Rendah | Benar |
| 3 | Keraton Kanoman | April | Kunjungan Rendah | Kunjungan Rendah | Benar |
| 4 | Keraton Kaprabonan | Mei | Kunjungan Rendah | Kunjungan Rendah | Benar |
| 5 | Keraton Kaprabonan | Oktober | Kunjungan Rendah | Kunjungan Rendah | Benar |
| 6 | Keraton Kasepuhan | Maret | Kunjungan Normal | Kunjungan Normal | Benar |
| 7 | Keraton Kasepuhan | Mei | Kunjungan Normal | Kunjungan Normal | Benar |
| 8 | Keraton Kasepuhan | Januari | Kunjungan Normal | Kunjungan Normal | Benar |
| 9 | Keraton Kacirebonan | April | Kunjungan Rendah | Kunjungan Normal | Salah |
| 10 | Keraton Kasepuhan | Juli | Kunjungan Normal | Kunjungan Normal | Benar |
| Aktual/Prediksi | Kunjungan Tinggi | Kunjungan Normal | Kunjungan Rendah |
|---|---|---|---|
| Kunjungan Tinggi | 0 | 0 | 0 |
| Kunjungan Normal | 0 | 3 | 1 |
| Kunjungan Rendah | 0 | 0 | 6 |
| Aktual/Prediksi | Kunjungan Tinggi | Kunjungan Normal | Kunjungan Rendah |
|---|---|---|---|
| Kunjungan Tinggi | 0 | 0 | 0 |
| Kunjungan Normal | 0 | 4 | 0 |
| Kunjungan Rendah | 0 | 1 | 5 |
| Metrik | Nilai |
|---|---|
| Presisi (Kunjungan Tinggi) | 0.0000 |
| Presisi (Kunjungan Normal) | 1.0000 |
| Presisi (Kunjungan Rendah) | 0.8571 |
| Recall (Kunjungan Tinggi) | 0.0000 |
| Recall (Kunjungan Normal) | 0.7500 |
| Recall (Kunjungan Rendah) | 1.0000 |
| Akurasi | 0.9000 |
| Metrik | Nilai |
|---|---|
| Presisi (Kunjungan Tinggi) | 0.0000 |
| Presisi (Kunjungan Normal) | 0.8000 |
| Presisi (Kunjungan Rendah) | 1.0000 |
| Recall (Kunjungan Tinggi) | 0.0000 |
| Recall (Kunjungan Normal) | 1.0000 |
| Recall (Kunjungan Rendah) | 0.8333 |
| Akurasi | 0.9000 |
Perbandingan akurasi akhir:
Kesimpulan Akhir: Algoritma K-Nearest Neighbor (KNN) menunjukkan akurasi lebih tinggi dan direkomendasikan sebagai model terbaik untuk penelitian ini.
Halaman ini mendemonstrasikan perhitungan langkah demi langkah untuk data uji pertama dalam testing set.
| No. Asli Data | 21 |
|---|---|
| Destinasi | Keraton Kacirebonan |
| Bulan | September |
| Klasifikasi Aktual | Kunjungan Rendah |
| Nilai Fitur Ternormalisasi | |
| Norm Jumlah Wisatawan Umum | 0.006049 |
| Norm Jumlah Wisatawan Pelajar Mahasiswa | 0.292778 |
| Norm Jumlah Wisatawan Asing | 0.044776 |
| Norm Rata Rata Lama Kunjungan | 0.409091 |
Jarak dihitung dari data uji ke setiap 38 data di dalam training set.
| No. Data Latih | Kelas | Hasil Jarak Euclidean |
|---|---|---|
| Data No. 15 | Kunjungan Rendah | 0.008510 |
| Data No. 14 | Kunjungan Rendah | 0.008851 |
| Data No. 25 | Kunjungan Rendah | 0.217009 |
| Data No. 32 | Kunjungan Rendah | 0.304046 |
| Data No. 36 | Kunjungan Rendah | 0.306702 |
| Data No. 34 | Kunjungan Rendah | 0.316945 |
| Data No. 26 | Kunjungan Rendah | 0.317074 |
| Data No. 30 | Kunjungan Rendah | 0.317267 |
| Data No. 29 | Kunjungan Rendah | 0.318128 |
| Data No. 33 | Kunjungan Rendah | 0.318874 |
| Data No. 27 | Kunjungan Rendah | 0.325916 |
| Data No. 35 | Kunjungan Rendah | 0.327488 |
| Data No. 23 | Kunjungan Rendah | 0.347516 |
| Data No. 18 | Kunjungan Rendah | 0.361319 |
| Data No. 22 | Kunjungan Rendah | 0.366530 |
| Data No. 17 | Kunjungan Rendah | 0.374068 |
| Data No. 13 | Kunjungan Rendah | 0.376806 |
| Data No. 20 | Kunjungan Rendah | 0.398878 |
| Data No. 40 | Kunjungan Rendah | 0.400890 |
| Data No. 48 | Kunjungan Rendah | 0.415797 |
| Data No. 43 | Kunjungan Rendah | 0.416408 |
| Data No. 19 | Kunjungan Rendah | 0.457861 |
| Data No. 24 | Kunjungan Rendah | 0.465885 |
| Data No. 44 | Kunjungan Rendah | 0.468237 |
| Data No. 37 | Kunjungan Rendah | 0.484858 |
| Data No. 38 | Kunjungan Rendah | 0.504021 |
| Data No. 39 | Kunjungan Rendah | 0.504549 |
| Data No. 42 | Kunjungan Rendah | 0.504610 |
| Data No. 45 | Kunjungan Rendah | 0.504625 |
| Data No. 47 | Kunjungan Rendah | 0.505063 |
| Data No. 6 | Kunjungan Normal | 0.819344 |
| Data No. 10 | Kunjungan Normal | 0.821271 |
| Data No. 8 | Kunjungan Normal | 0.882459 |
| Data No. 9 | Kunjungan Normal | 1.007624 |
| Data No. 12 | Kunjungan Normal | 1.154024 |
| Data No. 4 | Kunjungan Normal | 1.184306 |
| Data No. 2 | Kunjungan Tinggi | 1.283207 |
| Data No. 11 | Kunjungan Normal | 1.327552 |
Tiga data terdekat (K=3) diambil untuk voting:
Kelas dengan suara terbanyak adalah 'Kunjungan Rendah'. Maka, hasil prediksi KNN adalah Kunjungan Rendah.
Model menggunakan nilai Mean (μ) dan Deviasi Standar (σ) dari data latih.
| Kelas | Fitur | Mean (μ) | Deviasi Standar (σ) |
|---|---|---|---|
| Kunjungan Rendah | jumlah_wisatawan_umum | 0.104173 | 0.109620 |
| jumlah_wisatawan_pelajar_mahasiswa | 0.032187 | 0.075191 | |
| jumlah_wisatawan_asing | 0.028607 | 0.028675 | |
| rata_rata_lama_kunjungan | 0.269697 | 0.184418 | |
| Kunjungan Normal | jumlah_wisatawan_umum | 0.574519 | 0.353961 |
| jumlah_wisatawan_pelajar_mahasiswa | 0.360757 | 0.343641 | |
| jumlah_wisatawan_asing | 0.549041 | 0.287672 | |
| rata_rata_lama_kunjungan | 0.883117 | 0.073561 | |
| Kunjungan Tinggi | jumlah_wisatawan_umum | 1.000000 | 0.000000 |
| jumlah_wisatawan_pelajar_mahasiswa | 0.263799 | 0.000000 | |
| jumlah_wisatawan_asing | 0.731343 | 0.000000 | |
| rata_rata_lama_kunjungan | 0.840909 | 0.000000 |
Probabilitas setiap fitur dari data uji dihitung menggunakan Gaussian PDF untuk setiap kelas.
| Fitur | P(Fitur | Kunjungan Tinggi) | P(Fitur | Kunjungan Normal) | P(Fitur | Kunjungan Rendah) |
|---|---|---|---|
| Jumlah Wisatawan Umum | 0.000000 | 0.310359 | 2.437983 |
| Jumlah Wisatawan Pelajar Mahasiswa | 0.000000 | 1.138434 | 0.013078 |
| Jumlah Wisatawan Asing | 0.000000 | 0.298389 | 11.867625 |
| Rata Rata Lama Kunjungan | 0.000000 | 0.000000 | 1.625718 |
Probabilitas akhir dihitung dengan menggabungkan probabilitas prior (frekuensi kelas) dan semua likelihood menggunakan logaritma:
Log(Posterior) = Log(P(Kelas)) + ΣLog(P(Fitur | Kelas))
Kelas dengan nilai Log-Posterior tertinggi adalah 'Kunjungan Rendah'. Maka, hasil prediksi Naive Bayes adalah Kunjungan Rendah.
Jurnal INTEK (Informatika dan Teknologi Informasi)
eISSN: 2620-4924
Article Info
Kata kunci:
Klasifikasi;
K-Nearest Neighbor;
Naive Bayes;
Data Mining;
Pariwisata Cirebon;
ABSTRACT
Keraton Cirebon, sebagai destinasi wisata budaya utama, menghasilkan data kunjungan dalam volume besar yang belum dimanfaatkan secara optimal untuk pengambilan keputusan strategis. Penelitian ini bertujuan untuk membandingkan performa dua algoritma machine learning, K-Nearest Neighbor (KNN) dan Gaussian Naive Bayes, dalam mengklasifikasikan tingkat kunjungan wisatawan menjadi kategori 'Tinggi', 'Normal', dan 'Rendah'. Dataset yang digunakan adalah data kunjungan bulanan tahun 2024 dari empat keraton di Cirebon. Metode penelitian meliputi pra-pemrosesan data dengan normalisasi Min-Max, pembagian data 80:20 untuk latih dan uji, serta evaluasi model menggunakan metrik akurasi, presisi, dan recall. Hasil pengujian menunjukkan bahwa algoritma K-Nearest Neighbor (dengan K=3) mencapai akurasi sebesar 90.00%, mengungguli Gaussian Naive Bayes yang mencapai akurasi 90.00%. Keunggulan KNN dalam menangani hubungan data non-linear menjadikannya model yang lebih andal untuk memprediksi pola kunjungan. Hasil klasifikasi ini dapat menjadi dasar bagi pengelola keraton untuk merancang strategi pemasaran yang lebih efektif dan berbasis data.
Corresponding Author:
Abdan Maulana, email: abdan.maulana@student.cic.ac.id
Cirebon merupakan kota dengan warisan sejarah dan budaya yang kaya, tercermin dari keberadaan empat keraton utamanya: Kasepuhan, Kanoman, Kacirebonan, dan Kaprabonan. Destinasi-destinasi ini menjadi magnet bagi wisatawan domestik maupun mancanegara. Fluktuasi jumlah pengunjung merupakan tantangan manajerial yang signifikan, dipengaruhi oleh faktor-faktor seperti musim liburan, acara budaya, dan tren pariwisata. Pengelola destinasi seringkali kesulitan dalam merumuskan strategi operasional dan pemasaran yang adaptif karena kurangnya pemahaman mendalam terhadap pola kunjungan. Pemanfaatan data historis kunjungan melalui pendekatan *data mining* menawarkan solusi untuk mengekstrak wawasan berharga dan mendukung pengambilan keputusan berbasis bukti.
Penelitian ini bertujuan untuk menerapkan dan membandingkan dua algoritma klasifikasi populer, yaitu K-Nearest Neighbor (KNN) dan Gaussian Naive Bayes, untuk memodelkan tingkat kunjungan wisatawan. Dengan mengklasifikasikan periode kunjungan ke dalam kategori 'Kunjungan Tinggi', 'Kunjungan Normal', dan 'Kunjungan Rendah', model ini dapat menjadi alat bantu strategis. Misalnya, pengelola dapat mengidentifikasi periode 'Kunjungan Rendah' untuk meluncurkan promosi atau acara khusus, serta mengoptimalkan alokasi sumber daya pada periode 'Kunjungan Tinggi'. Penelitian ini akan mengevaluasi akurasi kedua algoritma untuk menentukan model yang paling efektif untuk dataset pariwisata Keraton Cirebon.
Penelitian ini menggunakan pendekatan kuantitatif dengan metode eksperimental untuk membandingkan kinerja dua algoritma klasifikasi. Objek penelitian adalah dataset kunjungan wisatawan di empat Keraton Cirebon selama tahun 2024, yang terdiri dari 48 record data. Lokasi penelitian mencakup empat keraton di Kota Cirebon, Jawa Barat, Indonesia.
Prosedur penelitian dibagi menjadi beberapa tahap utama. Pertama, pengumpulan data kunjungan bulanan yang mencakup jumlah wisatawan umum, pelajar/mahasiswa, asing, dan rata-rata lama kunjungan. Kedua, tahap pra-pemrosesan data, di mana fitur-fitur numerik dinormalisasi menggunakan metode Min-Max Scaling untuk menyamakan rentang nilai antara 0 dan 1. Pada tahap ini juga, kelas target ('Kunjungan Tinggi', 'Normal', 'Rendah') ditentukan berdasarkan rata-rata nilai ternormalisasi. Ketiga, dataset dibagi secara acak menjadi 80% data latih (38 record) dan 20% data uji (10 record). Keempat, implementasi dan pelatihan model KNN (dengan K=3) dan Gaussian Naive Bayes menggunakan data latih. Kelima, pengujian kedua model pada data uji untuk menghasilkan prediksi. Terakhir, kinerja kedua model dievaluasi dan dibandingkan menggunakan metrik *Confusion Matrix*, Akurasi, Presisi, dan *Recall* untuk menentukan algoritma yang paling unggul.
Setelah model dilatih menggunakan 38 data latih, pengujian dilakukan pada 10 data uji. Prediksi dari kedua model dibandingkan dengan kelas aktual untuk mengevaluasi kinerjanya. Hasil prediksi menunjukkan kemampuan masing-masing algoritma dalam mengenali pola dari data kunjungan.
Evaluasi kuantitatif dilakukan menggunakan *confusion matrix* yang merangkum hasil prediksi benar dan salah. Dari matriks tersebut, dihitung metrik akurasi, presisi, dan recall. Hasil evaluasi menunjukkan bahwa model K-Nearest Neighbor (KNN) mencapai akurasi keseluruhan sebesar 90.00%. Sementara itu, model Gaussian Naive Bayes mencapai akurasi sebesar 90.00%.
| Model | Metrik | Kelas: Tinggi | Kelas: Normal | Kelas: Rendah |
|---|---|---|---|---|
| KNN | Presisi | 0.00 | 1.00 | 0.86 |
| Recall | 0.00 | 0.75 | 1.00 | |
| Naive Bayes | Presisi | 0.00 | 0.80 | 1.00 |
| Recall | 0.00 | 1.00 | 0.83 |
Pembahasan hasil menunjukkan bahwa KNN lebih unggul dalam konteks dataset ini. Sifat KNN sebagai algoritma *non-parametric* dan *lazy learning* memungkinkannya lebih fleksibel terhadap distribusi data yang kompleks tanpa membuat asumsi yang kuat. Sebaliknya, performa Naive Bayes yang sedikit lebih rendah kemungkinan dipengaruhi oleh asumsi independensi antar fitur, yang mungkin tidak sepenuhnya valid pada data pariwisata di mana jumlah wisatawan umum, pelajar, dan asing bisa saling berkorelasi.
Penelitian ini berhasil membandingkan kinerja algoritma K-Nearest Neighbor dan Gaussian Naive Bayes untuk klasifikasi tingkat kunjungan wisatawan di Keraton Cirebon. Berdasarkan hasil evaluasi, disimpulkan bahwa algoritma K-Nearest Neighbor (KNN) memiliki performa yang lebih superior dengan tingkat akurasi 90.00%. Model KNN terbukti lebih andal dalam memetakan pola kunjungan ke dalam kategori Tinggi, Normal, dan Rendah. Oleh karena itu, model ini dapat diimplementasikan sebagai alat bantu pengambilan keputusan yang efektif bagi pengelola Keraton Cirebon untuk merumuskan strategi pemasaran dan operasional yang lebih cerdas dan berbasis data.
Abdan Maulana, abdan.maulana@student.cic.ac.id, adalah seorang mahasiswa tingkat akhir pada program studi Teknik Informatika di Universitas Catur Insan Cendekia. Ia memiliki minat riset yang mendalam pada bidang *Data Science*, *Machine Learning*, dan penerapannya dalam penyelesaian masalah di berbagai industri, termasuk pariwisata dan manajemen bisnis.